AI活用におけるデータ分析の基礎知識の重要性と、データ分析試験受験のすすめ

こんにちは、Pythonエンジニア育成推進協会 顧問理事の寺田です。私は試験の問題策定とコミュニティ連携を行う立場です。

最近はAIを活用することで、データ分析はある一定のレベル感までの答えを得ることができるようになっています。

ちょうど私自身、データ分析の重要性を改めて感じることがありましたので、今回はAIとデータ分析についてお話したいと思います。

■AIに頼ったデータ分析の問題点

何かしらのデータさえあれば、AIがそれなりの結果を返してくれる時代です。ただ問題点が2つほどあります。

ひとつは、AIが出した答えが本当に正しいのかというのが分からないという点です。

間違った回答を、何もせずそのまま何かの指標に使ってしまえば怖い結果になる可能性があるため、本当に正確なものなのかはもう一度調べる必要があります。これがAIを使ったデータ分析において一番怖いことだと思います。

もうひとつは、AIなどの様々なツールやサービスが開発されていく中で、その中身がブラックボックスになっているという点です。ブラックボックスとなってしまったものを、自分たちの手元や知識にどこまで入れていけるのかということを考えていった方が良いように感じています。

では次に、これらの懸念に対して、私が最近行っているアプローチをお話したいと思います。

■AIが出したデータ分析結果の正否を確かめるには

データ分析をAIにさせる場合、それと同時にコードも書かせています。

コードは何度実行しても同じ結果を出すはずのものです。このコードを私自身が中間アウトプットを含めて確認しながら進めることで、AIが出したデータ分析の結果が正しいものかどうかを判断することができます。

また、何度も繰り返して行う必要があるデータ分析であれば、コード化しておけば、何度でも再現性をもって試すこともできます。

もちろん、これを可能とするためにはコードが読める必要があります。

ですが、これができれば、中間地点のデータ構造を把握することができますし、確認すべきデータを明確にし、品質の担保につなげることができるようになります。また、情報を間違って捉えていないということも証明することもできます。

■データ分析の基礎知識が重要

AIを使ったデータ分析はとても便利ですが、結果が正しいものか判断する必要があります。それをできるようにするには、データ分析の基礎がとても重要なポイントになってきます。それができなければ、AIの言うなりか、誰かが言った通りにやるしかなくなるでしょう。

もし、データ分析の基礎知識を身に付け、自分自身が把握し、できるようになっていれば、AIが出した結果を見たときに、持っている知識を引き出し、正しい方向へ持っていくことができます。

私自身もよくAIを使ったコーディングを行いますが、その中で、たまにAIが誤った回答を出すことがあります。それを指摘すると、AIは絶対にそんなことはないと否定してくることがありますが、それでも抜けている観点を指摘し続けると、最終的にAIがその誤りを認めるということがあります。

このように、AIが間違ったコードや結果を出してきたとしても、基礎を知っておくことで、”あのツールの仕組みならばこうなっていなければいけない”というような情報を自分の頭の中で展開できるようになります。そうしたことができるようになれば、AIに対して、誤りを指摘して一緒に修正していける世界を作ることができます。

2026年5月の時点でAIの性能面としてはこういった状況ですので、AIに立ち向かえるだけの技量は自分たちも持っておく必要があります。正しさの担保は人間がするしかありません。そう考えれば、データ分析の基礎を学んでおくことの重要性がわかるかと思います。

さらに言えば、AIが出した回答の正否の判断や、分析方法、確認方法を可視化する方法についても基礎知識があれば、データの特性にあった方法、分散を確認して正規化すべきかどうかというのが見えてきます。また、AIからデータ分析の方法を提案されたとしても、基礎を知っていれば、自分でどの方法を選択するのがいいのかを決めることもできます。

■データ分析試験のすすめ

当協会のPython 3 エンジニア認定データ分析試験は、データ分析の基礎知識が身についているかを確認するものになります。曲がりなりにもデータ分析に携わっていくのであればこちらの試験は少なくともクリアしておいた方が良いかと思います。

試験では、NumPyやpandas、Matplotlibの結構細かい使い方を覚えておく必要があります。これらの細かな知識は、AIに頼ればすぐに得られるようなものではありますが、そうした知識を自分の頭の中に入れて試験に挑まなければなりません。

また、データ分析において、重要な言葉の定義を問う問題とかも入っています。例えば、3章の数学では、線形代数のところでノルムや内積といった高校数学レベルの問題が含まれています。忘れてしまっている方も多いと思いますので、この辺りは改めて見直しが必要かと思います。ここは重要な概念でもありますので、もし理解できなかったのであれば他の書籍を見るなりしてより理解を深めていくことが大切になります。

後半ではscikit-learnを使った機械学習も取り上げられています。scikit-learn自体が優秀なツールですので、scikit-learnができる基本的なことは押さえておきましょう。例えば、前処理や、各種ツールでの機械学習、回帰分析、次元削減といったものは、データ分析を行う上で非常に基礎的な技術です。確実に押さえ、使える状態になっておくことはデータ分析をする上で大事なポイントです。

このように、当協会のデータ分析試験の主教材には、データ分析をする上で知っておいてほしい基本的な知識が詰め込まれています。それは主教材を作る時に、データサイエンティストやデータエンジニアとして活躍するための最低限必要な知識は何かということを有識者が集まってたくさんディスカッションした結果です。データ分析をする上での重要なポイントがしっかり入っていると同時に、難易度もちょうどいい具合になっているはずです。ぜひ手に取って学んで貰い、試験で定着度を確認していただければと思います。

■さいごに

今はデータを集めようと思えば簡単に大量のデータを集められるくらい、世の中にあふれている時代です。

そうした時代の中で、命題や目標を達成するために、データ分析を使って何かしらの答えを出していくことは比較的容易にできるようになりました。

もちろん、Excelなどの表計算ソフトでできるものも確かに数多くありますが、大量のデータでは表計算ソフトでは間に合いませんし、繰り返し作業が必要なものに関しては手間がかかり難しくなってきています。

だからこそ、データ分析の基礎を学んでおくことで、再現性のあるデータ分析、またはデータの可視化を最適に行うための方法を見つけられるようになるはずです。

最近は特にデータを使った様々な取組みが行われています。今までチャレンジしにくかった人もいるかもしれませんが、今はAIやいろいろなツールを使って容易にデータ分析ができる時代です。

目標や命題に立ち向かうためにも、AIの答えに頼り切るのではなく、自分自身でデータの集め方や使い方を考えられるようになりましょう。そうしていくことで、新しい発想や指標も見えてくるのではないかと思っています。

PAGE TOP