その他
GPT-4はエクセルを超越できるか?500行のダミーデータで検証してみました。

GPT-4はエクセルを超越できるか?500行のダミーデータで検証してみました。

著者: ハンズバリュー株式会社 代表取締役 島田慶資
経営コンサルタント・作家
長岡技術科学大学 大学院 経営情報システム工学修士
経済産業省推進資格 ITコーディネータ
個人情報保護士


キーワード: AI, データ解析, ビジネス, データ利活用, GPT-4, エクセル, 自動化

リード: AIの進化によりデータ解析の自動化は可能になるのか?実際のテストデータを使ってGPT-4とエクセルの力を試してみました。


こんにちは、日曜日コンサルティングの島田です。

今回は、AIとデータ解析について考えてみます。

個人情報テストデータジェネレーター(https://testdata.userlocal.jp/)を用いて、500行のダミーデータを作成しました。このデータをチャットGPT(人工知能)に提供し、正しい統計解析の回答が得られるかどうか実験してみます。(ダミーデータはこちらから

チャットGPTの試験用のダミーデータ
出力したダミーデータ。右端に統計処理した数値を入れています。この値をチャットGPTに生成させたい!

この試験が成功すれば、エクセルで作業する際の関数ミスのチェックを自動化できる可能性があるのです。それは業務効率化、そしてケアレスミスの減少に繋がります。

試験を始めるために、プロンプト(問い)「次のデータの平均値を出力してください。」という問いをAIに投げかけてみました。ちなみに、正解は「平均値 48.97」です。

驚くべきことに、チャットGPT-4はPythonのコードを返してきました。これは計算を行うコードなのですが、私たちが求めていた直接的な回答ではありません。

チャットGPTが生成したPythonのコード。狙っていた回答ではない。
チャットGPTの結論。そりゃそうやろ!

次に、同じ問いをエッジのコパイロット(同じくGPT-4モデルを搭載したAI)にも投げてみました。こちらはエクセルでの計算を推奨してくれましたが、残念ながらその回答は間違っていました。
中央値についても確認しましたが、同じく間違っていました。

念の為、チャットGPT4が搭載されているであろうエッジのコパイロットにも確認してみました。
平均値は48.97、中央値は48.00のため惜しいが間違えている。

更に、前のバージョンであるGPT-3.5でも試してみましたが、やはり誤った解答が返ってきました。

チャットGPT3.5の回答。計算はしているように見えるが不正解。データ数も誤り。500個だよ。

合計値、データ数、平均値全て大きく間違えているので、まだチャットGPT4がマシのような状況でした。

これらの試験から、私たちが一つの結論を導き出しました。それは、現状のAIにはエクセルのようにデータを直接提供し、結果を即座に出力する能力はまだ充分に備わっていないということです。

しかし、それは”現状”の話です。

チャットGPTにはプラグインという追加機能が存在します。
今後、そういった追加機能を用いてこの問題が改善される可能性もあります。

私は、AIの持つ可能性を信じています。

そしてその可能性を最大限に引き出すための挑戦をこれからも続けていきます。
一緒にその未来を期待しましょう。


© 2023 ハンズバリュー株式会社 代表取締役 島田慶資 All rights reserved.