以前、こちらのコラムで富士ソフトの「AIインテグレーションサービス」についてご紹介しましたが、最近、AIに関するお問い合わせをいただくことが増えてきました。AIへの期待は、日々高まっていると感じています。
そのような中で、お客様がAIを導入するまでのハードルとして、「AIで実際に何をすべきか分からない」、「AIの導入に対して予算が下りない」といった問題が表面化しやすいのが実情です。しかし、実はこれらを乗り越えたとしても、すぐにAIに取り組むことはできません。なぜなら、AIに必要な統計的な処理を行うための「データが揃っていない」という落とし穴があるからです。
そこで今回は、AIに必要なデータを揃える際によくある落とし穴をご紹介します。
落とし穴1 「必要なデータを必要なタイミングで手に入れられない」
「データが揃っていない…」といっても、多くの企業ではデータは持っているはずです。問題は、そのデータを使おうとした際、必要なデータを必要なタイミングで手に入れられるとは限らないことです。
例えば、データが複数のシステムに分散して保存されているケース。いざデータを使いたいと思っても、情報システム部門に依頼して複数のテーブルを結合しなければならないといったように、データを揃えるために膨大な作業が必要になる場合があります。これではデータを用意することすらままなりません。
落とし穴2 「得られたデータが正しいかを判断できない」
「データは揃っている」と思っていても、実はそのデータが正しくない場合もあります。数値が入っているはずの部分に数値以外のデータが格納されている、というような、明らかにおかしいと分かる場合もあります。
しかし問題は、ビッグデータの中に紛れ込んでしまう「例外値」です。例えば、同じ業務をAさんとBさんが分担し、ある事象に対してそれぞれが異なる判断をした場合、本来一致すべき判断が一致していない、これが例外値です。いくら優秀なAIを導入しても例外値があるとデータとして成立しなくなり、正しい結果は得られません。
実際には、担当者が例外値に気づくことは難しく、試しにデータを流してAIで処理できるかという結果を見て、初めて浮き彫りになることも多くあります。AIは人間のように忖度できません。存在しているデータをそのまま評価することしかできないのです。
落とし穴3 「教師データの作成者を用意できない」
AIの学習方法のひとつに「教師あり学習」という方法があります。入力用データを与えるだけでなく、正解である出力データも合わせて用意する、というものです。
例えば、医療の現場でCTスキャンした画像を見て病名を判断する状況を考えてみましょう。医師は1枚の画像だけを見て判断するわけではありません。複数枚の画像それぞれに対して、医師が判断したラベルを付ける必要があります。AIの世界では、このような作業をアノテーションとよびます。
AIの学習方法の場合、このアノテーション作業を誰が行うのかという問題が発生します。正解データを作成するためにはデータに関する知識を持っている人物が必要であり、この「教師データ」の準備が必要です。また、テスト用のデータがある程度用意できていて、AIの学習方法についても一生懸命考えられていたとしましょう。それでも、実際に多くのデータで試そうとすると時間やコストが追いつかないことも考えられます。
まずはAIを始めてみませんか?
このような落とし穴に気づいていないお客様はまだたくさんいらっしゃいます。十分なデータを用意しているつもりで、テーマを決め、予算を取り、いざプロジェクトを開始した際にデータの不備が判明すると、プロジェクトそのものが頓挫することになりかねません。
そこで当社ではお客様に対して「簡単なテーマでもよいので、AIを始めてみませんか?」という提案をしています。その意図は、とにかく、お客様にAIに興味を持っていただき、AIを知っていただきたいから。まずはプロジェクトチームを作って、仮のテーマを定め、お客様が持っているデータがAIに適しているかどうか検証していきます。あわせて、AI導入を進める際に、双方にとってどのような作業が必要になってくるか把握し、全体のプロセスを整理します。データを揃えて試すのは大変な作業ですが、大変だからこそまずは「体験」することに価値があります。
AIのプロジェクトを通して、お客さまに結果だけでなくプロセスを体験していただき、高いAIリテラシーを持っていただくこと。これこそがAIインテグレーターとしての富士ソフトの役割なのではないかと考えています。当社はAIインテグレーターとして、AIの導入プロセスをともに体験していただくことで課題解決のお手伝いをします。
ぜひ一緒に、AIを始めてみませんか?
富士ソフトのAIソリューションについて、詳しくはこちら
AIソリューション