LLM(大規模言語モデル)を活用していますか。
技術管理統括部 先端技術支援部の三塚です。最新技術の調査研究を中心に活動しています。
2年前、OpenAI社が発表した「GPT-3.5(Generative Pre-trained Transformer 3.5)」は当時、世間から華々しく注目を集めていました。自然言語の回答文の正確性と日本語に対応したLLM(大規模言語モデル)としてテレビやニュースで話題となり、多くの企業が「この技術はいける!」と感じたのではないでしょうか。業務の問い合わせやメールの下書き、熟練の知識を伴う指導等、自然言語で問いかけるとAIであるLLMが同じく自然言語で、期待した通りの回答で返してくれる。まさに万能の神のように思えたでしょう。
しかし、実際はどうでしょう。触ってみて、使ってみて、導入してみて、いかがだったでしょうか。
例えば、LLMに「昨夜のスポーツ試合の結果を知りたい」と質問してみると、誤った情報を含んだ回答が返ってきたり、どこかぎこちない文章だったりします。
LLMに指示を出し、自分の代わりに業務をしてもらえるような分身の役割を期待していた方は、少々肩透かしを食らったのではないでしょうか。
本コラムでは、生成AI、特にLLMに焦点を当て解説します。LLMを使用する上での考え方、自社データの活用方法、そして、業務にLLMを活用する「AIエージェント」「マルチエージェント」の技術について、当社がお薦めする「企業にLLMを導入する際の3ステップ」を通じてお伝えします 。なるべく難しい技術用語は使用せずに解説しますので、最後まで安心してご覧ください。
LLMを体験する
昨今、LLMに自社内のデータや専門知識を回答させるRAG(Retrieval-Augmented Generation)を組み合わせた導入をご希望されるお客様が増えております。当社では、お客様のニーズの実現にはRAGが必要な場合でも、LLMの導入が初めて、あるいはまだ利用したことがないお客様には、まずはRAGではなく、素のままのLLMを導入することをお勧めしています。
LLMもAIですから、必ずしも100%の回答を返すわけではありません。まずは見て、触って、体験してLLMがどういったものか感じること が大事です。
AIに、自分の分身になってもらうことを期待している方もいますが、実際には難しいでしょう。
では、LLMにどんな働きを期待すべきでしょうか。
LLMを「助手」や「副操縦士」、「新人」などに例えるのはいいですね。あくまでもLLMはAIなので、データを活用して予測を立てることしかできませんから、LLM の予測結果を元に人が判断をする「共創」関係が理想的です。この考えは画像分類や物体検知のAIが出力する予測を人が確認し判断して、業務に適用することと何ら変わりがありません。
個々のケースでのLLMとの付き合い方が分かってくると、組織の中でLLMの活用がどの業務に適しているのかを一人ひとりが考える「風土」が生まれてきます。これが「LLMを体験する」の狙いです。
・ 一人ひとりが、デジタルの力で業務を変えるアイディアを考える「風土」の醸成(DX化への一歩)
・ LLM(AI)への過度な期待はやめて 、現実的な付き合い方を見極める。「共創」
LLMが嘘をつく、「ハルシネーション(幻覚)問題」
冒頭で記載しましたが、LLMを利用してみると会話に違和感はありませんか?ちょっと専門的なことを聞くと、言葉巧みに嘘をつくことがありませんか?
この現象は、LLMで有名な「ハルシネーション(幻覚)問題」です。
AIであるLLMは、事前にある程度のデータを「学習」したものが出回っています。LLMは、正解率が低くても予測結果を返します。予測結果をLLM特有の自然文に組み込んで回答させるとどうなるでしょう。
筆者のことをLLMに質問してみると、1回目は「甲南大学の名誉教授でフランス文学者」、2回目は「日本の政治家」と回答がありました。
筆者 を知らない人は、筆者が「フランス文学者」と言われても信じてしまうかもしれません。誤った答えを本当のように回答してしまう。これが「ハルシネーション」です。
例えば、食品関連のウェブサイトの問い合わせに、LLMを使用したチャットボットを組み込むとどうなるでしょう。食品にアレルゲンの可能性のある成分が含まれているにも関わらず、ハルシネーションによって「含まれていない」と嘘の情報を回答してしまうと、思わぬ事故に繋がります。
では、ハルシネーションを回避する方法はあるでしょうか。その解決方法の一つが検索拡張生成、RAGと言われています。※1
自社のデータや専門知識を回答させるRAG
RAGとは、検索エンジンなどの外部リソースをLLMと組み合わせて、自社内のデータを検索して質問に対する回答を得る方法です。ハルシネーション(幻覚)を抑え、質問に適した回答を得ることができます。
ここでも「共創」の考え方が重要です。前述のとおり、LLMもAIですから100%の回答は得られない前提でお考えください。利用者の質問とLLMに渡す質問の間に意図通りの回答を得られる質問文を加える(プロンプトエンジニアリング)や、検索エンジンの検索結果の採択の仕方を工夫するなど、対応が必要です。
RAGを利用し自社内のデータを検索して正しく回答することで、食品にアレルゲンが含まれているのであれば、「含まれている」と正しく回答できます 。また、工場でRAGを活用すれば、熟練者のノウハウや知識を若手技術者に伝達することも可能となります。
ハルシネーションを回避する方法には、LLMに新たなデータを追加学習させる方法もあります。しかし、LLMが事前に学習するためには膨大なデータが必要であり、コストや導入期間を考えるとRAGを選択される企業が多いです。
LLMを利用した業務を実現する「AIエージェント」「マルチエージェント」
これまでLLMの利用用途は、「質問に対して、知識の回答を得る」こととされてきました。しかし、組織の業務はLLMやRAGのように知識を回答するだけで完結することはそれほど多くありません。
例えば、勤怠情報など外部システムからの必要な知識を得る。あるいは、メールを作成したら宛先を確認して送信する。というようなLLMが苦手とするタスクを何者かが実行してくれたら 、人がやらなくてもこれらの業務を達成できるのではないでしょうか。
これを実現してくれる技術が「AIエージェント」です。
※「LLMエージェント」、「エージェント」「エージェンティック」とも表現されますが、ここでは「AIエージェント」と表記します。
「AIエージェント」とは、利用者に代わって物事を遂行する「代理人」と捉えられます。
LLMで活用する「AIエージェント」は目的を定義し実行するAIエージェント、継続的な学習を実行するAIエージェントなどいくつか定義されています。本コラムでは、「代理人」を想定して、依頼された「LLMと連携してタスクを実行するAIエージェント」と、さらに今後着目されるであろう「マルチエージェント」についても説明します。
4.1.AIエージェント
「3. 自社のデータや専門知識を回答させるRAG」で記載したように、LLMやRAGは、事前に学習している自社データのナレッジを得るだけなので、実業務に活用できるところまではあと一歩届きません。必要に応じて外部から情報を収集することや、外部へ影響を与える行動をするなどタスクを実行してこそ一つの業務が完結します。
例として、会議予約業務を見てみましょう。
1) 複数の担当者の予定をカレンダーシステムからリアルタイムに閲覧する
2) 空き時間を見つける
3) カレンダーシステムに依頼して空き時間に会議を設定する
この業務を実行するには、LLMの知識やRAGによる検索だけでは解決できません。
言語モデルでは難しいこれらのタスクは、AIエージェントに依頼して業務を完成させます。
いかがでしょうか。自然言語の指示文を元にLLMが指示文を分解し、適切なタスクをAIエージェントが実施していくことで、会議予約業務が達成できます。
AIエージェントを使用すれば、DWH(Data Ware House)のデータにアクセスが必要な集計業務なども可能になりますね。
RPA(Robotic Process Automation) ※1が企業で幅広く導入されています。AIエージェントとRPAが異なる点は、AIエージェントは文章のような「不定形のインプット、タスク」に柔軟に対応できることです。自然言語での“不確からしさ”を吸収し対応するタスクを実行できるのが「AIエージェント」、「入力データの定まった定型業務」を実施するのはRPAと整理するとよいかもしれません。
まずは「LLM-Agent」を活用して業務を改善し、業務が定型化されたら、メンテナンスもしやすいRPAに移行する手法も有効かもしれませんね。
※1:RPA(Robotic Process Automation) とは、PC上で実施している定型業務を自動化するツールです。定型的なインプット情報、形式を元に定義した形式のアウトプットを得ることで業務を完成させます。
4.2.複数のAIエージェントを使いこなすマルチエージェント
AIエージェントが業務で利用され始めると、一般的な業務と同様に最適化されていきます。最適化された業務は、他の業務との組み合わせで大きな業務を達成することが可能です。
AIエージェントは、利用が加速していくにつれて、業務の最適化を目指すには、特定の業務を実施するAIエージェントを組み合わせることが重要になってきます。
会議予約業務を例にマルチエージェントを検討してみましょう。
例:会議予約業務と食事会の開催
1) 複数人の予定の空き時間を探し、カレンダーを設定する
2) 会議室を予約する
3) 食事会のお店を探し、予約サイトで食事会の予約をする
4) メールで開催案内をする
利用者がマルチエージェントに、「佐藤さんと田中さんと打ち合わせをしたい。メールの案内時に私の上長をCCに入れてほしい」と依頼すれば、LLMとマルチエージェントが「会議予約業務」と捉え以下のAIエージェントを組み合わせて業務を達成します。
① エージェントA:複数人の予定の空き時間を探し、カレンダーを設定する
② エージェントB:会議室を予約する
③ エージェントD:送信先を確定し、メールで開催案内をする
利用者がマルチエージェントに、「同僚の山田さんと川田さんと食事会をしたい」と依頼すれば、LLMとマルチエージェントが「仲の良い同僚との食事会」と捉え以下のAIエージェントを組み合わせて業務を達成します。
① エージェントA:複数人の予定の空き時間を探し、カレンダーを設定する
② エージェントC:食事会のお店を探し、予約サイトで食事会の予約をする
いかがでしょうか。マルチエージェントのメリットを理解いただけるかと思います。
メール送信エージェントは、日報報告業務や部門への周知メールを送る際にも上手く活用できそうですね。
LLMを連携にして、タスクを実施する「AIエージェント」、これら を組み合わせて更に多くの業務を実施する「マルチエージェント」。皆様の業務に使用してみたくないですか?
※技術的な実現方法としてはAutGenを組み合わせた実装方法等が挙げられますが、本稿では割愛します。
LLMは役に立っている?どうやって知ればいいの?効果測定の方法は?
昨今、多くのお客様からLLMの効果についてお問い合わせをいただきます。ポイントとなる効果測定について説明します。
当社は 調査研究で培ったAI技術を活用し、2017年からビジネスとして展開しています。AIは100%の精度を望めない、ある意味「発展途上」の技術です。お客様の中には「100%の精度が保証できないのであれば導入は難しい」という方もいらっしゃいます。しかし、AI導入の可否は「精度」で判断できるものではありません。100%の精度には満たないものの多大な効果が期待できるAIと、どう向き合い、どのように人と「共創」し、効果を最大限にするのか、業務を設計する必要があります。
一般的なシステム導入と同じですね。AIの精度ではなく、導入効果を「KPI」で図り、検証していくのです。
この考え方はLLMも同じです。適用前、適用後でどのように業務が変わったか、 KPIで測定すると良いと思います。
実際には、作業時間の削減をKPIとする企業さんが多いです。運用コストも検討される場合は、ROIで定義することも有効でしょう。
最後に
いかがだったでしょうか。
「LLMを体験する」「自社データの活用」から始まり、業務適用が可能な「AIエージェント」「マルチエージェント」を説明しました。少しでも、LLMの可能性、「AIエージェント」「マルチエージェント」の可能性を感じていただけたら幸いです。
技術的な解説や詳細を知りたい方は、ぜひ当社の相談窓口までお問い合わせください。「AIエージェント」、「マルチエージェント」だけでなく、少し変わったLLMの使用方法も含め技術的な解説が可能です。
富士ソフトでは、様々なAIの開発、AIを搭載するシステム開発を行っています。AIに関してお困りの際はぜひご相談ください。
生成AIという大きな視点でみると、LLMも画像生成モデル、動画生成モデルもまだ発展途上です。これからもっと我々の目を引き、業務に適用できる可能性がある技術だからこそ、AIやLLMと正しく付き合い、いち早く業務に適用していくことがポイントです。日本の産業を更に元気にしてまいりましょう。
AIソリューションはこちら
Azure OpenAI Service導入支援 powerd by ChatGPTはこちら
Microsoft 365 Copilot 向け導入支援サービスはこちら
Amazon Bedrock導入ソリューションはこちら