Gen AI Leader合格への道#4:ランドスケープ理解と実践的リソース管理
本記事は、2025年5月14日(米国時間)に一般提供が開始されたGoogle CloudのGenerative AI Leader認定資格を取得するために必要となる知識を紹介するシリーズです。本連載は以下の内容に分かれています。本連載の目的や試験概要については「Gen AI Leader合格への道#1:試験概要と学習ロードマップ」を参照してください。
- 1. はじめに:生成AIの真価を引き出す羅針盤
- 2. Gen AIの全体像を掴む:ランドスケープの構成要素
- 3. Gen AIエージェントとは? その役割と仕組み
- 4. Gen AIプロジェクトの土台となるプラットフォーム
-
5. Gen AIを支える基盤:インフラストラクチャ
・Gen AIに必要なコアコンピューティングリソース
・インフラストラクチャの構成要素(ハードウェア、ソフトウェア)
・「エッジAI」という考え方:処理をデータ発生源の近くで行う
・Googleが提供するエッジAI向けツール - 6. Gen AIプロジェクトを始める前に考えるべきこと
- 7. まとめ :生成AI活用の羅針盤
1. はじめに:生成AIの真価を引き出す羅針盤
生成AIは、私たちの働き方やビジネスのあり方を根本から変革する可能性を秘めています。その真価を最大限に引き出し、成功するソリューションを構築するためには、単にアプリケーションを導入するだけでなく、その基盤となる仕組みや全体のランドスケープ(Gen AI landscape)を理解することが必要です。
本記事では、まず「Gen AIの全体像」を掴み、その構成要素を解説します。次に、「Gen AIエージェント」の役割と仕組み、そしてプロジェクトの土台となる「プラットフォーム」と、それを支える「インフラストラクチャ」について掘り下げていきます。最後に、プロジェクト開始前に考慮すべき「必要な要素」と「利用可能なリソース」を整理します。
2. Gen AIの全体像を掴む:ランドスケープの構成要素
生成AIは単一の技術ではなく、相互に連結された複数の層(layers)で構成される強力なテクノロジーです。それぞれの層が重要な役割を担っており、基盤となるインフラストラクチャからユーザーが利用するアプリケーションまでを深く理解することで、生成AIがどのように機能するのかを包括的に把握できます。
生成AIは、主に以下の5つの層で構成されています。
・Gen AIを構成する5つの構成要素(Building Blocks)
-
・生成AI搭載アプリケーション(Gen-AI-powered applications)
ユーザーが直接利用するフロントエンドで、インターフェースを通じてAI機能を提供します。エージェントは、ユーザーが望む結果に到達できるよう、AIが動作する構造やコンテキストを提供し、具体的なタスクを定義します -
・エージェント(Agents)
目標達成のため自律的に動作する(autonomously operates to achieve a goal)ソフトウェアです。アプリケーション内の「インテリジェントな要素」として、複数のツールを使いこなし、多段階の複雑なタスクを処理します。推論ループとツールが特徴で、モデルの能力を活用し、テキスト生成以上の結果を生み出します -
・プラットフォーム(Platform)
モデルとエージェントをつなぐ中間層で、開発ツールやインフラを提供します。AIモデルの構築とデプロイを支援し、必要な要素を簡単かつスケーラブルに統合します。Google CloudのVertex AIなどがこの役割を果たします -
・モデル(Model)
AIシステムの「脳」が宿る場所です。膨大なデータで訓練された数学的構造(アルゴリズム)で構成され、データから学習し、予測や新しいコンテンツ生成を行います。GeminiのようなLLMや画像生成モデルなどが含まれ、既存モデルの活用やカスタム開発も可能です -
・インフラストラクチャ(Infrastructure)
あらゆるAIシステムの基盤となる層です。AIモデルの訓練、デプロイ、スケールに必要なコンピューティング能力、ストレージ、接続性を提供します。GPUやTPUなどのハードウェアと、OSやネットワーキングなどのソフトウェアで構成され、膨大なデータと複雑な計算を処理します
これらの各層は、基盤となるコンピューティング能力からユーザー向けのツールに至るまで、生成AIの機能を実現する上で極めて重要な役割を果たしています。これらの層間の相互作用を把握することで、情報に基づいた意思決定を行い、イノベーションを促進し、ビジネスのために生成AIの変革の可能性を解き放つ準備が整います。

Gen AI landscapeイメージ図
3. Gen AIエージェントとは? その役割と仕組み
続いて、Gen AIエージェントがランドスケープの中でどのような存在で、どのような役割を果たし、そしてどのように動作するのかを深く掘り下げていきます。エージェントを理解することは、生成AIの真の能力を引き出し、より複雑な課題を解決するソリューションを構築する上で不可欠です。
・目標達成を目指すGen AIアプリケーション
Gen AIエージェントとは、「目標達成のため自律的に動作し、複数のツールを使いこなし多段階のタスクを処理するソフトウェア」です。これは、より大きな生成AI搭載アプリケーションの中に存在する、インテリジェントな要素だと考えられます。アプリケーション層がユーザーインターフェースや全体目標といった「構造とコンテキスト」を提供するのに対し、エージェントはその中で「ドライバーのように意思決定(decision-making)を行い、行動を起こす」役割を担います。エージェントは自然言語を理解して応答し、情報収集、意思決定、行動実行といった多段階のプロセスを処理することで、複雑な問題解決やワークフロー管理を実現します。これは、エージェントの主要な構成要素である「推論ループ」と「ツール」が連携することによって可能になります
・エージェントの主要構成要素
では、AIエージェントはどのようにして目標を達成し、自律的な行動を可能にしているのでしょうか?その動作原理は、主に以下の3つの要素の組み合わせにあります
-
・基盤モデル(Foundation Model)
膨大なデータで訓練された、AIの「脳」となる汎用モデル。理解、推論、生成能力の基盤となり、LLMなどが代表例 -
・推論ループ(Reasoning loop)
エージェントの「思考プロセス」。観察・解釈・計画・行動を繰り返し、目標達成まで自律的に意思決定し、行動を適応させるサイクル -
・ツール(Tools)
エージェントが現実世界と相互作用するための外部機能。API連携、データアクセス、特定タスク実行など、具体的な行動を可能にする
それぞれの要素の詳細は「Gen AI Leader合格への道#6:AIエージェントの基本とGoogle Cloudでの開発基盤」にてご紹介します
4. Gen AIプロジェクトの土台となるプラットフォーム
生成AIソリューションをビジネスに導入する上で、その基盤となる仕組みの理解は非常に重要です。生成AIは、それぞれが重要な役割を担う相互に連結された層で構成されるテクノロジーです。中でもプラットフォーム層は、これらの層の中核をなす中間層として、モデルとエージェントをつなぎ、開発ツールや必要なインフラストラクチャを提供します。
・プラットフォームが提供するもの(構築とスケール)
プラットフォーム層は、AIイニシアティブを構築し、スケールさせるための堅牢な基盤を提供します。この層は、機械学習ソリューションの開発、デプロイ、および管理に必要なインフラストラクチャ、事前学習済みモデル、各種ツールを統合し、複雑なMLワークフローを効率化します。プラットフォームは、必要な要素を簡単かつスケーラブルにまとめ上げることで、AI開発と運用に大きな違いをもたらします。
・Google CloudのVertex AIとは
Google Cloudが提供するVertex AIは、統合された機械学習(ML)プラットフォームです。MLワークフロー全体を効率的に進めるために設計されており、MLおよび生成AIソリューションの構築、デプロイ、管理に必要なインフラストラクチャ、ツール、事前学習済みモデルを包括的に提供します。
Vertex AIは、その柔軟性(Open and Flexible)が特徴で、オープンフレームワークをサポートし、ベンダーロックイン無しに好みのツールやモデルを使用できます。また、モデルの開発、デプロイ、管理を容易にする包括的なツール(Comprehensive Tooling)、カスタマイズのための統合開発環境(IDE)、そして豊富なAPIとSDKによる容易な連携(Easy Integration)など、多岐にわたる機能を提供します
Vertex AIとは、MLと生成AIを統合するクラウドプラットフォームです
➤ MLワークフローを効率化する統合プラットフォーム
Vertex AIは、データ前処理からモデルのデプロイまで、MLワークフローを自動化するための強力なツールを提供します。例えば、Vertex AI Pipelinesはワークフローの自動化を支援します。さらに、MLOps(機械学習オペレーション)ツールが組み込まれており、モデルのトレーニング、デプロイ、管理を効率的に行えます。モデルレジストリによるバージョン管理や変更履歴の追跡、モデル評価、モデルモニタリングといった機能は、MLプロジェクトのライフサイクル全体を効果的に管理することを目的としています。
➤ プロジェクトでのモデル活用の選択肢
Vertex AIプラットフォームでは、AIモデルの活用方法について複数の選択肢が提供されています
-
・既存モデルの活用(Model Garden)
多くのユースケースにおいて、組織が新しいモデルをゼロから開発する必要はありません。Vertex AIのModel Gardenは、GoogleおよびGoogleパートナーが提供する既存のモデルを検索、カスタマイズ、デプロイできるサービスです。Googleモデル、サードパーティモデル、オープンソースモデルなど、多様な事前学習済みモデルが提供されており、これらを独自のデータでカスタマイズしたり、チューニングなしでそのまま使用したりすることが可能です -
・カスタムモデルの構築・学習(Model Builder: フルカスタム or AutoML)
特定のニーズに合わせて独自のモデルを構築したい場合は、Vertex AIでモデルをトレーニングして使用するためのオプションが2つあります。一つは、任意のMLフレームワーク(PyTorch, TensorFlowなど)を使用してモデルを大規模に作成およびトレーニングする完全にカスタムな方法です。もう一つはAutoMLを使用する方法で、画像データ、動画データ、テキストデータ、表形式データに対して、分類、物体検出、行動認識、回帰、予測などの様々な種類のモデルを、より手軽に構築できます
5. Gen AIを支える基盤:インフラストラクチャ
さて、エージェントや基盤モデルといった知的な要素も、それを動かす強固な基盤がなければその能力を最大限に発揮できません。この基盤こそが「インフラストラクチャ層」です。
このセクションでは、生成AIソリューションを支える基盤としてのインフラストラクチャの役割、その構成要素、そして処理をデータ発生源の近くで行う「エッジAI」という考え方、さらにGoogleが提供するエッジAI向けツールについて詳しく見ていきます
・Gen AIに必要なコアコンピューティングリソース
生成AIの驚異的な可能性は、その背後にある強力なコンピューティング能力によって実現されています。インフラストラクチャ層は、あらゆるAIシステムが構築される基盤であり、AIモデルのトレーニング、デプロイ、およびスケーリングに必要な計算能力、ストレージ、およびネットワーク機能を提供します。現代のAIは、特に大規模言語モデルや生成AIの台頭に伴い、膨大なデータセットと複雑な計算を処理する必要があるため、この基盤は不可欠です
・インフラストラクチャの構成要素(ハードウェア、ソフトウェア)
インフラストラクチャ層は、AIシステムを動作させるためのハードウェアとソフトウェアの組み合わせで構成されています。主要な構成要素は以下の通りです
-
・高性能コンピューティング(High performance computing)
AIの「処理能力」を担う部分です。GPUやTPUなどの特殊なプロセッサは、並列処理に優れ、大規模なAIモデルのトレーニングに必要な膨大な計算を高速・効率的に実行します。複数のコンピューターを高速ネットワークで連携させるハイパーコンピューターも、要求の厳しい生成AIモデルの処理能力を支えます。 -
・高性能ストレージ(High performance storage)
生成AIモデルは、ペタバイト規模の膨大なデータセットを学習するため、高性能ストレージが不可欠です。これは、大量のデータを効率的に保存し、高速でアクセスするための容量と速度を提供します。これにより、トレーニングの遅延を防ぎ、AIモデルの学習プロセスをスムーズに進めることができます。 -
・ネットワーキング(Networking)
高性能コンピューティングクラスター内のすべてのプロセッサが連携して作業を行うためには、高速で効率的な通信が不可欠です。高帯域幅で低遅延のネットワークは、AIインフラストラクチャの異なる部分間でのスムーズなデータフローと効率的な通信を保証し、AIシステムの全体的なパフォーマンスを最大化します
・「エッジAI」という考え方:処理をデータ発生源の近くで行う
エッジAIは、AI処理をデータが発生するデバイスやサーバーの近くで行う概念です。これにより、リアルタイム性が求められる自動運転やドローンの制御、高いプライバシーが要求される医療データ処理などで威力を発揮します。データ転送の遅延を最小限に抑え、ネットワーク接続への依存を軽減し、帯域幅の削減にも貢献します
エッジAIの主な利点は以下の通りです
-
・リアルタイム応答性とレイテンシーの削減
処理がデータ発生源の近くで行われるため、データ転送の遅延が最小限に抑えられ、瞬時の応答が可能になります。これは、自動運転車や医療機器のような、一瞬の遅れも許されないアプリケーションにとって非常に重要です -
・データプライバシーの向上
医療データのような機密性の高いデータをデバイス上で処理することで、クラウドへの送信に伴うプライバシー侵害のリスクを最小限に抑えられます -
・ネットワーク接続への依存軽減
インターネット接続が不安定な場所や、まったく接続できない場所でも、エッジでAIモデルを実行することで、常に安定したパフォーマンスを維持できます -
・帯域幅の削減
リアルタイムで生成される大量の生データをすべてクラウドにアップロードすることなく、エッジで処理し、必要な情報のみを送信することで、ネットワーク帯域幅の使用量を大幅に削減できます
・Googleが提供するエッジAI向けツール
Googleは、このようなエッジデバイスにAIモデルをデプロイするためのツールを提供し、開発者に多くの制御と柔軟性を提供しています
-
・Lite Runtime (LiteRT)
LiteRTは、スマートフォンや組み込みシステムなど、リソースが限られたエッジデバイスで強力なAIモデルを効率的に実行するために設計されたGoogleの高性能ランタイムです。開発者がAIモデルをオンデバイスで効率的にデプロイし、動作させることを支援し、限られた環境下でのAI活用を可能にします -
・Gemini Nano(効率的でコンパクトなモデル)
Gemini Nanoは、Googleが開発した最も効率的でコンパクトなAIモデルで、スマートフォンや組み込みシステムなどのエッジデバイス上での動作に特化しています。プライバシー強化、データ転送による遅延のない高速応答、オフラインアクセスが主な利点です。Pixelスマホの通話メモ要約機能などで活用され、エッジAIの可能性を広げています
エッジにデプロイする場合でも、Vertex AIはAIモデルの構築、トレーニング、洗練のための強力なプラットフォームを提供します。
このように、インフラストラクチャ層は生成AIの能力を最大限に引き出すための基盤であり、その構成要素を理解し、クラウドだけでなくエッジでのAI処理の可能性を考慮することは、生成AIソリューションを構築する上で非常に重要です。
6. Gen AIプロジェクトを始める前に考えるべきこと
生成AIソリューションの導入には、基盤となる仕組みやランドスケープの理解が不可欠です。成功のためには、プロジェクトの「ニーズ」と「利用可能なリソース」を事前に評価し、野心と能力を一致させることが重要です。このセクションでは、プロジェクトを成功に導くために考慮すべき主要な要素とリソースについて解説します
・プロジェクトに必要な要素(Needs)
どのような生成AIソリューションを構築するかを決定する前に、プロジェクトに求められる具体的な要件、つまり「ニーズ」を明確にすることが重要です。考慮すべき主な要素は以下の通りです
-
・スケール(ユーザー数)
ソリューションが個人利用か、数百万ユーザー向けかによって要件は大きく変わります。ユーザー数が多いほど、スケーラビリティ、セキュリティ、インフラコスト、レイテンシーを考慮した、より堅牢でカスタマイズされたソリューションが必要です。事前にユーザー規模を明確にすることが重要です -
・カスタマイズ性
どの程度専門的なソリューションが必要かを検討します。強力な基盤モデルの活用が一般的ですが、独自のニーズ(専門分野、複雑なタスク、ユニークなUX)にはファインチューニングやカスタムモデル開発が有効です。必要なカスタマイズレベルを見極め、適切なアプローチを選択しましょう -
・ユーザーインタラクション
AIとユーザーがどのように対話するかを考慮し、直感的で魅力的な体験を設計します。AI機能を既存ワークフローへ統合するUIや、会話型、情報提供型、タスク指向型といったUXのタイプを検討。ユーザーが必要とするガイダンスやフィードバックのレベルを見極めることが成功の鍵です -
・プライバシー(データの機密性)
扱うデータの機密性を評価し、データセキュリティとコンプライアンス対策を講じることが不可欠です。処理中・保存中のデータ保護のため、暗号化、アクセス制御、セキュアなデータセンターなどを検討。GDPRやHIPAAなどの規制遵守も確認し、リスクを最小限に抑えましょう -
・レイテンシ(応答時間)
許容できる応答時間の制限を明確にし、リアルタイム要件を考慮します。瞬時の応答が必要な医療機器や自動運転車のようなシナリオでは、エッジAIのような低遅延アプローチが必須です。リアルタイム性が重要でない場合は、モデルやインフラの選択肢が広がります -
・コネクティビティ
インターネットアクセスが常に利用可能かを検討し、オフライン機能を考慮します。インターネット接続が不安定な場所や、まったく接続できない場所でソリューションが機能する必要がある場合(例:ドローンの航行や自動運転車)、エッジAIが有効な選択肢となり、安定したサービス提供に貢献します
・利用可能なリソース(Resources)
プロジェクトのニーズを評価したら、次に、プロジェクトを成功させるために利用できる「リソース」を検討する必要があります。これには、適切な人材、予算、そしてプロジェクトのタイムラインが含まれます
-
・人材(AI専門知識)
ソリューション構築に必要な専門知識を持つ人員を理解することが重要です。AIスタックは、特定のニーズを持つ異なる役割をサポートするように設計されており、構築したいものに適した専門知識と人材が揃っているかを確認します-
♢ ビジネスリーダー:
生成AIがもたらすビジネス価値を追求し、既存の生成AIソリューションを業務プロセスや顧客接点に統合・適用します。これにより、例えば顧客サービスの応答性向上や、パーソナライズされた顧客コミュニケーションの実現などを通じて、事業の効率化や顧客満足度の向上を目指します -
♢ 開発者:
カスタムAIエージェントの構築・デプロイや、既存アプリケーションへのAI機能統合を担います。事前学習済みのAPIやVertex AIのようなプラットフォームを使用します -
♢ 生成AIエンジニア:
生成AIモデルのカスタマイズ、デプロイ、最適化において重要な役割を果たします。Vertex AI内のツールを活用し、AIワークロードのスケーリング、モデル統合、責任あるAI対策の実装などを行います
-
♢ ビジネスリーダー:
-
・予算
生成AIソリューションの構築には、モデルのトレーニング、デプロイ、予測実行に料金が発生します。これらのコストは、コンピューティング時間やストレージ使用量に応じて変動します。従量課金制やサブスクリプション、ライセンス料といった料金体系を理解し、モデルのサイズや複雑さ、デプロイ先がコストに影響する要因として、現実的な予算計画を立てることが重要です -
・時間(プロジェクトのタイムライン)
ソリューションのカスタマイズ度が高くなるほど、構築に要する時間とリソースは増加します。事前構築済みのAIアプリケーションは短時間で導入可能ですが、カスタムAIモデルの構築には数ヶ月かかることもあります。AIエージェントの活用は比較的短期間で済む場合があります。プロジェクトの要件と照らし合わせ、現実的なタイムラインを設定することが成功に不可欠です
ニーズとリソースを理解し、ここで説明した要素を慎重に検討することで、プロジェクトの要件に最も費用対効果の高いソリューションを選択し、成功に繋げることができます
7. まとめ :生成AI活用の羅針盤
本記事では、生成AIの真価を引き出すため、その5つの層からなるランドスケープを解説しました。特に、自律的な「エージェント」の仕組みや、AIを支える「インフラストラクチャ」の重要性、そしてプロジェクト成功に不可欠な「ニーズ」と「リソース」の評価について掘り下げました。
次回は、「Gen AI Leader 合格への道#5:⽣成 AIを活⽤する」として、コーディングなしで生成AIの力を活用できる事前構築済みアプリケーションや、プロンプトエンジニアリング、グラウンディング、RAGといったGen AIモデルの効果的な活用テクニックについて掘り下げていきます。