Twitter
Facebook
Hatena
近年注目される次世代型データプラットフォーム「Snowflake」とは?

 「生成AI・AIエージェント活用における最新トレンド:AIデータクラウドとは何か?」では、生成AI活用におけるトレンドとして「AIデータクラウド」について、貴田が解説しました。生成AIを効果的に活用する為には、膨大なデータを安価且つ効率良く蓄積・処理可能なプラットフォームの存在が不可欠であり、データの蓄積からAI活用までを一気通貫して実現することができる「AIデータクラウド」が注目を集めています。

 本コラムでは、AIデータクラウドの中でも注目を集めているSaaS製品「Snowflake」の概要と特徴について詳しく解説します。

「Snowflake」とは

 「Snowflake」とは、アメリカのSnowflake Inc.が提供するSaaS型のクラウドデータプラットフォームです。現在、全世界で約11,000社、国内では約800社を超える企業に採用されており、AWS・Google Cloud・Azureをはじめとした世界中の企業で採用されているクラウド製品や多くのSaaS製品とシームレスに連携することができます。ビッグデータの蓄積、管理、活用といった一連のプロセスを実現する機能を備えており、ビジネスにおけるデータの利活用を促進させ、企業の競争優位性を高めるプラットフォームとして注目を集めています。

「Snowflake」を活用したデータ利活用の全体像

以下では、「Snowflake」の特徴を4つご紹介します。

「Snowflake」の4つの特徴①:シングルデータプラットフォーム

 まずは、最大の特徴ともいえる「シングルデータプラットフォーム」について紹介します。データの蓄積から分析、運用/監視、AI/機械学習に至るまでのあらゆる機能が単一のプラットフォームで完結するようになっており、複数サービスを運用する際の複雑性を排除することが期待できます。

シングルデータプラットフォームの主な利点

【1】スモールスタートで迅速な立ち上げが可能
 データ活用に関するあらゆる機能が含まれていることから、複数の製品やサービスを契約することなく、クイックにデータ活用をはじめることができます。従来型のデータウェアハウスでは、複数のサービスに関する知見が求められ、クラウド設計・ログ設計・セキュリティ対応・チューニング作業など導入から利用開始までに考慮すべき要素が多くありました。これら全ての作業がなくなるわけではありませんが、コンソール画面やSQLを介して簡単に環境のセットアップができることが強みの1つです。

【2】他業務に影響を与えにくいアーキテクチャを採用
 データの読み書きで使用するコンピュートリソースとデータの保存領域であるストレージが分離している拡張性の高いアーキテクチャが採用されています。業務・プロジェクト・作業者ごとにそれぞれリソースの割り当てをすることが可能となっているため、他の業務の影響を受けることなく、安心して利用できます。

【3】使った分だけの従量課金制
 クラウドの特徴を最大限に活かした柔軟なリソース配分やスケーリングが可能で、必要なリソースを必要な分だけ確保できる従量課金モデルを採用しています。無駄な課金を抑えるためのコンピュートの自動停止機能なども有しているほか、使いすぎを防止するためのアラート機能やコンソール上でのコストモニタリング機能も有しています。

「Snowflake」の4つの特徴②:セキュリティ&ニアゼロメンテナンス

 ビジネスで取り扱うデータには個人情報が含まれていることも多く、データを適切に管理・運用していくことは絶対に欠かすことができません。「Snowflake」には、企業の大切なデータを管理するためのセキュリティ機能が数多く備わっています。
 またニアゼロメンテナンスを謳っており、メンテナンスや運用工数を最小化する為の仕組みが備わっております。
 本章ではこれらの特徴について解説します。

充実のセキュリティ機能

「Snowflake」の代表的なセキュリティ機能を以下に紹介します。

【1】通信・データの暗号化
 「Snowflake」を利用するにあたって、常時通信の暗号化が行われているほか、クラウド事業者のプライベートネットワーク機能を活用することができ、セキュアな通信環境でデータ活用を行うことができます。また格納されたデータについても暗号化された状態で保持されるようになっており、暗号化キーのローテーションやCMK(顧客管理キー)を利用することもできます。

【2】不正アクセス制御
 特定のIPアドレスからの接続のみを許可するなど、信頼できるクライアントのみを許可し、不正アクセスを防止する機能が備わっています。またMFA(多要素認証)やSSO(シングルサインオン)の機能も搭載しており、なりすましによるアクセスを防ぐための機能も具備しています。

【3】アクセス管理機能
 RBAC(ロールベースアクセス制御)を採用しており、データベース・スキーマ・テーブルなどといったオブジェクト単位でアクセス権限を設定できます。例えば、役職や部署別のアクセス権限設定を実施することによって、必要なユーザーにだけデータの公開を行うことができます。

【4】監査ログ収集
 標準機能として、実行したクエリの履歴やコンソールでの操作履歴を1年間ログとして記録する機能が備わっており、「誰が」「いつ」「何の」操作を実施したのかをモニタリングすることができます。

 このようにエンタープライズ向けの強固なセキュリティ対策が施されているため、安心してデータ活用に集中する基盤を整えることができます。

フルマネージドサービスとして提供

 SaaS型のクラウドサービスであることから、データセンター、ハードウェア、ソフトウェアなどのインフラの管理から解放されるほか、ダウンタイムなしで最新のセキュリティパッチが適用された安全な環境で、データ活用ができるフルマネージドサービスとして提供されています。
 またデータを蓄積する際に「マイクロパーティション」という形式でデータを保持する仕組みを採用しており、従来のデータベース製品のように複雑なチューニングを行うことなく、高いパフォーマンスを発揮できるという特徴があります。

「Snowflake」の4つの特徴③:エンタープライズ向けAIとアプリケーション

 近年では、ビジネスにおけるAI活用が徐々に浸透しており、業務の生産性を向上させるためにAIを使いこなすことが不可欠となってきています。「Snowflake」にはデータウェアハウスとしての機能だけではなく、このようなニーズに対応できるエンタープライズレベルのAI機能が備わっています。

エンタープライズAIの進化

生成AIを活用するための「Cortex AI」や、機械学習を可能とする「Snowflake ML」、自然言語でのデータ活用をサポートする「Copilot」など様々なAI機能が用意されています。利用可能なモデルとしては、Anthropic社の「Claude 3.5 Sonnet」をはじめとした様々なプロバイダが提供する基盤モデルやSnowflake社独自の「Snowflake Arctic」があります。
AIの活用が身近なものとなった反面、利用する際の懸念事項として、セキュリティリスクやデータの学習における問題がしばしば取り沙汰されることがありますが、「Snowflake」では公開モデルにデータを学習させたり、データをセキュリティ境界内から外部に移動させたりすることなく、セキュアにAIを活用することができるようになっています。

「Snowflake」の代表的な開発機能

アプリケーション開発サービスの提供

「Snowflake」には、「Snowpark Container Services」や「Streamlit in Snowflake」というアプリケーション開発のためのサービスが用意されています。
データウェアハウスとして大量なデータを蓄積・分析する機能だけではなく、「Snowflake」上のコンピュートリソースを利用してアプリケーションをクイックに開発できることが大きな魅力です。

「Snowflake」の4つの特徴④:データコラボレーション&マーケットプレイス

 自社内におけるデータ活用だけではなく、外部企業とのデータやアプリケーションの共有を行う機能も搭載されています。

組織を超えたシェアリング機能

 社内の部署間での共有に加えて、取引先や外部の企業ともデータ共有が可能となっています。特徴として、データを物理的にコピーせず、参照アクセスさせる仕組みになっていることから、セキュア且つストレージコストの重複を防ぐことができる点が挙げられます。
 また共有までの手順も容易であり、これまでバッチ処理などで時間をかけていたデータ共有がわずか数クリックで実現できるようになっています。共有先はデータをリアルタイムに参照できることから、鮮度の高いデータ活用が期待できます。また共有不要となった場合は即座に停止することも可能なので、安心して利用できます。

マーケットプレイスの提供

 「Snowflake」の「Snowflake Marketplace」では、業務データやアナリティクスツールなど様々な領域のサービスが公開されています。現在約800以上のプロバイダがサービスを提供しており、これらを簡単に自社環境に組み込めます。
また、自社がプロバイダとなり、「Snowflake Marketplace」上でサービスやデータを販売することによって、マネタイズを行うこともできます。

「Snowflake」のデータコラボレーション機能

導入事例

以下では、当社が実際に支援を行った導入事例を紹介します。

導入事例①:小売チェーン店舗様向けデータ分析基盤構築

 日本全国に数百店舗を展開している小売業のお客さま向けに、データ分析基盤および、データパイプラインの構築を実施しました。
 データ連携機能の構築にあたって、クラウド型のデータ統合サービス「Azure Data Factory」を採用し、柔軟性の高い連携機能を実現しました。
 データの可視化については、「Streamlit in Snowflake」を活用したアプリケーションで実現いたしました。さらにリーダーアカウントという機能を使って、関連企業数百社向けに読み取り専用アカウントを提供し、アプリケーションを配信することでデータ共有も行っております。

 なお、本事例では日々の業務の変化への迅速な対応を目的として、データ基盤の構築においてアジャイル開発を採用しています。

導入事例②:物流会社様向けデータ分析基盤構築

 運送業と倉庫業を担う物流会社のお客さま向けに、業務状況の可視化や効率化を目的としたデータ分析基盤の構築を実施いたしました。
本事例ではSnowpipeを利用したストリーミングでのデータ取込とdbt(Data Build Tool)を採用したデータパイプラインの構築を行いました。
 AWSのQuickSightをダッシュボードとして採用し、日々の業務状況をリアルタイムに可視化し、データドリブン且つスピーディな意思決定に貢献する仕組みを実現しました。

まとめ

 本コラムでは、今注目のAIデータクラウド「Snowflake」について、4つの観点から特徴をご紹介しました。データ活用に必要なあらゆる機能をシングルプラットフォームで手軽に導入できる「Snowflake」は、ビジネスにおけるデータ活用の促進や競争優位性を高めるための有効な選択肢です。
 データ基盤の構築をご検討される際には、「Snowflake」の活用をぜひ検討してみてください。

この記事の執筆者

梁 俊希Toshiki Ryo

ネットソリューション事業本部
ネットインテグレーション事業部
第8技術グループ
主任 / エキスパート

Snowflake