Snowflakeとは? 何がすごいの? ~機能・特徴・データクラウドの意味をわかりやすく解説~(vol.1)
- 公開日:
- 最終更新日:
昨今、データ活用ソリューションとして「Snowflake」が注目を集めています。
Snowflakeは、クラウドベースのデータウェアハウス(DWH)製品という印象が強いのではないでしょうか?
現在、Snowflakeは、自身を“データクラウド”という既存のデータウェアハウス(DWH)製品とは一線を画す概念のサービスであると標榜しています。
本ブログ記事では、「Snowflakeは 何がすごいのか?」、「Snowflakeは なぜ注目を集めているのか?」、「Snowflakeの機能概要や特徴は何なのか?」、「各クラウドベンダーが提供するデータウェアハウス(DWH)製品と何が違うのか?」などの疑問に答えるべく、データクラウド:Snowflakeについてわかりやすく解説します。
目次
Snowflakeとは? ~日本でも利用できるの?~
Snowflakeは、米国Snowflake Inc.が提供するクラウドベースのデータプラットフォームです。Snowflake Inc.は、2012年にアメリカ カリフォルニア州で設立されました。設立以来、先進的なテクノロジーで、世界的な注目を集めています。
そんな昨今注目のSnowflake社には日本法人があります。Snowflake社の日本法人(Snowflake合同会社)は2019年に設立されており、2022年11月現在での代表取締役社長は「東條 英俊」氏です。
また、日本法人があるだけでなく、Snowflake社が提供するヘルプマニュアルや、Web管理画面のGUIは、日本語対応が行われています。さらにSnowflake社は日本のクラウドリージョンをサポートしているため、「データを日本に保存したい」という要件に応えることができます。日本法人の設立後、Snowflake株式会社のエヴァンジェリストKT氏の活動などにより、年々、日本国内での知名度も高まっており、2022年10月時点で、グローバルで6,800社超、日本国内でも約300社ほどの企業で採用されている実績があります。
そのため、データプラットフォームの検討にあたり、Snowflakeを一つの選択肢とする日本企業が増えています。
Snowflakeとは? ~何がすごいの? どんな特徴があるの?~
日本国内でも豊富な採用実績のあるSnowflakeですが、一体どのような特徴があるのでしょうか?
Snowflakeの主な特徴として3つご紹介します。
独自のアーキテクチャ
データを保管するストレージ層と、処理を実行するコンピュート層が分離独立しており、データは集約して一か所で保管しながら、複数の処理を同時に実行することができます。Snowflakeでは、このコンピュートをつかさどるクラスタを「ウェアハウス」と呼びます。
具体的には、次のようなメリットが挙げられます。
- マルチクラスタ
例えば、ETLとBIを担当するコンピュートクラスタを個別に用意することで、それぞれの処理が影響することはありません。 - スケーリング
コンピュートクラスタ単位で、並列度や性能を変更することができます。同時接続数の増減に対応することができます。 - コスト効率化
コストも独立しており、データ量に準じたストレージ課金と、秒単位利用時間でコンピュート課金が行われます。どちらも、完全従量課金制です。
→ 柔軟なスケールアップが可能であり、オートスケール機能も搭載しているため、データ量やユーザ数が増えても、ハイパフォーマンスを維持することが可能です。
フルマネージドサービス
サイジングやDB設計、サーバ保守、セキュリティ対応など、運用に必要な作業がサービスとして提供されるため、運用管理の負荷が軽減されます。
具体的には、次のようなメリットが挙げられます。
- コンピュートクラスタの性能変更はコマンド/WebGUIで実行可能
- クローン機能によるデータを瞬時コピー
- タイムトラベル機能による自動データバックアップ取得
- 災害対策(セカンダリアカウントの定義とフェールオーバー/フェールバック)
- リソース監視からの解放
素早く安全なデータシェアリング
SNOWGRIDと呼ばれるテクノロジーで、データをコピーせず、ストレージ内の任意のデータをリアルタイムで参照/共有することが可能です。データが配布されることはなく、一元管理でき、ガバナンスの観点でも有効です。
このテクノロジーにより、社内外のデータをセキュアに取り込み、シームレスに分析業務を行うことが可能となります。
Snowflakeとは? ~データクラウドに込められた意味とは~
Snowflakeの特徴はご理解いただけたかと思いますが、標榜している“データクラウド”には、一体どのような意味が込められているのでしょうか?
他のデータウェアハウス(DWH)製品との差別化ポイントから読み解いていきましょう。
Snowflakeが一般的なデータウェアハウス(DWH)製品と異なるポイントは次の通りです。
- 構造化/半構造/非構造のあらゆるデータを取り込み、一元管理が可能
一般的なデータウェアハウス(DWH)は、構造化データのみを取り扱いますが、Snowflakeは、半構造/非構造のデータの蓄積&検索が可能です。 - 自社のデータ統合だけでなく、グループ企業/社外パートナー/オープンデータの活用も可能
データシェアリング機能を活用することで、1st Party Data(自社データ)に加え、2nd Party Data(ビジネスパートナーのデータ)や、Snowflakeマーケットプレイス上に公開されている3rd Party Data(オープンデータ)をセキュアに取り込み、シームレスな分析業務を行うことが可能です。 - 自社のデータをSnowflakeマーケットプレイス上に公開し、収益化を目指すことも可能
データを利用するだけではなく、データのビジネス化というような、将来の展望までを見据えることができます。
→ Snowflakeは、これらのポイントを踏襲しながら、様々な機能追加や適用経験を経て、元々クラウドデータウェアハウスと言っていたものから、クラウドデータプラットフォーム、そして現在は“データクラウド”というように、製品やメッセージを進化させているのです。
いかがでしょうか? Snowflakeが「一般的なデータウェアハウス(DWH)製品の領域を超えたデータ活用基盤であり、新しい概念を持つサービス」=「データクラウド」であると定義されている意味が、ご理解いただけたものと思います。
Snowflake とは? ~データウェアハウス(DWH)としての評価は?~
データクラウド:Snowflakeは、クラウド上のあらゆるデータを共有/活用可能なプラットフォームであることはご理解いただけたかと思いますが、他のデータウェアハウス(DWH)製品とレスポンスや機能の面で比較した場合はどうでしょうか?
その場合でも、レスポンスの面において、Snowflakeに優位性があると考えています。なぜなら、データを保管するストレージ層と処理を実行するコンピュート層が分離独立したSnowflake独自のアーキテクチャにより、ETLツールやBIツールなどのワークロード単位で処理性能や並列度を秒単位で定義でき、BIなどのツール利用者の同時接続数の増加にも自動で対応できるからです。
このような、データウェアハウス(DWH)としてのレスポンス性能を評価したい場合には、PoCがおこなわれることがあります。PoCにより、特定のETLツールやBIレポートのレスポンスを測定し、既存のデータウェアハウス(DWH)製品や他のデータウェアハウス(DWH)製品と比較したり、Snowflake導入後の利用料金をシミュレーションしたりします。データウェアハウス製品の選定プロセスにおいて、PoCの実施要否はあらかじめ決めておくとよいでしょう。
※ご参考(PoCのステップ/環境例):https://itsol.dentsusoken.com/snowflake/service/poc/
Snowflakeとは? ~まとめ~
ここまで、Snowflakeの概要について解説して参りました。
最初に、Snowflakeの主な特徴として、ストレージとコンピュートを分離した独自アーキテクチャ、フルマネージドサービス、データシェアリングの3つをご紹介しました。次に、他のデータウェアハウス(DWH)製品とは異なるポイントに触れ、Snowflakeがデータクラウドと呼ばれる理由、その意味について解説しました。
データ活用のスタート~運用/改善~拡張までの各段階で抱える課題は異なりますが、Snowflakeは、上述の特徴を活かし、どのような段階の課題をも解決可能なソリューションです。それが、Snowflakeが多くの企業で採用されている理由と言えるでしょう。
本ブログ記事が、多種多様なデータを活用していくためのデータプラットフォーム製品の選定にあたり、皆さまの検討の一助になりましたら幸いです。
弊社電通総研は、データマネジメントの専門家として、お客様のデータ一元管理やデータ活用における戦略策定、データドリブン経営の実現に向けた真の“使える”データマネジメント基盤構築のご支援をしております。
データ分析基盤の豊富な構築実績に基づくノウハウを体系化したサービスをご提供しておりますので、データ活用でお悩みの際は、是非、電通総研までお声掛けください。
◆ お問い合わせページ:https://itsol.dentsusoken.com/snowflake/inquiry/
*本記事は、2022年11月1日時点の情報を基に作成しています。
製品・サービスに関する詳しいお問い合わせは、電通総研のWebサイトからお問い合わせください。