
Snowflakeはデータを扱う企業です。同社は、ネイティブ・アプリケーション・フレームワークを用いてアプリケーションレベルでデータ中心のソフトウェア開発を「実行」し、Snowflake Marketplaceを通じてポータルレベルのデータサービスの取引と交換を促進します。そして、より幅広いアプローチとデータクラウド企業としての自称に基づき、プラットフォームレベルのデータ管理を提供します。つまり、複数のレベルでデータを扱うということです。
比較的大規模な製品アップデートをいくつか発表して年末を迎えた Snowflake は、Snowday 2022 イベントで Data Cloud World Tour のサンフランシスコ公演を開催し、同社のツールセットの今後の方向性について説明しました。
参照: 採用キット: クラウド エンジニア (TechRepublic Premium)
単一のコンピューティング/データ エンジン全体で「透過的な」パフォーマンス強化の恩恵を受けていると説明されている (ここでの透過性とは、Snowflake 自身が自社のスタック内で有機的に設計したパワーと機能の向上と、新しいハードウェア タイプの改良の活用を意味します)。Snowflake は、コアとなるデータ クラウド サービスがより高速で、パフォーマンスが向上したと主張しています。
ビジネスに対する約束は、組織がデータを動員して最も重要なワークロードを実行できるようにするルートです。
クロスクラウド機能
Snowflakeの最新の機能強化を見ると、同社はクラウドの多様性という現状を的確に認識していることがわかります。クラウドコンピューティング技術(ますますクラウドネイティブな導入モデルが進む)を利用するあらゆる規模の組織は、複数のクラウドインスタンスを使用しています。マルチクラウドを実現するために、リスク、コスト、機能、ガバナンス、コンプライアンスを複数のクラウドサービスプロバイダーに分散させることは、今日では明白かつシンプルな常識となっています。
クラウド資産をさらに分散させ、コンピューティングとストレージの一部をオンプレミスのプライベートクラウドデータセンターに維持することも、この賢明さの重要な要素であり、現在ではハイブリッドクラウドと呼ばれています。組織のクラウドインスタンススタックを分散させ、個々のアプリケーションワークロードを複数のクラウドに分散させ、現在ではポリクラウドと呼ばれるものを構築することも同様に賢明ですが、おそらく2~3倍の複雑さになります。
この現実を反映し、Snowflakeはクロスクラウド機能の進化に取り組んでいます。Snowgridと呼ばれるこの技術レイヤーは、クラウドとリージョンを相互接続し、Snowflakeのコラボレーション、データガバナンス、そして事業継続性を支える基盤です。
組織のデータニーズが拡大し続ける中、世界中の様々なチーム、地域、クラウドと連携する能力が不可欠です。Snowgridは、グローバルに分散したチームや事業部門間で、単一の接続されたエクスペリエンスを提供することで、組織を支援します。これらのチームや事業部門は、規制遵守のためのガバナンスを統合するために連携しています。簡単に言えば、Snowgridは組織がデータだけでなく、それ以上のものを複製することで、事業継続性を向上させることを可能にします。
「当社の成功は、お客様がSnowflakeをご利用いただくことで成功を収めていただくことにかかっています。だからこそ、私たちは常にパフォーマンスと経済価値の向上に努め、お客様に提供できるよう努めています」と、Snowflakeの製品担当シニアバイスプレジデント、クリスチャン・クライナーマンは述べています。「単一の製品によって、イノベーションを加速し、クラウドやリージョンをまたいで統一されたエクスペリエンスを提供するための改善を実現できます。これにより、お客様はクラウド規模でデータを保護し、より効率的な運用を行い、グローバルなコラボレーションを実現できます。」
スノーフレークが実際にやっていること
Snowflake が実際何であるか、Snowflake が実際に何をするか、そして Snowflake が実際にどのように展開されるかを説明するために、ソフトウェア開発者がアプリケーションに関連するデータ ワークロードの責任を処理するために Snowflake アプリケーション フレームワークをどのように使用するかを見てみましょう。
複雑な多層データ パイプラインを通過するテラバイトやペタバイト単位の情報を処理する、通常はデータ集約型のアプリケーションを作成するために、Snowflake は「ストアド プロシージャ」(データベース機能を制御するコード) などのサービスを提供し、効率的なデータ中心のアプリケーション アーキテクチャを構築するためのパッケージ化されテストされたルートを提供します。
同社は、一般的なクエリの高速化、レプリケーション速度の高速化、新たなユースケースの創出、そしてレイテンシ問題への対応力を実現する、単一の弾力性とクラウド対応性に優れたパフォーマンスエンジンで知られています。自社のテクノロジースタックの中でも特に貴重な資産の一つであるこの弾力性エンジンは、同社が「継続的なイノベーション」と呼ぶものを推進するために、多大な研究開発が行われています。
Snowflakeの最新リリースは、パフォーマンス向上を推進するという同社の方針を継承しています。また、パフォーマンス最適化の影響に関する新たな可視性の提供にも取り組んでいます。
改善点の一つとして、現在パブリックプレビュー中のクエリアクセラレーションサービスが挙げられます。このサービスは、コンピューティング能力全体をスケールアップすることなく、追加リソースのバーストを提供することで、大規模なデータクエリを高速化します。毎晩「Curb Your Enthusiasm」の30分エピソードだけをダウンロードしているNetflixユーザーが、ある日突然「ゴッドファーザー」三部作を全話ストリーミングすることにした、といった具合です。バーストがまれな場合、ユーザーに新しい契約を強制するのは公平ではありません。ユーザーは、パワーと柔軟性のバランスを高く評価しているようです。
「ドアダッシュはここ数年、製品の革新と地理的な流通の面で成長を続けています」とドアダッシュのデータエンジニアリング&BI責任者であるヴァイブハブ・ジャジュ氏は語った。
ジャジュー氏は、事業の成長に伴い、同社のデータ量が爆発的に増加したと語る。
「私たちは新たなデータポイントを収集し、新たなビジネスアイデアを考案・実験し、新たなインサイトを生み出しています」とジャジュー氏は述べた。「私たちは、成長に合わせて拡張・成長できるスケーラブルなデータインフラパートナーを探していました。Snowflakeはまさにまさに私たちのパートナーでした。Snowflakeは私たちと協力して、データニーズに合わせて拡張し、複雑なビジネス要件にも対応してくれました。」
Snowflake Marketplaceのデータリスト
Snowflakeがデータマーケットプレイス競争で好調を維持している大きな要因の一つは、いわゆる「データリスト」を提供できることです。Snowflakeマーケットプレイスには2種類のデータリストがあります。無料のデータリストは、他のSnowflakeユーザーが公開したデータセットへのアクセスを提供します。これは通常、汎用データ、集約データ、または顧客固有ではないデータです。
パーソナライズされたデータリストにより、Snowflake Marketplaceユーザーは他のSnowflakeユーザーから特定のデータセットをリクエストできます。これは、プロバイダーが有料で提供するプレミアムデータや、各消費者に固有のデータなどです。
どちらの場合も、各リストには共有データの詳細、サンプルの使用例、およびデータ プロバイダーに関する情報が含まれます。
Snowflakeは、データリストの共有における柔軟性を高めるため、クラウド間の連携を強化しています。プロバイダーは、グローバルなビジネスエコシステムとリストを公開または非公開で共有できます。また、プロバイダーは、サポート対象の地域やクラウド全体で、消費者がデータを自動的に利用し、すぐに活用できるように設定することもできます。
また、この冬のアップデートでは、クロスクラウド データ ガバナンスが、大規模なガバナンスを簡素化する手段として位置付けられています。これは、組織が国際規制に準拠し、データ エコシステム全体で統一されたレベルの可視性を享受する上で明らかに役立つサービスです。
クラウド間の継続性
最後に、クロスクラウドの継続性向上を目指し、グローバルオペレーションの簡素化を目指す同社の取り組みについても触れておきたいと思います。Snowflakeは、お客様がクラウドやリージョンをまたいでデータを複製できるようにすることで、より高いレベルの回復力を実現し、災害発生時の業務中断を最小限に抑えることを可能にします。
データ サイエンティストやソフトウェア開発者ではない素人がこの議論を少しは聞いていても、実際に何が起こっているのかは理解できない場合、素人向けのエレベーター ピッチは、ここで提示されているいくつかのテクノロジの更新の背後にある感情を抽出するのに役立つでしょうか。
これは本質的に、私たち全員が毎日デバイスで使用するクラウド中心のアプリケーションの内部、アプリケーションを通じて、アプリケーション間、アプリケーションの下、アプリケーション上で、情報がどのように使用されるかについての話です。
機能的に連携されたデータを、生の開発環境、形式化された安全なデータベース、混沌とした非構造化データレイク、秩序立ったデータウェアハウス、そして熱狂的なデータマーケットプレイスの間で移動させるには、通貨、マーケットプレイス、規則、そしておそらくは町の広報担当者が必要です。Snowflakeは、これらすべて、そしておそらくそれ以上のものを目指しています。