
アリババは、AI システムが情報を検索する方法を変革し、コストを大幅に削減できる画期的なテクノロジーを導入しました。
新しいツール「ZeroSearch」は、大規模言語モデル(LLM)を用いて、インターネットに接続することなく検索エンジンの結果をシミュレートすることを可能にします。Alibabaの手法は、GoogleやBingに頼ってウェブ検索を行う代わりに、AIモデルが検索エンジンをシミュレートすることを可能にし、リアルタイム検索を省略することで、高額なAPIコストを大幅に削減します。
「強化学習(RL)のトレーニングには頻繁なロールアウトが必要で、数十万件の検索リクエストが発生する可能性があり、かなりのAPI費用が発生し、スケーラビリティが著しく制限される」とアリババの研究者はarXivで公開された論文に記している。
ZeroSearchの仕組み
ZeroSearchは、検索エンジンからリアルタイムデータを取得するのではなく、クエリに基づいて有用な文書とノイズの多い文書の両方を生成するようにLLMをトレーニングします。これは、軽量な教師ありファインチューニングプロセスを通じて行われ、モデルは高品質の応答と低品質の応答がどのようなものかを学びます。
トレーニングでは「カリキュラムロールアウト」戦略が採用されます。これは、AIにまず分かりやすい情報を与え、その後、時間の経過とともに、現実世界のインターネット検索状況を模倣した、より複雑で乱雑なデータにさらしていくことを意味します。
「私たちの重要な洞察は、LLMが大規模な事前トレーニング中に広範な世界知識を獲得し、検索クエリが与えられた場合に関連する文書を生成できることです」と研究者らは論文で説明している。
このプロセスにより、モデルの推論能力が強化され、人間がオンラインで頻繁に行うのと同様に、信頼できないデータをより効率的に調べることができるようになると研究者らは述べている。
ZeroSearchの大幅なコスト削減
ZeroSearch の魅力的な特徴は、コストを大幅に削減できることです。
Alibabaの分析によると、約64,000件のGoogle検索クエリをSerpAPIでトレーニングすると、約586.70ドルのコストがかかることがわかりました。一方、4基のA100 GPUで動作する14BシミュレーションモデルとZeroSearchを使用すると、コストはわずか70.80ドルとなり、88%の削減となります。
ZeroSearch vs. Google検索
テストで、Alibaba は次のことを発見しました。
- ZeroSearch を使用した 7B パラメータ検索モデルは、Google 検索と同等のパフォーマンスを発揮しました。
- ZeroSearch を使用した 140 億パラメータ モデルは、パフォーマンスにおいて Google 検索を上回りました。
「結果は、ZeroSearchがAPIコストを一切かけずに、実際の検索エンジンベースのモデルよりも優れた性能を発揮することを示しています」とレポートは述べています。「さらに、ZeroSearchは、様々なパラメータサイズのベースLLMと命令調整LLMの両方において優れた汎用性を示し、様々な強化学習アルゴリズムをサポートしています。」
また、命令調整モデルや基本モデルなど、さまざまな AI サイズやタイプで適切に機能し、PPO、GRPO、Reinforce++ などのいくつかの強化学習手法と互換性があります。
GitHub の ZeroSearch と Hugging Face
ZeroSearchのパフォーマンスは、モデルの大規模化とGPUの増加に伴って向上し、Qwen-2.5やLLaMA-3.2を含む幅広いモデルファミリーで良好に動作します。同社は、コード、データセット、事前学習済みモデルをGitHubとHugging Faceで公開しています。
この画期的な進歩が将来のAIモデルに何を意味するのか
アリババの動きは、AI企業がよりスマートで自立的なモデルの構築を競い合う中で起こった。OpenAIのChatGPTやGoogleのGeminiといったシステムは依然としてライブデータや検索統合に依存しているが、ZeroSearchはAIが自らの内側で完全に「検索」し、より低コストで、時にはより正確な結果を出す未来を示唆している。