オープンソースAI:費用対効果が高く、広く利用されているとMetaが支援するレポートで指摘

オープンソースAI:費用対効果が高く、広く利用されているとMetaが支援するレポートで指摘
Metaのマーク・ザッカーバーグ氏の写真。
Metaのマーク・ザッカーバーグ氏。画像:Meta

Meta が委託した調査により、オープンソースの人工知能はコスト効率が高く、企業に広く導入されていることが判明しました。

2023年半ばのLlama 2のリリース以来、マーク・ザッカーバーグ氏の会社は、独自の基準に従って、独自のAIモデルをオープンソースとして公開しており、その事実を強調することに注力している。

オープンソースAIシステム:ビジネスへのプラスの影響

Linux Foundationが実施したこの調査は、学術文献や業界文献、そして非営利団体による実証データのレビューで構成されています。オープンソースAIシステム(少なくともモデルとコードが公開され、利用または改変が可能)がビジネスに与えるプラスの影響を示す統計データに焦点を当てています。

例えば、ハーバード大学の調査によると、オープンソースソフトウェアを使用している企業は、そのオープンソースソフトウェアが利用できない場合、約3.5倍の費用を費やすことになります。特にオープンソースAIに関しては、組織の3分の2が独自モデルよりも導入コストが安いと主張しており、ユーザーのほぼ半数がコスト削減を選択理由に挙げています。この費用対効果の高さがオープンソースAIの魅力を高めており、AI導入企業の89%が何らかの形でオープンソースAIを使用していると報告しています。

参照:Meta、次回の大規模AIリリースを再び延期

Linux Foundationのアンナ・ハーマンセン氏とケイリーン・オズボーン氏は、AIモデルのオープンソース化はモデル自体の改善を促し、ビジネスにとってより有用なものになると主張しています。ケーススタディの一つは、Metaによる一方的なガバナンスからLinux Foundationによるオープンガバナンスに移行したAIフレームワーク、PyTorchに焦点を当てています。著者らは、Metaへの貢献は減少したものの、チップメーカーなどの外部企業からの貢献は増加し、PyTorchのユーザーベースからの貢献は一定であったことを発見しました。彼らは、このことからモデルのオープンソース化は「より幅広い参加と貢献の増加を促進する」ことを示していると述べています。

オープンソース モデルはカスタマイズ性が高いと考えられており、これは製造環境における重要な利点です。また、この調査では、ヘルスケアなどの分野ではオープンソース モデルのパフォーマンスが独自モデルに匹敵し、品質を落とさずにコストを削減できることがわかっています。

MetaはLlamaがオープンソースAIで優位に立つことを望んでいるが、その用語の定義は議論の余地がある。

Metaは本調査を通じて、オープンソースAIの利点を強調し、オープンソースLlamaモデルのプロモーションにつなげることを目指しています。AI分野は競争が激しいため、オープンソース分野で優位に立つことができれば、信頼できるブランドとしての地位を確立し、他の分野でもリードしていく道を切り開くことができます。

しかし、批評家たちはMetaのオープンソースAIの解釈に異議を唱えています。Linuxレポートは、Generative AI Commonsのモデルオープンネスフレームワークが提供するかなり広範な定義を採用しており、機械学習モデルのアーキテクチャ、パラメータ、およびドキュメントのみが、使用、変更、および配布を許可する許容ライセンスの下で公開されることを求めています。

対照的に、数年にわたる調査を経て2024年10月にようやく発表されたオープンソース・イニシアチブの定義は、より具体的です。ユーザーは、いかなる目的であっても、許可を求めることなくシステムを使用でき、その仕組みを理解し、変更を加え、変更の有無にかかわらず他の人と共有できなければなりません。

参照:OpenAIは「今後数ヶ月以内に」公開されるオープンモデルに関するフィードバックを求めている

これらの記述はすべて、モデルのソースコード、パラメータと重み、そしてトレーニングデータに関する詳細情報に適用されなければなりません。これは、トレーニングデータ自体を公開する必要があるという意味ではなく、「熟練した者が実質的に同等のシステムを構築できる」だけの十分な情報を提供しなければならないという意味です。

オープンソース・イニシアチブ(OSI)は2023年、Llama 2は特定のユーザーに対して商業的な制限を課し、モデルの使用方法も制限しているため、Metaが反対を唱えているにもかかわらず、「オープンソース」の範疇から外れると述べました。2月にLlama 3をリリースした際にこの点を再確認し、これらのモデルには欧州連合(EU)のユーザーからのアクセスを拒否するなど、さらに多くの制限が課されていると述べました。

テクノロジーコンサルタント会社ThoughtworksのCTO、スコット・ショー氏は2024年6月にTechRepublicに対し、MetaのLlama 3のユーザーはソースコードを調べることができず、無制限の再配布ができず、特定の用途にはライセンス料を支払わなければならないと語り、これはオープンソース・イニシアチブの定義に反していると述べた。

Llama 4でも問題は残っています。Metaでは、月間アクティブユーザー数が7億人を超える商業団体がモデルを使用する前に明示的な許可を求めることができるようになったからです。

「Metaに聞けば、彼らはそれをオープンに利用可能なモデルと呼ぶでしょう」とShaw氏は2024年にTechRepublicに語った。「それは正直な話ですが、オープンソースという言葉はこうしたものに対して非常に曖昧に適用されています。オープンに利用可能、あるいは無料であることが必ずしもオープンソースを意味するわけではないことを人々が理解することが重要だと思います。この点が見落とされがちで、人々は特定のモデルがどの程度オープンであるかを完全に理解していないのです。」

Tagged: