2024年に注目すべきAIトレンドトップ5

2024年に注目すべきAIトレンドトップ5

AI のトレンドは、クラウドや機械学習などの以前のエンタープライズ テクノロジのトレンドと同様の誇大宣伝と採用の軌跡をたどっているように見えるかもしれませんが、次のような重要な点で異なります。

  • AI では、非構造化データを消化し再作成するプロセスに膨大な量のコンピューティングが必要です。
  • AI は、一部の組織が組織構造やキャリアをどのように捉えるかを変えています。
  • 写真やオリジナルの芸術作品と間違われる可能性のある AI コンテンツが芸術界を揺るがしており、選挙に影響を与えるために利用されるのではないかと懸念する声もある。

ここでは、2024 年に注目すべき、生成モデルを指すことが多い AI の 5 つのトレンドの予測を示します。

AIの導入は、既存のアプリケーションとの統合へと変化しつつある

企業や事業向けに市場に登場している多くの生成AIユースケースは、全く新しいユースケースを生み出すのではなく、既存のアプリケーションと統合されています。その最も顕著な例は、生成AIアシスタントであるコパイロットの普及です。Microsoftは365スイート製品にコパイロットを搭載しており、SoftServeをはじめとする多くの企業が産業用作業やメンテナンス向けにコパイロットを提供しています。Googleは、動画制作からセキュリティまで、あらゆる用途に多様なコパイロットを提供しています。

しかし、これらの副操縦士はすべて、既存のコンテンツをふるいにかけたり、人間が仕事で書くようなコンテンツを作成したりするために設計されています。

参照: Google Gemini と ChatGPT のどちらが仕事に適しているか? (TechRepublic)

IBMでさえ、流行のテクノロジーの現実を検証するよう求め、Googleが2018年に発表したSmart Composeのようなツールは技術的には「生成的」であるものの、私たちの働き方を変えるとは考えられていないと指摘しました。Smart Composeと現代の生成AIの大きな違いは、今日のAIモデルの一部がマルチモーダルであることです。つまり、画像、動画、グラフなどを作成し、解釈できるということです。

「2024年には、マルチモーダル性に関する多くのイノベーションが見られると私は考えています」と、ガートナーのアナリストで著名な副社長のアルン・チャンドラセカラン氏は、TechRepublicとの会話の中で述べた。

NVIDIA GTC 2024では、多くのスタートアップ企業がMistral AIの大規模言語モデル上でチャットボットを動作させていました。これは、オープンモデルを用いることで、企業データにアクセスできるカスタムトレーニング済みのAIを作成できるためです。独自のトレーニングデータを使用することで、AIは特定の製品、産業プロセス、顧客サービスに関する質問に答えることができ、トレーニング済みのモデルに企業独自の情報をフィードバックすることなく、そのデータがインターネット上に公開されるリスクを回避できます。テキストや動画向けのオープンモデルは他にも数多く存在し、MetaのLlama 2、Stability AIのStable LMやStable Diffusionを含むモデルスイート、アブダビのテクノロジーイノベーション研究所のFalconファミリーなどが挙げられます。

「モデルの基礎を築き、コンテキストを追加する方法として、企業データを LLM に取り込むことに非常に強い関心が寄せられています」と Chandrasekaran 氏は述べています。

オープン モデルのカスタマイズは、プロンプト エンジニアリング、検索強化生成、微調整など、いくつかの方法で実行できます。

AIエージェント

2024年にAIが既存のアプリケーションとより統合される可能性があるもう1つの方法は、AIエージェントを通じてであり、チャンドラセカラン氏はこれをAIの進歩における「分岐」と呼んでいます。

AI エージェントは他の AI ボットのタスクを自動化します。つまり、ユーザーは個々のモデルに具体的に指示を出す必要がありません。その代わりに、エージェントに 1 つの自然言語の指示を提供できます。これにより、基本的にそのチームが、指示を実行するために必要なさまざまなコマンドをまとめる作業を行うことになります。

インテルの上級副社長兼ネットワークおよびエッジグループゼネラルマネージャーであるサチン・カッティ氏も AI エージェントについて言及し、4 月 9 日から 11 日にかけて開催されたインテル ビジョン カンファレンスに先立つ事前説明会で、AI が互いに作業を委任することで部門全体のタスクを処理できる可能性があると示唆しました。

検索拡張型生成がエンタープライズAIを席巻

検索拡張生成(RAG)により、LLMは回答を提供する前に、外部ソースと照合することができます。例えば、AIは回答を技術マニュアルと照合し、マニュアルに直接リンクする脚注をユーザーに提供することができます。RAGは、精度を向上させ、幻覚を減らすことを目的としています。

RAGは、費用を急騰させることなくAIモデルの精度を向上させる手段を組織に提供します。RAGは、LLMに企業データを追加する他の一般的な方法と比較して、より正確な結果を生み出し、エンジニアリングと微調整を迅速化します。RAGは2024年のホットな話題であり、年後半も引き続き注目を集めると予想されます。

組織は持続可能性について静かな懸念を表明している

AIは、災害を予測する気候・気象モデルの作成に利用されています。しかし、生成型AIは従来のコンピューティングに比べて、多くのエネルギーとリソースを消費します。

これはAIのトレンドにとって何を意味するのでしょうか?楽観的に見れば、エネルギーを大量に消費するプロセスへの認識が高まることで、企業はそれらのプロセスを実行するためのより効率的なハードウェアを開発したり、使用量を適正化したりするようになるでしょう。一方、楽観的ではない見方をすれば、生成AIワークロードは今後も大量の電力と水を消費し続ける可能性があります。いずれにせよ、生成AIはエネルギー利用と電力網のレジリエンスに関する国家的な議論に寄与する問題となる可能性があります。AI規制は現在、主にユースケースに焦点を当てていますが、将来的にはそのエネルギー利用も具体的な規制の対象となる可能性があります。

テクノロジー大手は、Googleが特定の地域で太陽光発電と風力発電を購入しているように、独自の方法で持続可能性に取り組んでいます。例えば、NVIDIAは、より強力なGPUを搭載したサーバーラックの数を減らすことで、AIの実行を維持しながらデータセンターのエネルギー消費を削減することを謳っています。

AIデータセンターとチップのエネルギー使用量

NVIDIAが今年顧客に納入すると予想される10万台のAIサーバーは、年間5.7~8.9TWhの電力を生産する可能性がある。これは、現在データセンターで使用されている電力のごく一部に過ぎない。これは、博士課程のアレックス・デ・フリース氏が2023年10月に発表した論文によるものだ。しかし、論文の推測通り、NVIDIAが単独で2027年までに150万台のAIサーバーを電力網に追加した場合、サーバーは年間85.4~134.0TWhを消費することになり、これははるかに深刻な影響となる。

別の研究では、Stable Diffusion XL を使用して 1,000 枚の画像を作成すると、平均的なガソリン車で 4.1 マイル走行するのと同程度の二酸化炭素が発生することが判明しました。

「多目的生成アーキテクチャは、モデルパラメータの数を制御した場合でも、さまざまなタスク向けのタスク特定システムよりも桁違いに高価であることがわかった」と、ハギングフェイスのアレクサンドラ・サーシャ・ルッチオーニとヤシン・ジャーナイト、カーネギーメロン大学のエマ・ストラベルの研究者らは書いている。

ネイチャー誌で、マイクロソフトのAI研究者ケイト・クロフォード氏は、GPT-4のトレーニングには地元地区の水の約6%が使用されたと指摘した。

AI専門家の役割の変化

プロンプトエンジニアリングは2023年のテクノロジー業界で最も注目されたスキルセットの一つであり、ChatGPTなどの製品に有用な応答を生成するよう指示することで、6桁の給与を得ようと人々が殺到しました。しかし、この熱狂はやや下火になり、前述のように、生成AIを多用する多くの企業は独自のモデルをカスタマイズしています。プロンプトエンジニアリングは今後、ソフトウェアエンジニアの日常業務の一部となる可能性はありますが、専門分野としてではなく、単にソフトウェアエンジニアが通常業務を遂行する方法の一部として捉えられるでしょう。

ソフトウェアエンジニアリングにおけるAIの活用

「ソフトウェアエンジニアリング分野におけるAIの活用は、現在最も急速に成長しているユースケースの一つです」とチャンドラセカランは述べています。「AIシステムと関わるすべての人(将来的には私たちの多くが関わることになる)は、これらのモデルをどのように誘導し、操作するかを知っておく必要があるという意味で、プロンプトエンジニアリングは組織全体にとって重要なスキルになると考えています。しかしもちろん、ソフトウェアエンジニアリングの担当者は、大規模なプロンプトエンジニアリングとその高度な技術を真に理解する必要があります。」

AIの役割の割り当てについては、個々の組織によって大きく異なります。プロンプットエンジニアリングに従事する人のほとんどが、職務名にプロンプ​​ットエンジニアリングを冠するかどうかはまだ分かりません。

AI関連の役員職

MITのスローン・マネジメント・レビューが2024年1月にデータおよびテクノロジー分野の経営幹部を対象に実施した調査によると、組織によっては最高AI責任者(CAI Officer)の削減が見られるケースがあることが明らかになりました。AI責任者やデータ責任者といった高度に専門化されたリーダーの「責任に関する混乱」が見られており、2024年には、データの出所に関わらず、データから価値を創造し、CEOに報告する「包括的なテクノロジーリーダー」が主流になる可能性が高いでしょう。

参照: AI 責任者の役割と、組織が今後 AI 責任者を置くべき理由 (TechRepublic)

一方、チャンドラセカラン氏は、最高データ・アナリティクス責任者(CDO)と最高AI責任者(CAI O)は「普及していない」ものの、その数は増加していると述べた。これらの役割がCIOやCTOとは別のものとなるかどうかは予測が難しいが、企業が求めるコアコンピテンシーや、CIOが同時に抱える他の責務のバランスを取り過ぎているかどうかによって左右されるだろう。

「顧客との会話の中で、これらの役割(AI担当者とデータおよび分析担当者)がますます多く登場していることは間違いありません」とチャンドラセカラン氏は語った。

2024 年 3 月 28 日、米国行政管理予算局は連邦政府機関内での AI の利用に関するガイダンスを発表しました。これには、すべての政府機関に最高 AI 責任者を任命することを義務付ける内容が含まれていました。

AIアートとAIアートに対するグレージングは​​どちらもより一般的になる

アートソフトウェアやストックフォトプラットフォームが手軽に画像を入手できるゴールドラッシュに沸く中、アーティストや規制当局は、誤報や盗難を避けるために AI コンテンツを識別する方法を模索しています。

AIアートはより一般的になりつつある

Adobe Stockは現在、AIアートを作成するためのツールを提供しており、ストック画像カタログではAIアートとしてマークされています。2024年3月18日、ShutterstockとNVIDIAは、早期アクセス版の3D画像生成ツールを発表しました。

OpenAIは最近、フォトリアリスティックなSora AIを使用した映画制作者を宣伝しました。このデモは、アーティスト擁護者から批判を受けました。その中には、元Stability AIのFairly Trained AI CEO、エド・ニュートン=レックス氏も含まれており、彼はこれを「アーティストウォッシング:少数のクリエイターから生成AIモデルに関する肯定的なコメントを集めながら、許可や報酬なしに他人の作品を使って学習させること」と呼んでいます。

2024年以降、AIアート作品に対する2つの可能な対応として、透かしとグレージングがさらに発展する可能性があります。

透かしAIアート

透かしの主要標準はコンテンツの出所と真正性に関する連合(Coalition for Content Provenance and Authenticity)によるもので、OpenAI(図A)とMetaはAI生成画像にタグを付けるためにこの連合と協力してきました。しかし、視覚的にもメタデータにも表示される透かしは簡単に削除できます。特に2024年の米国大統領選挙をめぐる誤情報の防止という点では、透かしだけでは不十分だと指摘する声もあります。

図A

DALL-E によって生成された画像のメタデータには、画像の由来が表示されます。
DALL-E によって生成された画像のメタデータには、画像の由来が表示されます。

参照:米国連邦政府と大手AI企業は昨年、透かし技術を含む一連の自主的な取り組みに合意した。(TechRepublic)

AIに対するオリジナルアートの毒殺

AIモデルがオンラインに投稿されたオリジナルアートを学習するのを防ぎたいアーティストは、シカゴ大学が開発したデータポイズニングツール「Glaze」または「Nightshade」を利用できます。データポイズニングは、AIモデルが読み取れない程度にアート作品を改変します。2024年もAIによる画像生成とアーティストのオリジナル作品の保護が引き続き重要な課題となるため、今後このようなツールがさらに登場する可能性が高いでしょう。

AIは誇大宣伝されているのか?

AIは2023年に非常に人気が高かったため、2024年にかけて過大評価されることは避けられませんでしたが、だからといって実用化されていないわけではありません。2023年後半、ガートナーは生成AIが「過大評価のピーク」に達したと宣言しました。これは、新興技術が実用化され、普及する前の誇大宣伝の頂点として知られています。このピークの後には「幻滅の谷」が続き、その後「啓蒙の坂」へと再び上昇し、最終的には生産性へと到達します。生成AIがピークか谷間にあるということは、過大評価されていることを意味すると言えるでしょう。しかし、他の多くの製品が以前にもこの誇大宣伝サイクルを経験しており、初期のブームの後、最終的に「生産性のプラトー」に達するものも少なくありません。

Tagged: