検索エンジンと企業の文章作成支援に関しては、OpenAIが最有力候補であり、同社は昨日、言語モデルの最新版であるGPT-4を発表した。
GPT-4は現在、ChatGPT PlusとAPIとして利用可能で、開発者はウェイティングリストに登録できます。これは、最高かつ最も柔軟性の高いライティングAIの提供を目指して各組織がしのぎを削るAI戦争に、新たな武器を投入することになります。
GPT-4は推論能力を向上させる
OpenAIは、この新しい自然言語モデルをデモンストレーションし、「シンデレラのあらすじを、AからZまでのアルファベットの次の文字で始まり、文字を重複させない文章で説明せよ」という課題を提示しました。これは、AIが単純な文章を生成するだけでなく、ある程度の推論も行えることを示す巧妙な問題ですが、オフィスではどのような役割を果たすのでしょうか?
OpenAIは発表の中で、GPT-4は創造的なタスクと技術的なタスクの両方に対応できると述べています。この新しいモデルは、個々の人の文章スタイルをマッチングできるだけでなく、語調や口調に関する指示も受けることができます。デモにおけるGPT-4の回答の一部はより単純化されており、オッカムの剃刀をスケジューリング問題に適用しています。この新しいニュアンスは、カスタムビルドされたMicrosoft Azure AIスーパーコンピューターでのトレーニングによって部分的に実現されています。

具体的には、GPT-4は大規模なマルチモーダルディープラーニングモデルと呼ばれ、画像とテキストの両方の入力を受け取り、テキスト出力を生成します。OpenAIの製品には様々なバージョンがあり、その違いにご注目ください。ChatGPTはGPT-3をベースにした人気のチャットボットです。一方、GPT-3.5はGPT-4の最初のドラフトであり、約1年前に学習が開始されました。
参照: Salesforce による ChatGPT の活用方法 (TechRepublic)
GPT-3とGPT-4の能力の正確な違いを測定することは困難です。OpenAI自身も認めているように、その違いは「微妙」です。OpenAIは、高校のAPクラスの最後に実施されるテストや統一司法試験など、様々な学力テストにGPT-4とGPT-3の両方を投入することで、GPT-4の進歩を追跡しました。その結果、GPT-4は概して高いスコアを獲得しました。詳細については、完全な技術レポートをご覧ください。
OpenAIがより「事実に基づいた回答」を目指す方法
このような自然言語AIに対するよくある批判の一つは、生成される結果が人間の話し言葉のように聞こえる傾向があるものの、内容の実際の事実に基づいていない、つまり正確性をチェックしていないという点です。OpenAIはこの点を認識しているようで、「GPT-4は内部評価においてGPT-3.5よりも事実に基づいた回答を生成する可能性が40%高い」と述べています。
GPT-4は、「禁止コンテンツへのリクエストに応じる」可能性も82%低くなっています。禁止コンテンツには、ヘイトスピーチ、わいせつ、危害を加えると脅す内容、その他職場での使用にふさわしくない会話トピックなどが含まれます。また、モデルが学習に使用したインターネット上のテキストから拾い上げた可能性のある「高リスクの政府による意思決定」や法執行機関による意思決定も正式に禁止されています。
これらを回避するため、OpenAIはChatGPTのユーザーから提出されたフィードバックを活用し、安全性とセキュリティ分野のAI専門家も採用しました。しかし、OpenAIは、このモデルの大きな問題の一つとして、依然として「社会的バイアス、幻覚、そして敵対的なプロンプト」を吐き出す傾向があることを指摘しています。
興味深いことに、そのプロセスの一部には AI 自体が関与していました。
「GPT-4を使用して、モデルの微調整のためのトレーニングデータを作成し、トレーニング、評価、監視全体で分類器を反復処理しました」とOpenAIは書いています。
OpenAI はまた、AI パフォーマンスの評価フレームワークである OpenAI Evals のオープンソース コードも公開し、誰でも基準を確認して問題を報告できるようにしています。
GPT-4 はビジネスリーダーにとって何を意味するのでしょうか?
ビジネスリーダーは、従業員にどの自然言語AIサービスをどの程度、あるいはどの程度利用させるか、あるいは推奨するかを決定したいと考えるかもしれません。ChatGPTはこれまで、言語学習アプリDuolingo、視覚アクセシビリティアプリBe My Eyes、資産運用会社モルガン・スタンレーなど、自社製品を導入している様々な企業からフィードバックを得てきました。
Microsoft は約 5 週間にわたって、Bing 検索エンジンの裏で GPT-4 を実行してきました。
GPT-4 は大きな前進でしょうか、それとも古いアイデアを新しい形で表現したものでしょうか?
GoogleとMicrosoftは、検索機能へのAI搭載をめぐって激しい競争を繰り広げています。GoogleのBard AIはまもなくテストグループに公開される予定で、MicrosoftのBingは2月からChatGPTと提携しています。Googleの資金援助を受ける生成AI企業Anthropicも、自然言語モデル「Claude」でこの競争に参入しています。
Googleが先頭を走りながらもプレッシャーも感じている中、AIのトレンドが今後どこへ向かうのか予測するのは困難です。あなたのビジネスにとって、AI導入に踏み切るべきか、それとも待つべきか?それは、AIアシスタントの用途によって決まるかもしれません。どこで時間を節約できるのか、どこで邪魔になるのか?結局のところ、これらの機能の中には、Microsoftの失われた、そして多くのミームを生み出したClippyの、より柔軟でリソースを大量に消費するバージョンのように聞こえるものもあるのです。