ChatGPTが「ネイティブマルチモーダル」GPT-4oでアップグレード

ChatGPTが「ネイティブマルチモーダル」GPT-4oでアップグレード

5月13日に行われたOpenAIの春のアップデートライブストリームでは、AI企業から3つの大きな発表がありました。

  • GPT-4oと呼ばれる新しい主力AIモデル。
  • macOS 用のデスクトップ ChatGPT アプリ。
  • サブスクリプション料金を支払っていない ChatGPT ユーザーは、より多くの機能を無料で利用できるようになりました。

OpenAIの最高技術責任者であるミラ・ムラティ氏はライブストリームの中で、ChatGPTへの今後の変更により「無料ユーザーを含むすべての人にGPT-4レベルのインテリジェンスがもたらされる」と述べた。

OpenAIのCTOミラ・ムラティ氏が5月13日のライブ配信で講演。画像:TechRepublicのスクリーンショット

GPT-4oはGPT-4 Turboの音声およびビデオ機能を改良しました。

ムラティ氏によると、OpenAIの次期フラッグシップモデルGPT-4oはGPT-4と比較して「高速」で、「テキスト、画像、音声の全域で機能が向上している」という。「o」は「omni(全方位)」を意味する。

GPT-4oは前身のGPT-4 Turboよりも応答速度が速く、英語以外の言語、動画、音声の解析能力が向上しています。ムラティ氏によると、GPT-4oはGPT-4 Turboと比べて2倍高速で、50%安価、そして5倍のレート制限を備えています。OpenAIのCEO、サム・アルトマン氏は本日Xで、GPT-4oは「ネイティブにマルチモーダル」であり、音声、テキスト、動画の解析をより高速に切り替えることができると述べました。

GPT-4oはChatGPT内で無料で利用可能で、今後数週間かけて世界中のユーザーに展開されます。ChatGPT PlusおよびTeamユーザーはまずGPT-4oを利用でき、Enterpriseユーザーへの提供は「近日開始」とOpen AIは述べています。有料版ChatGPTユーザーは、最大5倍の容量制限が適用されます。GPT-4oはChatGPT APIでも利用可能になります。

ライブストリームで行われたChatGPTアプリでのGPT-4oのリアルタイム音声機能のデモは、非常に自然な音声で、モデルが中断された際にシームレスに応答する様子もいくつか見られました。ChatGPTは時折、どの画像を見ているのかを判別するのに苦労することもありましたが、その応答性は驚くほどでした。

同社は、噂されていた次世代モデルGPT-5を春のアップデートでリリースしないことを明らかにした。ムラティ氏は、今後のリリースに関するさらなる情報は「近いうちに」発表される可能性があると述べた。

GPT-4oに関する安全性の考慮事項

OpenAIは、GPT-4oには「音声出力にガードレールを提供するための新たな安全システム」が搭載されていること、さらにChatGPTが不適切または危険な発言をしないように、トレーニング後の徹底的なフィルタリングとトレーニングデータのフィルタリングが施されていることを人々に保証しました。GPT-4oは、OpenAIの内部準備フレームワークとAIガバナンスへの自主的なコミットメントに従って構築されました。GPT-4oは、リリース前に70名を超える外部セキュリティ研究者によるレッドチームテストを受けました。

参照:世界中の組織が、AIを使って作成された誤情報やディープフェイクを削減するために、コンテンツ認証情報などの標準規格を採用しています。(TechRepublic) 

新しいChatGPTデスクトップアプリがmacOSに登場

macOSユーザーはまもなくChatGPTデスクトップアプリケーションをダウンロードできるようになります。ChatGPT Plusユーザーは本日からデスクトップアプリにアクセスできますが、その他の無料および有料ユーザーは「今後数週間以内」にアクセスできるようになるとOpenAIは述べています。

macOS用ChatGPTデスクトップアプリケーションのこのUIは、ユーザーがコードを操作している間、ChatGPTがリスニングしている様子を示しています。画像:OpenAI

リフレッシュされたUI

新しい ChatGPT デスクトップ アプリケーションと同時に、ChatGPT アプリとデスクトップ バージョンには、使いやすさを向上させるための新しい、よりクリーンな UI が導入されます。

ChatGPTのブラウザ版UIが刷新され、ユーザー設定メニューの位置が変更され、アイコンが整理されました。プロンプトバー内にファイルを添付できる場所が追加されました。画像:OpenAI

GPTストアとその他の機能がChatGPTユーザーに無料で開放されました

5 月 13 日より、ChatGPT ユーザーは有料プランに加入していない人向けに次の展開を目にすることになります。

  • GPT-3.5 の代わりに GPT-4 を使用します。
  • GPT-4o は ChatGPT モデルと Web の両方からデータを取得できます。
  • ChatGPT はグラフ内のデータを分析し、新しいグラフを作成できます。
  • ChatGPT はユーザーがアップロードした写真についてチャットできます。
  • 無料レベルのユーザーはテキスト ファイルをアップロードすることができ、ChatGPT はそれを要約、分析、または新しいコンテンツを作成することができます。
  • 無料レベルのユーザーは、GPT ストアで GPT を検索して使用できます。
  • 無料レベルのユーザーは ChatGPT のメモリ機能を利用できます。この機能により、モデルは同じユーザーとの以前の会話を記憶できます。

GPT-4oが激しい競争の中で登場

今日、ビジネスユーザーにとってAIアシスタントの選択肢は豊富です。Googleは、OpenAIが5月13日にChatGPT音声アシスタントのデモを行った後、すぐに独自のアシスタントを発表しました。5月21日には、リアルタイムで物事を「見て」記憶する能力を持つGeminiアシスタントの動画を公開しました。このアシスタントは、「メガネをオフィスに忘れたかな?」といった質問に答えられる可能性があります。一方、MicrosoftはAI搭載PCに全力で取り組んでおり、Copilotをデバイスに搭載しています。GPT-4oの軽快な音声認識が成功するには、有用性と正確性で他社と差別化する必要があります。

この記事は、OpenAI の競合他社を含めるように更新されました。

Tagged: