OpenAI Dev Dayに参加しました。 – Generative Agents Tech Blog

吉田真吾@yoshidashingo)です。

今年10月に2年ぶりにOpenAI Dev Dayが開催されました。わたしは共同創業したGenerative Agentsの仲間とともにSan Franciscoの現地で参加してきました。

openai.com

新リリース

キーノートでSam Altmanが発表した新リリースをざっと以下にまとめます。

www.youtube.com

1. Apps in ChatGPT

すでに競争力のあるSaaSを提供している企業向けに、ユーザーがChatGPT内で自社のサービスを呼び出すことが可能になるApps in ChatGPTが発表されました。

openai.com

ChatGPTはいまや週間アクティブユーザー数が7億人に到達しています(と言ってる間にDev Dayでは「8億人」と記載されていました)。有料ビジネスユーザーは500万人であると伝えられていることから、無料だが熱心なユーザーが160倍いることになります。同業他社をはるかにしのぐユーザー規模であり、フリーミアムモデルであるChatGPTにとっては、有料ユーザーの重要性と同じくらい無料ユーザーの規模の大きさも将来的な収益の源として重要と認識しているでしょう。

そこで、OpenAIにとってはそのチャットサービスをフロントとして、Deep Researchのようにエージェンティックなアプリを作り込むことで利便性を高めることが最重要であるということです。

Apps in ChatGPTにより、たとえばSpotifyで今のムードにあった選曲をしたり、ショッピングをしたり、会話中のChatGPT画面から離れることなくリッチな体験が実現するということで、今後多くのサービサーがサポートしていくことに期待です。個人的には暇ができてNetflixを開いても何を見ようか迷うことが多いので、わたしの好みやムードに合わせて、またいくつか定点観測してるYoutuberのおすすめなどを考慮してこんな概要のビデオがあるよとオススメしてくれると嬉しいな、なんて思っていました。

2. AgentKit

OpenAIからノーコードでエージェンティックな処理を実現できるAgentKitがリリースされました。AgentKitはいくつかの機能を包含した名称であり、以下の3種類の機能で実現されています。

  • Agent Builder:マルチエージェントワークフローの作成とバージョン管理のためのビジュアル canvas
  • Connector Registry:管理者が OpenAI の製品間でデータとツールを接続する方法を管理できる一元的な場所
  • ChatKit:カスタマイズ可能なチャットベースのエージェント型エクスペリエンスを製品に組み込むためのツールキット

具体的にはChatKitでフロントにリッチなチャットUIを埋め込むことができ、そこからAgent Builderで作成したエージェントのエンドポイントを呼び出して利用することが可能になります。Agent Builderで作成したエージェントはChatGPT EnterpriseなどのユーザーであればConnector Registryで企業内のデータにアクセスして社内業務を作り込むこともできます。

openai.com

3. APIでのSora 2

直前にリリースされ、その創造性の高さや、さまざまなIPが出力できてしまうことで話題をさらったSora 2が開発者向けにAPI経由で動画生成できるように。

platform.openai.com

その後のセッションが面白かったのですが、OpenAIのソリューションエンジニアが作った動画編集ソフトのようなWebアプリを使って、

  1. ラフスケッチからImage Genを使って複数の画像を生成
  2. 生成した画像からSora 2を使って複数の動画を生成

し、それぞれのカットを組み合わせていくことで、複数のラフスケッチで想定したストーリーどおりに長編動画を作成するデモがありました。

近いうちにこの編集スタジオアプリもリリースしたいとのことで、今後Soraを使った独創的な映画がたくさんのクリエイターによって生まれる日も近いと実感しました。

www.youtube.com

4. Codex

Codexの一般提供が開始されました。と同時に、SlackやCI/CDパイプラインから実行可能な機能も提供開始しました。さらにCodex SDKを使うことで自分のシステム内にCodexを組み込むことができます。これはつまり汎用エージェントとして使うこともできるようになったという意味です。

openai.com

5. GPT-5 Pro in API

GPT-5シリーズの中でもとくに推論性能に優れたProモデルがAPIから利用可能になりました。

platform.openai.com

6. コストに優れたモデルの追加

GPT RealtimeGPT Image 1 の2つのコストに優れたテキストモデルと画像モデルがそれぞれ追加されました。

https://platform.openai.com/docs/models/gpt-realtime-mini
https://platform.openai.com/docs/models/gpt-image-1-mini

その他のセッション

今回わざわざSF現地まで行った理由が、ジョナサン・アイブとサム・アルトマンの対談セッションでした。OpenAIは今年の5月、iPhoneなどのデザインを手がけた元アップルの伝説的なデザイナー、ジョナサン・アイブが設立していたAIデバイスのスタートアップ「io社」を買収していました。そこから表立って出てくる情報はとくになかったので、これが実質パブリックな場所でOpenAIのジョナサン・アイブを見られる初めての機会でした。

一説ではあらゆるオフラインでのデータを取得して生活に役立つウェアラブルデバイス、いわゆるソシオメトリックバッジ+生成AIのような製品を開発中ではないかということで、新製品の発表があるのかと期待していました。が、肩透かしを食らった形ではありますが今回そういったデバイスの話はなし。ジョナサン・アイブの昨今の生成AIに関する解釈や、仕事の哲学を聞く時間になっていました。

www.youtube.com

その後の発信

緊急開催 OpenAI Dev Day ラップアップ

コンパクトなイベントながら割とためになる、さすがOpenAIというイベントだったので、興奮冷めやらぬうちにこんな感じで現地から感想戦の配信をしました。

generative-agents.connpass.com

Newbeeで話してます

さらに、OpenAI Dev Dayに参加した感想は、こちらのNewbeeというチャンネルでも会話しています。

www.youtube.com

ぜひご覧ください。

まとめ

OpenAIはその圧倒的なビジネス規模と、いまだにスタートアップらしい気概が同居している不思議なベンダーだというのが今回の率直な感想ですが、なによりChatGPTというBtoCのサービスをさらに便利にするために「プラットフォームとして」必要なことをしっかり優先して推進しているという印象で、向こう数年は引き続き適切なモデル能力や機能・ソリューションの提供を強力に進めてくれそうだと感じました。




元の記事を確認する

関連記事