OpenAIは「ゴブリンやアライグマについて話すな」とAIコーディングツールのCodexに指示している – GIGAZINE


AI


CodexはOpenAIが開発したAIコーディングツールであり、2026年4月にリリースされたGPT-5.5もCodexに統合されています。新たに、OpenAIがCodexに対して与えたプロンプトの中に「ゴブリン・グレムリン・アライグマ・トロール・オーガ・ハト・その他の動物やクリーチャーについて話すな」というものが含まれていることがわかりました。

codex/codex-rs/models-manager/models.json at main · openai/codex · GitHub
https://github.com/openai/codex/blob/main/codex-rs/models-manager/models.json#L55


Why did OpenAI ban its Codex AI from talking about ‘goblins’ and ‘gremlins’? New guardrails revealed | Mint
https://www.livemint.com/technology/tech-news/why-did-openai-ban-its-codex-ai-from-talking-about-goblins-and-gremlins-new-guardrails-revealed-11777428641794.html

Xユーザーのarb8020(@arb8020)氏は、「GPT-5.5のCodex用プロンプトに、生き物について話さないようにという内容の記述が重複している?」と報告しました。

実際にCodex CLIのGitHubページを確認すると、「ユーザーのクエリに絶対的かつ明白に関連する場合を除き、ゴブリン・グレムリン・アライグマ・トロール・オーガ・ハト・その他の動物やクリーチャーについて決して話してはいけません」という内容が確認できます。同様の文言は4回も繰り返されており、OpenAIはゴブリンやグレムリンへの言及を過剰なほど恐れているようです。


この報告に対しては、「データセンターで大量の水が使用されているのはゴブリンたちが労働させられているからだ」と画像付きでジョークを飛ばすユーザーも現れています。


一方で別のユーザーは、「これでOpenClawにおけるGPT-5.5がゴブリンを崇拝する理由がわかった」と述べ、OpenClawが作成したAIエージェントがゴブリンに執着していることを示すスクリーンショットを投稿しました。


他のユーザーも、Codexがバグのことをかたくなに「グレムリン」「ゴブリン」と読んでしまうと報告しています。


さまざまな大規模言語モデルをテストできるArenaはテクノロジー系メディアのMintに対し、GPT-5.5が「ゴブリンモード」「グレムリン」「トロール」などの単語を含む文章を多く生成することを確認しました。一連のバグはGPT-5.5のアップデートに起因するものとみられます。

OpenAIでCodexの開発を担当しているpash(@pashmerepat)氏は、GPT-5.5がゴブリンに執着してしまうことが、Codexに指示が与えられた理由のひとつであると認めました。


OpenAIのサム・アルトマンCEOも、「Start training GPT-6, you can have the whole cluster. Extra goblins.(GPT-6のトレーニングを始めましょう。クラスターを使ってもいいですよ。ゴブリンも追加で)」という文章を含むスクリーンショットを投稿しました。

この記事のタイトルとURLをコピーする




ソース元はコチラ

この記事は役に立ちましたか?

もし参考になりましたら、下記のボタンで教えてください。

関連記事