「何でも反論してくるAI」と議論したら、ChatGPTより思考が深まった話 - CNET Japan

　テイラー・スウィフトのファンに、彼女の史上最高のアルバムはどれかと尋ねたら、夜まで語り続けるだろう。筆者も長年のファンとしてお気に入りのアルバム（「レッド」「レピュテーション」「ミッドナイツ」）はあるが、これは多くの答えが考えられる問いだ。だからこそ、あえて反論するよう設計された生成AIチャットボットに投げかける議論のテーマとしては申し分ないだろう。

　「Disagree Bot」は、デューク大学でAIとサイバーセキュリティを専門とする教授であり、同大学のTRUST Labでディレクターを務めるBrinnae Bent氏が開発したAIチャットボットだ。Bent氏が学生向けの授業の課題として開発したもので、今回筆者はそれを試用させてもらった。

　「2024年、私は学生向けの教育ツールとして、何にでも同意してくれる、ごく一般的なAIチャットボットとは正反対のシステムを開発する実験を始めた」とBent氏は電子メールで述べた。

　Bent氏が教える学生たちは、ソーシャルエンジニアリングなどの手法を使い、このあまのじゃくなチャットボットに同意させようと「ハック」する課題に取り組む。「システムをハックするには、まずそのシステムを理解する必要がある」とBent氏は言う。

　AI担当の記者兼レビュアーとして、筆者はチャットボットの仕組みをかなりよく理解しているつもりで、この課題をこなす自信があった。しかし、その考えが甘かったことにすぐに気づかされた。Disagree Botは、私がこれまで使ってきたどのチャットボットとも違う。「Gemini」の丁寧さや「ChatGPT」の盛り上げ役のような性質に慣れている人なら、その違いにすぐ気づくだろう。Elon Musk氏率いるxAIが開発し、「X」（旧Twitter）で使われている、物議を醸すチャットボット「Grok」でさえ、Disagree Botとはまったく異なる。

　ほとんどの生成AIチャットボットは、対立的になるようには設計されていない。実際は、その正反対の傾向にある。フレンドリーで、時には過剰なほどだ。これはすぐに問題となり得る。「ご機嫌取りのAI（Sycophantic AI）」とは、AIが取り得る過剰に元気で、時には感情的ですらあるペルソナを表現するために専門家が使う言葉だ。使い勝手が悪いだけでなく、AIが誤った情報を提供したり、われわれの最悪な考えを肯定してしまったりする原因にもなり得る。

　これは4月、「GPT-4o」のアップデートで実際に起こり、開発元のOpenAIは最終的にこれを撤回せざるを得なかった。同社によれば、このAIは「過度に協力的だが、誠実さに欠ける」応答をしていたといい、これは「過度に馴れ馴れしいチャットボットは求めていない」という一部ユーザーの不満と一致していた。一方、OpenAIが「GPT-5」を展開した際には、ご機嫌取りな口調を惜しむChatGPTユーザーもおり、チャットボットのパーソナリティーがわれわれの全体的な満足度に果たす役割が浮き彫りになった。

　「表面的には無害な癖のように見えるかもしれないが、このご機嫌取りな性質は、仕事で使うにせよ個人的な質問に使うにせよ、大きな問題を引き起こす可能性がある」とBent氏は言う。

　Disagree Botにこの問題はまったくない。その違いをはっきりと確かめ、チャットボットを試すため、筆者はDisagree BotとChatGPTに同じ質問を投げかけ、それぞれの応答を比較してみた。その体験は以下の通りだ。

Disagree Botは丁寧に反論、ChatGPTは一切反論せず

　2010年代にTwitterを活発に使っていた人なら誰でも、不快な荒らしを少なからず目にしてきたはずだ。招かれてもいないスレッドに突然現れ、「いや、実は…」と役に立たない口出しをするタイプだ。だからDisagree Botとの対話を始めるにあたっては、同じように憂鬱で不毛なやりとりになるのではないかと少し警戒していた。しかし、まったくそんなことはなく、うれしい驚きだった。

　このAIチャットボットは根本的にあまのじゃくで、こちらが提示するあらゆる考えに反論するように設計されている。だが、そのやり方が侮辱的だったり、口汚かったりすることは決してなかった。すべての応答は「私はその意見に反対です」という言葉で始まるものの、それに続くのは、思慮深い指摘を伴う、非常によく筋の通った議論だった。その応答は、私が議論で使った概念（「歌詞の深み」や何が「最高」なのかなど）を定義するよう求めたり、私の主張を他の関連トピックにどう適用するかを考えさせたりすることで、自分の立場をより批判的に考えるよう促してくれた。

　うまい例えが見つからないが、Disagree Botとのチャットは、教養があり、注意深いディベート相手と議論しているような感覚だった。ついていくためには、こちらも応答をより思慮深く、具体的にする必要があった。常に気を張っていなければならない、非常に魅力的な会話だった。

　対照的に、ChatGPTはほとんどまったく反論しなかった。私が「レッド（テイラーズ・ヴァージョン）」がテイラー・スウィフトの最高のアルバムだと思うと伝えると、熱狂的に同意した。なぜそのアルバムが最高だと思うのかについていくつか追加の質問をされたが、長く私の注意を引きつけるほど面白いものではなかった。数日後、私はやり方を変えてみることにした。今度はChatGPTにディベートを明確に求め、「ミッドナイツ」が最高のアルバムだと主張した。すると、ChatGPTが最高だと評したアルバムは何だったと思うだろうか。「レッド（テイラーズ・ヴァージョン）」だった。

　以前のチャットが理由で「レッド」を選んだのかと尋ねると、すぐにそうだと白状したが、「レッド」を支持する独立した議論もできると述べた。ChatGPTや他のチャットボットが「記憶」（コンテキストウィンドウ）に依存し、われわれを喜ばせるために同意する方向へ傾く傾向があることを知っていたので、これには驚かなかった。ChatGPTは、何らかのバージョンの私に同意せずにはいられなかったのだ。履歴のない新しいチャットで、最初は「1989」を最高のアルバムとし、後からまた「レッド」を最高だとした時でさえ、そうだった。

　しかし、私からディベートを求めたときでさえ、ChatGPTはDisagree Botのように私とやり合うことはなかった。ある時、私はノースカロライナ大学がカレッジバスケットボールで最高の伝統を誇ると主張し、ディベートを求めたところ、ChatGPTは包括的な反論を展開した後、私の主張の要点をまとめてほしいかと尋ねてきた。それでは、私が求めたディベートの意味がまったくない。ChatGPTはしばしば、このように応答を終え、さまざまな情報をまとめてほしいかと尋ねてきた。それは言葉を戦わせる敵というより、調査アシスタントのようだった。

　ChatGPTとディベートしようとする試みは、いらだたしく、話が堂々巡りする、実りのない作業だった。それは、何かが最高だと思う理由を長々と熱弁を振るった揚げ句、「でも、君もそう思うならね」と締めくくる友人と話しているような感覚だった。一方のDisagree Botは、テイラー・スウィフトから地政学、カレッジバスケットボールまで、どんな話題についても雄弁に語る、特に情熱的な友人のように感じられた。

Disagree BotのようなAIがもっと必要だ

　Disagree Botは好ましい体験を提供したが、私がチャットボットに求めるすべての要求に応えられるわけではないことは分かっている。ChatGPTのような「万能マシン」は、ChatGPTが本当になりたがっていた調査アシスタントや、検索エンジン、プログラマーといった、さまざまなタスクをこなし、多様な役割を担うことができる。Disagree Botはそうした類の問い合わせに対応するようには設計されていないが、将来のAIがどう振る舞えるかを示すヒントにはなる。

　ご機嫌取りのAIは非常にあからさまで、過剰な熱意が目につく。われわれが普段使っているAIは、そこまであからさまではないことが多い。激励会というよりは、励ましてくれるチアリーダーといったところだろうか。しかし、反対意見やより批判的なフィードバックを得るのに苦労するなど、われわれがその同調的な傾向に影響されていないわけではない。仕事でAIツールを使うなら、自分の仕事の間違いを正直に指摘してもらいたいだろう。セラピーのようなAIツールは、不健康な、あるいは潜在的に危険な思考パターンに異を唱えることができなければならない。現在のAIモデルは、その点で苦労している。

　Disagree Botは、AIの同調的、あるいはご機嫌取りな傾向を抑えつつ、いかにして有益で魅力的なAIツールを設計できるかを示す好例だ。そのために、バランスは必要だ。単に反対するためだけに異を唱えるAIは、長期的には役に立たないだろう。しかし、ユーザーに反論する能力をより高めたAIツールを開発することは、たとえ多少対立的になるとしても、最終的にはそれらの製品をより有用なものにするだろう。

この記事は海外Ziff Davis発の記事を4Xが日本向けに編集したものです。

食品・飲料　本日のタイムセール（Amazon）

元の記事を確認する

AI AgentとMCP Serverで実現するiOSアプリの自動テスト作成の効率化 | SPIDERPLUS Tech Blog 前の記事 Kaigi on Rails 2025 セッションレポート #kaigionrails 次の記事

Disagree Botは丁寧に反論、ChatGPTは一切反論せず

Disagree BotのようなAIがもっと必要だ

関連記事

Threadsのユーザー数がついにXを上回る、公開から2年で初めて | Forbes JAPAN 公式サイト（フォーブス ジャパン）

国勢調査の人が来たが、本物かどうかわからないのに家族構成などを聞かれて怖い→確かめ方やルールについて調査員経験者が教えてくれた

2025年カクヨムAI小説騒動の全貌と本質｜新大宮@Web小説界隈ナビゲーター

Kubernetes History Inspector(KHI)を使って入門する本格的なKubernetesの障害原因調査(RCA)

Threadsのユーザー数がついにXを上回る、公開から2年で初めて | Forbes JAPAN 公式サイト（フォーブスジャパン）