研究者らがInternet Archiveのデータを分析したところ、2025年半ばまでに新しく作られたウェブサイトの約3分の1がAI生成・AI支援テキストを含むものとして分類されたことが分かりました。調査を行ったのはスタンフォード大学、インペリアル・カレッジ・ロンドン、Internet Archiveの研究者らで、研究結果は「The Impact of AI-Generated Text on the Internet」という論文として公開されています。
The Impact of AI-Generated Text on the Internet
https://ai-on-the-internet.github.io/
Study Finds A Third of New Websites are AI-Generated
https://www.404media.co/study-finds-a-third-of-new-websites-are-ai-generated/
研究チームによると、2025年半ばの時点で、新規公開サイトのおよそ35%がAI生成・AI支援テキストを含むものと判定されたとのこと。ChatGPTが一般公開された2022年末以前には、同様のサイトはほぼ確認されていなかったため、わずか3年ほどでAI生成・AI支援テキストがウェブ上に急速に広がったことになります。
研究の背景には、インターネット上の多くの会話や記事が人間ではなくボットや自動生成コンテンツによって作られているのではないかという「死んだインターネット理論」と呼ばれる考え方があります。死んだインターネット理論から着想を得た研究チームは、ChatGPTや競合する生成AIサービスの普及によってどれほどの文章がAI生成・AI支援テキストに置き換わり、ウェブ上の文章全体にどのような影響が出ているのかを調べました。
調査では、2022年8月から2025年5月までの33カ月間に公開されたウェブサイトのサンプルが使われました。研究チームはWayback Machineに保存された最古のスナップショットからHTMLを取得してウェブページ本文を抽出。その後、複数のAI検出ツールを比較し、最も安定した結果を示した「Pangram v3」を使ってAI生成・AI支援テキストを判定しました。
研究チームは、AI生成・AI支援テキストに対してよく語られる6つの懸念を検証しました。具体的には「視点や内容の幅が狭くなるのか」「誤情報が増えるのか」「文章が過度に明るく無難になるのか」「出典リンクが減るのか」「情報量の薄い文章が増えるのか」「個性的な文体が消えて均一な文章ばかりになるのか」です。
分析の結果、明確に裏付けられた懸念は「視点や内容の幅が狭くなる」と「文章が過度に明るく無難になる」の2つだけでした。AI生成・AI支援テキストが増えるほどウェブ上の文章は意味的に似通いやすくなり、全体としてポジティブな表現が増える傾向が確認されたとのこと。一方で、誤情報の数や外部リンクの密度、情報密度、文体の個性に関するはっきりした影響は確認されませんでした。
研究者のヨナシュ・ドレジャル氏は、最も意外だった点として「AI生成・AI支援テキストが検証可能な誤情報を増やす」という仮説が確認されなかったことを挙げています。ただし、既存のファクトチェック手法では確認しにくい主張が増えている可能性や、そもそもインターネットが最初から事実に忠実な場所ではなかった可能性は残されています。
研究チームは今後、Internet Archiveと協力してAI生成・AI支援テキストがウェブに与える影響を継続的に測定するツールを作る予定です。カテゴリ別や言語別に影響を分析することで、どの種類のウェブサイトがAI生成・AI支援テキストの影響を強く受けているのかを詳しく調べる方針とのことです。
この記事のタイトルとURLをコピーする
ソース元はコチラ
この記事は役に立ちましたか?
もし参考になりましたら、下記のボタンで教えてください。



