AI学習目的のスクレイピングに対して利用条件や利用料金を通知する仕組み「RSL」が開発される、すでにYahoo・Reddit・オライリーなどが採用を表明 – GIGAZINE


AIの開発には膨大なデータが必要であり、AI開発企業はインターネット上に存在するありとあらゆる情報を自動ボット(スクレイパー)を用いて収集しています。このスクレイパーに対して利用条件や利用料金を提示できる仕組み「Really Simple Licensing(RSL)」が開発されました。開発にはRSSの開発陣やO’Reilly Mediaの創業者であるティム・オライリー氏などが関わっており、すでにYahooやReddit、O’Reilly Media、Quora、Mediumなどのサービスが採用を表明しています。

RSL
https://rslstandard.org/

New RSL Web Standard and Collective Rights Organization Automate Content Licensing for the AI-First Internet and enable Fair Compensation for Millions of Publishers and Creators | RSL
https://rslstandard.org/press/rsl-standard

ウェブ開発者はRSLを用いることで「AIトレーニングへの使用を禁止する」「AIトレーニングへの使用を制限なしで許可する」「利用料金を支払う場合はAIトレーニングへの使用を許可する」といったポリシーをスクレイパーに通知できるようになります。RSLをウェブサイトに組み込む手順は簡単で、ルートディレクトリにライセンス条項を記した「license.xml」を配置し、license.xmlの位置をrobots.txtに追加するだけでOKです。詳しい手順やライセンス条項のテンプレートは以下のリンク先にまとまっています。

Getting Started | RSL
https://rslstandard.org/guide/getting-started


また、RSLはウェブサイト内の各ページに適用することも可能。さらに、RSSフィードにRSLを追加することで、RSSフィードを「ライセンス可能なデジタル資産の標準化されたカタログ」として扱うこともできます。

Adding RSL to RSS feeds | RSL
https://rslstandard.org/guide/rss-feeds


RSLの運営委員会にはRSSの共同開発者であるエカルト・ワルサー氏とラマナサン・V・グハ氏のほかに、O’Reilly Mediaの創業者であるティム・オライリー氏やFastlyの共同開発者であるサイモン・ウィストウ氏らが名を連ねています。


また、すでに「Reddit」「People Inc.」「Yahoo」「Internet Brands」「Ziff Davis」「wikiHow」「O’Reilly Media」「Medium」「The Daily Beast」「Miso.AI」「Raptive」「Ranker」「Evolve Media」といったパブリッシャーがRSLの採用を表明しています。


ただし、RSLはあくまでスクレイパーに対してライセンス条項を通知するための機能であり、スクレイパーがライセンス条項を考慮するか否かは未知数です。実際に、AI企業がウェブサイトによるクロール禁止指示を無視して情報を収集していた事例も報告されています。

Cloudflareが「Perplexityがステルス戦術を使ってクロール禁止命令を無視している」と非難 – GIGAZINE

この記事のタイトルとURLをコピーする


ソース元はコチラ

この記事は役に立ちましたか?

もし参考になりましたら、下記のボタンで教えてください。

関連記事