Googleが古文書解読AI「Aeneas」を発表、古代ローマの碑文の欠損部分を読み解き年代推定や地域推定も可能 – GIGAZINE


Googleが古典ラテン語で記された碑文の解読に役立つAIモデル「Aeneas」を開発しました。Aeneasを使えば「欠損部分の文字数が分からない碑文」の内容を解読したり、碑文の年代や地域を推定したりできます。

Aeneas transforms how historians connect the past – Google DeepMind
https://deepmind.google/discover/blog/aeneas-transforms-how-historians-connect-the-past/

GoogleはAeneasを開発するにあたって「Epigraphic Database Roma(EDR)」「Epigraphic Database Heidelberg(EDH)」「Epigraphic Database Clauss Slaby(EDCS-ELT)」といった古文書データベースの内容を統合し、古典ラテン語で記された17万6000件の古文書を含むデータセット「Latin Epigraphic Dataset (LED)」を構築しました。

AeneasはLEDを用いてトレーニングされており、テキストだけでなく画像の入力にも対応しています。ユーザーは「碑文を文字起こししたテキスト」や「碑文の写真」を入力することでAIに碑文の欠損部分を推定や関連する碑文の探索といった作業を実行できます。


Aeneasは碑文が記された年代や地域を推定することもできます。


複数の歴史学者を対象にした実験の結果、Aeneasは「欠損部分の推定」「地域の推定」「年代の推定」という3種のタスクで歴史学者の平均を超える精度を示しました。また、「欠損部分の推定」と「地域の推定」では「歴史学者がAeneasを活用しながら推定する」というシチュエーションで最も高い精度を示しました。


Aeneasを使える無料のウェブアプリが以下のリンク先で公開されています。加えて、2022年に登場した古代ギリシャ語解読AI「Ithaca」にAeneasの成果が取り込まれたことも発表されています。

Predicting the Past | Contextualising, restoring, and attributing ancient texts
https://predictingthepast.com/aeneas


Aeneasのコードとデータセットは以下のリンク先で公開されています。

GitHub – google-deepmind/predictingthepast
https://github.com/google-deepmind/predictingthepast?tab=readme-ov-file

この記事のタイトルとURLをコピーする


ソース元はコチラ

この記事は役に立ちましたか?

もし参考になりましたら、下記のボタンで教えてください。

関連記事