
AMDが世界モデルの「Micro-World」をオープンモデルとして公開しました。Micro-WorldはAMDのAI特化GPU「Instinct MI325X」を用いてトレーニングされており、自由に移動可能なインタラクティブ動画を生成することができます。
Micro-World: First AMD Open-Source World Models for Interactive Video Generation — ROCm Blogs
https://rocm.blogs.amd.com/artificial-intelligence/micro-world/README.html
Micro-Worldは動画生成AIのWan 2.1をベースに6000本以上のマインクラフトのプレイ動画などを用いて開発された世界モデルで、キーボードやマウス操作で自由に移動可能な3D世界を構築することができます。テキストから世界を構築する「Micro-World-T2W」と、画像およびテキストから世界を構築する「Micro-World-I2W」の2種類が用意されています。
以下の画像をクリックするとMicro-World-T2Wで構築した世界を動き回る実例動画を確認できます。
実写風の世界も構築可能。
Micro-World-I2Wでは1枚の画像とテキストをもとに画像の続きの世界を生成できます。
Micro-World-T2WとMicro-World-I2Wのモデルデータは以下のリンク先で公開されています。
amd/Micro-World-T2W · Hugging Face
https://huggingface.co/amd/Micro-World-T2W
amd/Micro-World-I2W · Hugging Face
https://huggingface.co/amd/Micro-World-I2W
関連するコードとデータセットも公開されています。AMDはInstinctシリーズの学習および推論性能の高さをアピールするとともに、モデルやデータセットを公開することで世界モデルに関する研究の加速に寄与する姿勢を見せています。また、今後もMicro-Worldの拡張を続けて「リアルタイムで3D空間を生成できる世界モデル」の実現を目指すとのことです。
GitHub – AMD-AGI/Micro-World: For world model code developing and releasing.
https://github.com/AMD-AGI/Micro-World
amd/Micro-World-MC-Dataset · Datasets at Hugging Face
https://huggingface.co/datasets/amd/Micro-World-MC-Dataset
この記事のタイトルとURLをコピーする
ソース元はコチラ
この記事は役に立ちましたか?
もし参考になりましたら、下記のボタンで教えてください。


