リアルタイム動画生成AI「LongLive-2.0」をNVIDIAが公開、FP4量子化を想定した学習により軽量かつ高品質な生成を実現 – GIGAZINE

2026年05月25日 13時05分
AI

NVIDIAのAI研究チームが動画生成AIモデル「LongLive-2.0」を公開しました。LongLive-2.0はリアルタイム生成および長時間にわたる一貫した動画生成を目的として開発されたモデルで、NVFP4での量子化を念頭に設計することで省メモリかつ高精度な動画生成を実現しています。

LongLive-2.0
https://nvlabs.github.io/LongLive/LongLive2/

LongLive 2.0 – YouTube

AIモデルは「量子化」と呼ばれる技術を用いることでメモリ使用量を削減することができます。NVIDIAのBlackwell世代以降のGPUはFP4に量子化したAIモデルを実行できるのですが、既存のAIモデルの場合はFP4に量子化した際の品質低下が課題となっていました。LongLive-2.0はトレーニングの段階からNVFP4での量子化を念頭に設計されており、メモリ使用量を削減しつつ品質低下も抑えることができます。

以下の画像は左側がBF16精度、右側はNVFP4精度での動画生成結果を示しています。NVFP4精度だとテクスチャーの質感が粗くなっていますが、プロンプトの指示は守れています。

NVFP4量子化版のLongLive-2.0はメモリ使用量が19.4GBに抑えられており、生成速度はベースモデルと比べて1.84倍に高速化しています。

ベースモデルとNVFP4量子化版の生成結果の差はLongLive-2.0のプロジェクトページに掲載された作例で確認できます。

LongLive-2.0は「ベースモデル」「NVFP4量子化版の4ステップ生成モデル」「NVFP4量子化版の2ステップ生成モデル」の3種類がオープンモデルとして公開されています。ライセンスはNVIDIA Open Model Licenseです。

Efficient-Large-Model/LongLive-2.0-5B · Hugging Face
https://huggingface.co/Efficient-Large-Model/LongLive-2.0-5B

Efficient-Large-Model/LongLive-2.0-5B-NVFP4-S4 · Hugging Face
https://huggingface.co/Efficient-Large-Model/LongLive-2.0-5B-NVFP4-S4

Efficient-Large-Model/LongLive-2.0-5B-NVFP4-S2 · Hugging Face
https://huggingface.co/Efficient-Large-Model/LongLive-2.0-5B-NVFP4-S2

この記事のタイトルとURLをコピーする

ソース元はコチラ

この記事は役に立ちましたか？

もし参考になりましたら、下記のボタンで教えてください。

テックニュース

AI生成写真が「現実と虚構」の区別を不可能にしているため現実を守るには法規制やAI透かしが必要だという主張 - GIGAZINE 前の記事金がさびることのない原子レベルの理由が解明される次の記事

関連記事

2026年3月26日のヘッドラインニュース – GIGAZINE

オープンソースソフトの「MinIO」がDockerイメージの無料配布を停止し大炎上 – GIGAZINE

Appleユーザー向けのGame CenterがXbox風のゲームアプリに置き換わる予定 – GIGAZINE

YouTube TVに1画面で4番組同時視聴などのカスタムが可能なマルチビュー機能正式導入 – GIGAZINE

アメリカ政府高官が使用していたSignalやWhatsAppの改造版アプリ「TeleMessage」がハッキングされてチャットや連絡先が漏洩 – GIGAZINE

OpenAIが動画生成AI「Sora 2」を発表、同時リリースのiOS向けソーシャルアプリ「Sora」ではSora 2で自分や友人の顔から動画を生成可能 – GIGAZINE