VAE不要で画像生成できるオープンモデル「SenseNova U1」が登場、Z-Imageより圧倒的に高速で品質も上々 – GIGAZINE

2026年04月30日 18時19分
AI

中国企業のSenseTimeが画像生成AI「SenseNova U1」をオープンモデルとして公開しました。SenseNova U1は既存の高性能オープンモデルより軽量かつ高性能なのが特徴で、画像生成と画像編集の両方に対応しています。また、インフォグラフィックや連続性のある画像の生成も可能です。

SenseTime Fully Open-Sources SenseNova U1: A Unified Model for Understanding and Generation-News and Blog-SenseTime
https://www.sensetime.com/en/news-detail/51170629

GitHub – OpenSenseNova/SenseNova-U1: SenseNova-U series: Native Unified Paradigm with NEO-Unify from the First Principles · GitHub
https://github.com/OpenSenseNova/SenseNova-U1

既存の画像生成AIは「ノイズから画像を生成する拡散モデル」「プロンプトのテキストと画像の橋渡しを担うテキストエンコーダー」「人間用の画像とAI用の画像の変換処理を担うVAE」といった複数のAIモデルを連携させて画像を生成しています。以下の画像はZ-Image-Turboで画像を生成するためのComfyUIワークフローの一部で、拡散モデルとして「z_image_turbo_bf16.safetensors」、テキストエンコーダーとして「qwen_3_4b.safetensors」、VAEとして「ae.safetensors」を読み込んでいることが分かります。

SenseTimeによると、複数のモデルを連携させる生成方式では「モデル間でデータを受け渡す際に完全性が損なわれる」という問題があるとのこと。各種画像生成モデルは問題を緩和するためにモデルの規模を大きくしています。SenseNova U1はVAEやテキストエンコーダーを必要とせず、単一モデルを生成処理を実行できるように設計されており、モデルの規模を既存モデルより小さく抑えつつ生成画像の品質を高くすることに成功しています。