3Dシーン生成

1件の記事

要約済み 1

hf-papers 10時間前 4
3D生成の新手法LaviGen、計算速度を65%高速化
Repurposing 3D Generative Model for Autoregressive Layout Generation

3D生成モデルを活用したレイアウト自動生成手法『LaviGen』が発表。 3D拡散モデルにデュアルガイダンス蒸留を組み合わせ、既存手法比で物理的妥当性19%向上・計算速度65%高速化を実現。 3Dシーン生成・建築設計・ロボット工学など多分野での実用化に期待。

解説 LaviGenは、既存の3D生成モデルを「再利用（repurpose）」するという発想で3Dレイアウト生成に取り組む研究である。従来手法の多くはGPT-4oやGeminiなどのLLMを用いてテキスト記述からオブジェクト配置を推論するため、3D幾何学的整合性や物理的制約（オブジェクト同士の重なりや浮遊など）を正確に扱えない課題があった。LaviGenはこれを解決するため、3D空間をネイティブに扱う自己回帰プロセスとしてレイアウト生成を定式化し、オブジェクト間の幾何学関係と物理制約を明示的にモデル化する。さらに、シーン全体・個別オブジェクト・自然言語指示の3種の情報を統合した適応型3D拡散モデルを提案し、「デュアルガイダンス自己ロールアウト蒸留（dual-guidance self-rollout distillation）」という新しい学習機構で空間精度と推論効率を同時に向上させている。LayoutVLMベンチマークでの評価では、物理的妥当性がSOTAより19%高く、計算時間は65%削減という顕著な成果を示した。テキスト→3D変換を不要にしたことで、インテリアデザイン・ロボティクス・ゲーム環境生成など、現実の3D空間設計への応用が期待できる。

3Dシーン生成レイアウト生成拡散モデル自己回帰モデル