1ステップ蒸留

1件の記事

要約済み 1

hf-papers 2日前 4
小型モデルが12Bを超える1ステップ画像生成技術が登場
Self-Adversarial One Step Generation via Condition Shifting

外部識別器不要の1ステップ画像生成フレームワーク「APEX」が発表された。条件ベクトルのシフトで内部対抗信号を生成し、0.6BモデルがFLUX-Schnell 12Bを性能で上回る。軽量モデルでの高品質生成が可能になり、画像生成AIの民主化・高速化に貢献する。

解説 APEXは拡散・フローモデルによるテキスト→画像生成を1ステップ（NFE=1）で実現する新フレームワーク。従来手法は外部識別器（GAN系）か回帰蒸留かのトレードオフがあったが、APEXは条件ベクトルにアフィン変換（c_fake = Ac + b）を施した「偽条件」ブランチをモデル内部に設け、同一ネットワークが偽分布の速度場を推定する「自己対抗」信号を生成する。理論的にはGANの勾配形式（スコア差分）と等価だが、識別器由来の不安定な標本依存重みの代わりに定数重みw=1を用い、Fisherダイバージェンス最小化に対応する。実験では0.6BモデルがFLUX-Schnell 12B（パラメータ20倍）をGenEvalスコアで上回り（0.84 vs 0.69）、Qwen-Image 20BへのLoRAチューニングによりNFE=1でGenEval 0.89を6時間で達成（50ステップ教師の0.87を超過、推論速度15.3倍）。アーキテクチャ変更不要のプラグアンドプレイ設計でLoRAと完全互換であり、大規模モデルへの実用的な適用が容易。

テキスト→画像生成 1ステップ蒸留自己対抗学習 Flow Matching 効率的推論