1ステップ蒸留
要約済み 1
-
hf-papers 2日前 4小型モデルが12Bを超える1ステップ画像生成技術が登場Self-Adversarial One Step Generation via Condition Shifting
外部識別器不要の1ステップ画像生成フレームワーク「APEX」が発表された。 条件ベクトルのシフトで内部対抗信号を生成し、0.6BモデルがFLUX-Schnell 12Bを性能で上回る。 軽量モデルでの高品質生成が可能になり、画像生成AIの民主化・高速化に貢献する。
解説 APEXは拡散・フローモデルによるテキスト→画像生成を1ステップ(NFE=1)で実現する新フレームワーク。従来手法は外部識別器(GAN系)か回帰蒸留かのトレードオフがあったが、APEXは条件ベクトルにアフィン変換(c_fake = Ac + b)を施した「偽条件」ブランチをモデル内部に設け、同一ネットワークが偽分布の速度場を推定する「自己対抗」信号を生成する。理論的にはGANの勾配形式(スコア差分)と等価だが、識別器由来の不安定な標本依存重みの代わりに定数重みw=1を用い、Fisherダイバージェンス最小化に対応する。実験では0.6BモデルがFLUX-Schnell 12B(パラメータ20倍)をGenEvalスコアで上回り(0.84 vs 0.69)、Qwen-Image 20BへのLoRAチューニングによりNFE=1でGenEval 0.89を6時間で達成(50ステップ教師の0.87を超過、推論速度15.3倍)。アーキテクチャ変更不要のプラグアンドプレイ設計でLoRAと完全互換であり、大規模モデルへの実用的な適用が容易。