要約
研究チームが拡散型VLMを1ステップ推論に蒸留した医療AI「ECHO」を発表。 直接条件付き蒸留(DCD)でバイアスを解消し、レポート品質を維持しつつ推論を8倍高速化。 放射線科の診断業務効率化に直結し、医療現場へのAI実装を加速する成果として注目される。
公式ソースだけを集めたAIニュースを日本語要約でお届け
ECHO: Efficient Chest X-ray Report Generation with One-step Block Diffusion
研究チームが拡散型VLMを1ステップ推論に蒸留した医療AI「ECHO」を発表。 直接条件付き蒸留(DCD)でバイアスを解消し、レポート品質を維持しつつ推論を8倍高速化。 放射線科の診断業務効率化に直結し、医療現場へのAI実装を加速する成果として注目される。
ECHOはGemini3-ProやQwen3-Maxなどの大規模モデルを凌駕する胸部X線レポート自動生成手法。従来の自己回帰型VLMは逐次デコードで低速、拡散モデルも多段ノイズ除去が必要という課題に対し、3段階訓練パイプラインで解決する。①Lingshu-7Bを医療データで継続事前学習、②Response-Asymmetric Diffusion(RAD)でブロック拡散モデルに変換(学習FLOPsを72.3%削減)、③Direct Conditional Distillation(DCD)で教師モデルの多段推論軌跡から非分解型の監督信号を構築し1ステップ推論に蒸留。DCDはトークン独立予測に起因するミーンフィールドバイアス(トークン間依存性の欠如)を、教師の高信頼トークンをコンテキストとして利用する結合分布蒸留で克服する点が核心。MIMIC-CXR・CheXpert-Plus・ReXGradientの3データセットで、自己回帰SOTA比RaTEScore64.33%・SemScore60.58%の改善を達成しつつ推論を8倍高速化、品質劣化はわずか2〜5%に抑制。MedGemma-27Bなど大型モデルも大幅に上回り、医療AI実用化への重要な基盤を提供する。