ドメイン適応VAE
要約済み 1
-
hf-papers 1日前 4医療画像超解像、VAE換装で精度が大幅向上と判明Domain-Specific Latent Representations Improve the Fidelity of Diffusion-Based Medical Image Super-Resolution
潜在拡散モデルのVAEを医療特化型「MedVAE」に置き換えるだけで、医療画像の超解像品質が大幅に向上することが実証された。 膝・脳MRIと胸部X線でPSNRが+2.91〜+3.29dB改善し、統計的有意差はp<10⁻²⁰と極めて高い。 ハルシネーション率は変わらず忠実度と独立制御できると判明し、診断精度向上への実用応用が期待される。
解説 本論文は、医療画像の潜在拡散モデル(LDM)型超解像において、汎用VAE(Stable Diffusion VAE)を医療特化型VAE(MedVAE)に置き換えることがSR品質の主要ボトルネックであることを制御実験で初めて証明した。UNetアーキテクチャ・ノイズスケジュール・学習設定をすべて固定してVAEのみ交換する単変数実験で、膝MRI・脳MRI・胸部X線の3モダリティでPSNRが+2.91〜+3.29dB向上(Cohen's d=1.37〜1.86、p<10⁻²⁰)。MedVAEは160万枚超の医療画像で事前学習されたKL正則化VAEで、SD-VAEより3〜6dB高いAE天井(エンコード→デコード時の上限PSNR)を持つ。ウェーブレット解析では改善が最細周波数帯域(HH1)に集中し、粗大構造帯域はほぼ同等であることを確認。VAEのエンコード品質がSR性能上限を予測(R²=0.67)でき、拡散モデルのチューニングより先にドメイン特化VAE選択を優先すべきという実用的指針を提示。また、ハルシネーション率は両手法で同等(Cohen's h<0.02)であり、再構成忠実度はVAEが、幻覚は拡散段がそれぞれ独立して制御することを示した。低・中所得国の低磁場MRIへの応用も示唆される。