医療画像超解像、VAE換装で精度が大幅向上と判明

hf-papers 2026-04-15 11:05 ★4

医療画像超解像、VAE換装で精度が大幅向上と判明

Domain-Specific Latent Representations Improve the Fidelity of Diffusion-Based Medical Image Super-Resolution

医療画像超解像潜在拡散モデルドメイン適応VAE MRI 胸部X線

要約

潜在拡散モデルのVAEを医療特化型「MedVAE」に置き換えるだけで、医療画像の超解像品質が大幅に向上することが実証された。膝・脳MRIと胸部X線でPSNRが+2.91〜+3.29dB改善し、統計的有意差はp<10⁻²⁰と極めて高い。ハルシネーション率は変わらず忠実度と独立制御できると判明し、診断精度向上への実用応用が期待される。

解説・分析

本論文は、医療画像の潜在拡散モデル（LDM）型超解像において、汎用VAE（Stable Diffusion VAE）を医療特化型VAE（MedVAE）に置き換えることがSR品質の主要ボトルネックであることを制御実験で初めて証明した。UNetアーキテクチャ・ノイズスケジュール・学習設定をすべて固定してVAEのみ交換する単変数実験で、膝MRI・脳MRI・胸部X線の3モダリティでPSNRが+2.91〜+3.29dB向上（Cohen's d=1.37〜1.86、p<10⁻²⁰）。MedVAEは160万枚超の医療画像で事前学習されたKL正則化VAEで、SD-VAEより3〜6dB高いAE天井（エンコード→デコード時の上限PSNR）を持つ。ウェーブレット解析では改善が最細周波数帯域（HH1）に集中し、粗大構造帯域はほぼ同等であることを確認。VAEのエンコード品質がSR性能上限を予測（R²=0.67）でき、拡散モデルのチューニングより先にドメイン特化VAE選択を優先すべきという実用的指針を提示。また、ハルシネーション率は両手法で同等（Cohen's h<0.02）であり、再構成忠実度はVAEが、幻覚は拡散段がそれぞれ独立して制御することを示した。低・中所得国の低磁場MRIへの応用も示唆される。

深掘り分析

🔒

この分析はProプラン限定です

Proプランに登録 →

原文を読む → https://huggingface.co/papers/2604.12152

← 一覧に戻る

AIフロントライン