機械論的推論
要約済み 1
-
hf-papers 1時間前 4研究者ら、仮想細胞でLLM幻覚を克服する自律推論エージェントを開発Towards Autonomous Mechanistic Reasoning in Virtual Cells
LLMの生物学応用を妨げる幻覚問題を解決するVCR-Agentが発表された。 知識検索と検証器を組み合わせDAG形式の機械論的説明を自律生成し、18,950件の検証済みデータで遺伝子発現予測精度を大幅改善。 仮想細胞研究へのAI活用を加速させ、創薬・疾患メカニズム解明に貢献する可能性がある。
解説 本論文はLLMを生物学的推論に応用する際の根本課題、すなわち幻覚(hallucination)と検証不能な説明、に対処する。提案手法VCR-Agentは2段階のマルチエージェントパイプラインで構成される。まずHunFlair2で生医学固有表現を抽出し、StarkPrimeKG・Harmonizome・PubMed・Wikipediaから根拠を取得してClaude 4がレポートを生成。次に同LLMが20種の機械論的アクション(結合・発現制御・表現型誘導等)からなる有向非巡回グラフ(DAG)形式の説明を構築する。生成後はDTI検証器(Boltz-2でタンパク質結合確率を評価)とDE検証器(差次発現データと照合)が誤りを自動除去し、全体の28.2%のDTI虚偽主張と87.3%の発現制御ステップの幻覚を排除した。構築されたVC-Tracesデータセット(18,950件)で訓練したモデルは、遺伝子の差次発現判定タスクでF1=0.435を達成し、STATE基盤モデル(0.257)やラベルのみのSFT(0.292)を大きく上回る。バックボーンLLM比較ではClaudeが構造妥当性100%・最高DTIスコアを示し、GPT-4.1やGemini-2.5-Flashを凌駕。数理・コーディング分野と異なり自動検証が困難な生物学推論に形式的検証枠組みを導入した点で、仮想細胞研究の信頼性基盤として重要な貢献となる。