対話システム
要約済み 2
-
arxiv-cs-ai 3日前 3研究者ら、AI活用の能動的電子カルテ支援システムを開発A Proactive EMR Assistant for Doctor-Patient Dialogue: Streaming ASR, Belief Stabilization, and Preliminary Controlled Evaluation
医師患者対話をリアルタイム解析し電子カルテ入力を自動支援するAIシステムが発表された。 ストリーミング音声認識・信念安定化など7モジュールを統合し、F1スコア0.84を達成。 診察中の医師の記録負担を軽減し、臨床現場へのAI実装の可能性を示す成果。
解説 本論文は医師と患者の対話を診察中にリアルタイム支援する能動的EMR(電子カルテ)アシスタントを提案する。従来システムは「音声録音→情報抽出→カルテ生成」という受動的パイプラインであり、診察中の意思決定支援が欠如していた。提案システムはストリーミングASR、句読点復元(Punctuation Restoration)、ステートフル情報抽出、診断信念安定化(Belief Stabilization)、客体化検索(Objectified Retrieval)、次アクション計画、再現可能レポート生成という7モジュールを統合するエンドツーエンド構成をとる。信念安定化はリアルタイム対話中に診断仮説が頻繁に変動する問題を確率的状態管理で安定させる核心技術である。評価は10件の医師患者対話と300クエリの検索ベンチマークで行われ、state-event F1=0.84、Recall@5=0.87を達成した。診察中に医師へ次アクションを提示できる点は実用上の大きな差別化要因であり、医療現場の業務効率化と診察品質向上への貢献が期待できる。ただし評価規模が小さく、実環境での大規模臨床検証が今後の課題である。 -
arxiv-cs-ai 3日前 3警察対話からSLM訓練用ベンチマークを構築DeEscalWild: A Real-World Benchmark for Automated De-Escalation Training with SLMs
現場の警察と市民の実会話動画を基にした脱エスカレーション訓練データセット「DeEscalWild」が公開された。 5,000件の生データを人間検証とLLM評価で絞り込み、1,500件の高精度シナリオを収録。 現場の軽量ハードウェアで動くSLM向けの高品質訓練データとして、公安AI応用研究を加速させる。
解説 本論文は、警察官の脱エスカレーション(緊張緩和)スキル訓練を自動化するための実世界ベンチマークデータセット「DeEscalWild」を提案する。従来の訓練はロールプレイや講義形式が中心で、スケーラビリティとリアリティに欠けていた。LLM(大規模言語モデル)を使ったオープンエンドなシミュレーションは可能だが、その巨大な計算コストが現場での軽量・ポータブルデバイスへの展開を妨げる。そこで著者らは、計算資源の少ない環境でリアルタイム応答が可能なSLM(小規模言語モデル)に着目し、そのための高品質ドメイン特化データの不足を解消することを目指した。データ構築パイプラインでは、オープンソースの動画リポジトリから警察・市民間のやり取りを抽出した5,000件の生データから出発し、人間による検証とLLM-as-a-Judge(LLMを評価者として活用する手法)を組み合わせたハイブリッドフィルタリングにより、1,500件の高忠実度シナリオを精製した。このデータセットは現実の複雑な対話状況を反映しており、SLMのファインチューニングに活用することで現場レベルの訓練システム構築を可能にする。GPT-4oやClaudeといった既存LLMに依存しない軽量な展開経路を示す点で、法執行機関向けAI応用の実用化に向けた重要な一歩となる。