公安・法執行

1件の記事

要約済み 1

arxiv-cs-ai 3日前 3
警察対話からSLM訓練用ベンチマークを構築
DeEscalWild: A Real-World Benchmark for Automated De-Escalation Training with SLMs

現場の警察と市民の実会話動画を基にした脱エスカレーション訓練データセット「DeEscalWild」が公開された。 5,000件の生データを人間検証とLLM評価で絞り込み、1,500件の高精度シナリオを収録。現場の軽量ハードウェアで動くSLM向けの高品質訓練データとして、公安AI応用研究を加速させる。

解説本論文は、警察官の脱エスカレーション（緊張緩和）スキル訓練を自動化するための実世界ベンチマークデータセット「DeEscalWild」を提案する。従来の訓練はロールプレイや講義形式が中心で、スケーラビリティとリアリティに欠けていた。LLM（大規模言語モデル）を使ったオープンエンドなシミュレーションは可能だが、その巨大な計算コストが現場での軽量・ポータブルデバイスへの展開を妨げる。そこで著者らは、計算資源の少ない環境でリアルタイム応答が可能なSLM（小規模言語モデル）に着目し、そのための高品質ドメイン特化データの不足を解消することを目指した。データ構築パイプラインでは、オープンソースの動画リポジトリから警察・市民間のやり取りを抽出した5,000件の生データから出発し、人間による検証とLLM-as-a-Judge（LLMを評価者として活用する手法）を組み合わせたハイブリッドフィルタリングにより、1,500件の高忠実度シナリオを精製した。このデータセットは現実の複雑な対話状況を反映しており、SLMのファインチューニングに活用することで現場レベルの訓練システム構築を可能にする。GPT-4oやClaudeといった既存LLMに依存しない軽量な展開経路を示す点で、法執行機関向けAI応用の実用化に向けた重要な一歩となる。

データセット公安・法執行 SLM 対話システム