知識管理
要約済み 1
-
hf-papers 1日前 4新手法「Corpus2Skill」、従来RAGを全指標で凌駕Don't Retrieve, Navigate: Distilling Enterprise Knowledge into Navigable Agent Skills for QA and RAG
研究チームがドキュメントを階層的スキルツリーに変換するエージェント型RAG手法「Corpus2Skill」を発表。 エージェントが能動的にナビゲートする仕組みで、密ベクトル検索・RAPTORなど既存手法を全指標で上回る性能を達成。 企業ナレッジベースのQA精度向上に直結し、RAG設計の新たな方向性を示す成果として注目される。
解説 Corpus2Skillは、ドキュメントコーパスをオフラインで階層的スキルディレクトリに変換するシステム。コンパイルパイプラインは文書を反復クラスタリングし、各階層でLLMが要約を生成、木構造のナビゲーブルなスキルファイルとして永続化する。サービス時にLLMエージェントはコーパス全体の俯瞰ビューを受け取り、段階的に詳細な要約を辿ってトピックブランチを深掘りし、IDで全文書を直接取得できる。この設計により、エージェントはどこを探すべきかを推論でき、非生産的なパスからバックトラックし、複数ブランチの証拠を組み合わせることが可能となる。従来のRAGがLLMを検索結果の受動的消費者として扱うのに対し、本手法はエージェントをアクティブなナビゲーターとして機能させる点が新規性。Wixの企業顧客サポートQAベンチマーク「WixQA」で密ベクトル検索・RAPTOR・エージェントRAGを全品質指標で上回った。企業内ナレッジベースへの実用応用が期待される。