パーソナルAI

1件の記事

要約済み 1

hf-papers 1日前 3
「ハーネス工学」でAIエージェントの完了率13pt向上
SemaClaw: A Step Towards General-Purpose Personal AI Agents through Harness Engineering

研究者らがプロンプト工学を超える概念「ハーネス工学」を提唱し、オープンソースのマルチエージェント基盤SemaClawを公開。 DAGによる二相オーケストレーション・権限管理・三層コンテキスト管理を実装し、モデル固定のままタスク完了率を52.8%→66.5%に改善。モデル性能に頼らずシステム設計でエージェント能力を引き上げる新アプローチとして注目される。

解説 SemaClaw は「ハーネス工学（Harness Engineering）」を提唱するオープンソースのマルチエージェントフレームワーク。プロンプト工学を超え、エージェントを制御可能・監査可能・信頼性の高いシステムへ変えるインフラ設計を中心に据える。主な貢献は①LLMが動的にDAGを生成し決定論的スケジューラが実行する二相オーケストレーション、②内部／外部ツールを二段階で管理するPermissionBridge安全機構、③三層コンテキスト管理（作業メモリ・外部メモリ・構造化インジェクション）、④自動個人知識ベース構築Wikiスキルの4点。LangChainのTerminal Bench 2.0実験ではモデルを固定しハーネス設計のみを改善するとタスク完了率が52.8%から66.5%（+13.7pt）に向上し、ハーネスが独立した能力向上源であることを示した。OpenAI Swarm（エフェメラル型エージェント）、LangGraph（固定DAG）、AutoGen（暗黙的オーケストレーション）と比較し、柔軟性・監査可能性・永続エージェントペルソナの点で優位性を主張する。GPT-4oやGeminiとの直接比較は行われておらず、モデル非依存の設計が特徴。

マルチエージェントハーネス工学パーソナルAI オーケストレーションオープンソース