パーソナルAI
要約済み 1
-
hf-papers 1日前 3「ハーネス工学」でAIエージェントの完了率13pt向上SemaClaw: A Step Towards General-Purpose Personal AI Agents through Harness Engineering
研究者らがプロンプト工学を超える概念「ハーネス工学」を提唱し、オープンソースのマルチエージェント基盤SemaClawを公開。 DAGによる二相オーケストレーション・権限管理・三層コンテキスト管理を実装し、モデル固定のままタスク完了率を52.8%→66.5%に改善。 モデル性能に頼らずシステム設計でエージェント能力を引き上げる新アプローチとして注目される。
解説 SemaClaw は「ハーネス工学(Harness Engineering)」を提唱するオープンソースのマルチエージェントフレームワーク。プロンプト工学を超え、エージェントを制御可能・監査可能・信頼性の高いシステムへ変えるインフラ設計を中心に据える。主な貢献は①LLMが動的にDAGを生成し決定論的スケジューラが実行する二相オーケストレーション、②内部/外部ツールを二段階で管理するPermissionBridge安全機構、③三層コンテキスト管理(作業メモリ・外部メモリ・構造化インジェクション)、④自動個人知識ベース構築Wikiスキルの4点。LangChainのTerminal Bench 2.0実験ではモデルを固定しハーネス設計のみを改善するとタスク完了率が52.8%から66.5%(+13.7pt)に向上し、ハーネスが独立した能力向上源であることを示した。OpenAI Swarm(エフェメラル型エージェント)、LangGraph(固定DAG)、AutoGen(暗黙的オーケストレーション)と比較し、柔軟性・監査可能性・永続エージェントペルソナの点で優位性を主張する。GPT-4oやGeminiとの直接比較は行われておらず、モデル非依存の設計が特徴。