AIエージェントが実務から自己学習、成功率74%向上

hf-blog 2026-04-11 18:21 ★3

AIエージェントが実務から自己学習、成功率74%向上

ALTK‑Evolve: On‑the‑Job Learning for AI Agents

エージェント長期記憶自己改善 IBM Research

要約

研究チームがAIエージェントの過去実行履歴から再利用可能な原則を抽出・蓄積するフレームワーク「ALTK-Evolve」を発表。 AppWorldベンチマークの難問成功率が19.1%→33.3%と大幅に改善、長期記憶による継続的な性能向上を実証。 Claude CodeやOpenAI Codexにプラグイン形式で統合可能で、実用的なエージェント開発に即座に活用できる。

解説・分析

多くのAIエージェントは過去の経験を活かせず同じ失敗を繰り返す「永遠のインターン」問題を抱えている。ALTK-Evolveは実行トレースからガイドラインを自動抽出・統合し、意思決定時に関連知識だけを注入する仕組みで、特に複雑なタスクで大きな効果を示した。Claude CodeやCodexへのプラグイン統合が既に可能で、開発者がすぐに試せる実用性の高さが特徴。エージェント開発における記憶・学習アーキテクチャの標準手法となる可能性がある。

AIフロントライン

AIエージェントが実務から自己学習、成功率74%向上

要約

解説・分析

関連する読者