要約
研究チームがAIエージェントの過去実行履歴から再利用可能な原則を抽出・蓄積するフレームワーク「ALTK-Evolve」を発表。 AppWorldベンチマークの難問成功率が19.1%→33.3%と大幅に改善、長期記憶による継続的な性能向上を実証。 Claude CodeやOpenAI Codexにプラグイン形式で統合可能で、実用的なエージェント開発に即座に活用できる。
公式ソースだけを集めたAIニュースを日本語要約でお届け
ALTK‑Evolve: On‑the‑Job Learning for AI Agents
研究チームがAIエージェントの過去実行履歴から再利用可能な原則を抽出・蓄積するフレームワーク「ALTK-Evolve」を発表。 AppWorldベンチマークの難問成功率が19.1%→33.3%と大幅に改善、長期記憶による継続的な性能向上を実証。 Claude CodeやOpenAI Codexにプラグイン形式で統合可能で、実用的なエージェント開発に即座に活用できる。
多くのAIエージェントは過去の経験を活かせず同じ失敗を繰り返す「永遠のインターン」問題を抱えている。ALTK-Evolveは実行トレースからガイドラインを自動抽出・統合し、意思決定時に関連知識だけを注入する仕組みで、特に複雑なタスクで大きな効果を示した。Claude CodeやCodexへのプラグイン統合が既に可能で、開発者がすぐに試せる実用性の高さが特徴。エージェント開発における記憶・学習アーキテクチャの標準手法となる可能性がある。