embodied AI
要約済み 1
-
arxiv-cs-ai 1日前 3OOWM、OOP活用でLLMのロボット計画推論を刷新OOWM: Structuring Embodied Reasoning and Planning via Object-Oriented Programmatic World Modeling
Chain-of-Thoughtの限界を克服する新フレームワーク「OOWM」が発表された。 OOPとUMLで状態空間・オブジェクト階層・因果依存関係を構造的に表現し、既存LLM手法を上回る性能を達成。 LLMによる具現化エージェントの設計指針として、記号的推論の有効性を示す重要な研究成果。
解説 本論文は、大規模言語モデル(LLM)をロボット計画などの具現化タスク(embodied task:実環境でのエージェント行動)に適用する際の根本的な問題に取り組む。従来のChain-of-Thought(CoT)は自然言語の連鎖推論でLLMの思考力を高める手法だが、線形テキストでは「どのオブジェクトがどの状態にあるか」「行動によって状態がどう遷移するか」を明示的に表現しにくい。 提案手法OOWM(Object-Oriented World Modeling)は、世界モデルをW=⟨S,T⟩というシンボリックなタプルとして定式化する。Sは環境状態(オブジェクトの属性・関係をUMLクラス図で表現)、Tは状態遷移ロジック(行動→新状態)を表し、ソフトウェア工学のオブジェクト指向設計の概念を直接借用する。UML(統一モデリング言語)を使うことで、オブジェクト間の継承・集約・依存関係を構造的に管理できる。 GPT-4o・Claude・Gemini等の最新LLMと比較した実験では、OOWMフレームワークを適用することでタスク達成率や計画の正確性が向上しており、特に長期依存関係が複雑なシナリオで優位性が顕著。記号的・構造的表現が自然言語の曖昧さを補完することを示した点が実用的意義として大きい。