模倣学習

2件の記事

要約済み 2

arxiv-cs-ai 7時間前 2
研究者、AI推論の熱問題を模倣学習で解決
Active Imitation Learning for Thermal- and Kernel-Aware LFM Inference on 3D S-NUCA Many-Cores

3D積層CPU上のLFM推論で生じる熱集中とキャッシュ遅延を解決する新スケジューリング手法が発表された能動的模倣学習によりOracleデモから効率的に方策を習得し、スレッド移行とV/f制御を最適化エッジ・オンプレ環境でのAI推論における熱安全性と性能の両立に道を開く研究として注目される

解説 AILFMは、GPUの代替として注目される3D積層CPU（3D S-NUCA）上での大規模基盤モデル（LFM）推論における熱管理問題を解決するフレームワークです。3D S-NUCAはメモリ帯域幅と局所性に優れますが、3D NoC（チップ内ネットワーク）の構造上、コア間で熱集中や不均一なキャッシュアクセス遅延が生じます。LFMは注意機構・FFN・正規化など多様なカーネルを持つため、スレッドの配置や電圧・周波数（V/f）制御の最適化は非常に難しい問題です。既存の熱管理手法は単純な解析モデルに依存し、実行時の多様な状況への適応が不十分でした。AILFMはDAgger系の能動的模倣学習（AIL）を採用し、最適スケジューラ（Oracle）のデモンストレーションからポリシーネットワークを学習させます。コアレベルの性能とメモリアクセス特性の両方を考慮したスケジューリングを実現し、実行時オーバーヘッドを最小限に抑えます。GPUが高価・入手困難な状況でのLFM推論基盤として実用的意義があり、CPUクラスタ活用の道を広げる研究です。

HPC CPU推論熱管理スケジューリング模倣学習
hf-blog 6ヶ月前 2
低コストロボットでACT訓練、3回目で成功率75%
How I Trained Action Chunking Transformer (ACT) on SO-101: My Journey, Gotchas, and LessonsSep 30, 2025•66

低コストロボットSO-101にAction Chunking Transformerを実装した実践記録が公開された。初回はカメラ配置・データ多様性の不足で成功率10%に終わったが、データ戦略の改善で75%を達成。ロボット学習参入者にとってカメラ設定やデータ収集の落とし穴を示す実用的なガイドとなる。

解説 ACT（Action Chunking Transformer）を実機ロボットで訓練する際の具体的な落とし穴と解決策を詳細に記録したブログ。LLM系（GPT-4o、Claude等）とは異なるロボット制御AIの領域だが、HuggingFace LeRobotフレームワークの実用例として価値がある。開発者にとってはデータ収集戦略・ハードウェア安定化・評価設計など、実世界AI応用の教訓が豊富に含まれている。

ロボティクス模倣学習 Action Chunking Transformer 実践ガイド