勾配干渉

1件の記事

要約済み 1

arxiv-cs-ai 5時間前 3
勾配エンタングル問題を解消する新手法EAGCが登場
The Devil Is in Gradient Entanglement: Energy-Aware Gradient Coordinator for Robust Generalized Category Discovery

未知クラスを含むデータ分類タスク（GCD）で、最適化の競合「勾配エンタングルメント」を定量分析し解決策を提案。アンカーモデルによる勾配整合とエネルギー認識弾性射影の2モジュール構成で、既知・未知クラスを同時改善。既存手法を複数ベンチマークで上回る性能を達成し、プラグイン型で既存モデルへの統合も容易。

解説一般化カテゴリ発見（GCD）は、ラベル付きデータを活用しながら、既知クラスと未知クラスの両方を含む未ラベルデータを分類するタスクである。多くの手法が教師あり損失と教師なし損失を同時最適化するが、本研究はその際に生じる「勾配エンタングルメント」（gradient entanglement）という問題を定量的に特定した点が新しい。具体的には、(1) 教師なし勾配が教師あり勾配を歪め、既知クラスの識別性が低下する、(2) 既知クラスと新規クラスの表現部分空間が重なり、新規クラスの分離性が悪化する、という2つの悪影響が示される。提案手法EAGCはこれを解消するプラグイン型モジュールで、アンカーモデルで基準勾配方向を固定するAGA（Anchor-based Gradient Alignment）と、クラス間エネルギー配分に応じて勾配を射影調整するEEP（Energy-aware Elastic Projection）から構成される。既存のGCDフレームワークに追加実装可能な設計で、CIFAR-100、ImageNet-100、Herbarium-19などの主要ベンチマークで従来手法を上回る結果を達成。GCDの限界を勾配レベルで体系的に分析・解決した実用的な研究である。

一般化カテゴリ発見勾配干渉表現学習プラグイン最適化