エッジAI

arxiv-cs-ai 1日前 3

AHC: Meta-Learned Adaptive Compression for Continual Object Detection on Memory-Constrained Microcontrollers

研究者らがメモリ100KB以下の超小型マイコン向け継続学習型物体検出手法「AHC」を発表。 MAMLベースのメタ学習で5ステップ適応・破滅的忘却を抑制し、階層的圧縮で軽量推論を実現。極限のリソース制約下でのエッジAI展開に道を開く成果として注目される。

解説本論文はマイクロコントローラ（MCU）上での継続的物体検出という極めて制約の厳しい問題に取り組む。提案手法AHC（Adaptive Hierarchical Compression）は3つの柱で構成される。①MAML（Model-Agnostic Meta-Learning）ベースの真の適応的圧縮：従来のFiLMコンディショニング（固定変換でタスク適応）と異なり、各新タスクに対して勾配降下法を5ステップ実行し圧縮パラメータを動的調整する。②階層的マルチスケール圧縮：FPN（Feature Pyramid Network）の各スケール層の冗長性に合わせたスケール固有の圧縮比（P3層=8:1、P4層=6.4:1、P5層=4:1）を採用し、情報損失を最小化しつつメモリを節約する。③双対メモリアーキテクチャ：短期・長期メモリバンクを組み合わせ、重要度ベースの記憶統合を100KB以内で実施、破滅的忘却を理論的保証付きで抑制する。GPT-4oやGemini等の大規模モデルとは異なるエッジ推論の文脈だが、IoTデバイスや組込みシステムへの展開に直結する実用的意義が高い。メモリ制約下での継続学習の理論的境界を提示した点も学術的貢献として注目される。

継続学習エッジAI モデル圧縮メタ学習物体検出

hf-blog 28日前 3

NVIDIAが4B小型ハイブリッドモデルを公開、エッジAIに最適化

Nemotron 3 Nano 4B: A Compact Hybrid Model for Efficient Local AI25 days ago•62

NVIDIAがMamba+Transformerのハイブリッド構造を採用した4BパラメータモデルNemotron 3 Nano 4Bを公開。 9Bモデルからの蒸留により4Bクラス最高水準の指示追従・エージェント性能を実現、FP8で1.8倍高速化。 Jetson/RTXなどエッジデバイスでのローカルAI活用を大幅に拡大する可能性がある。

解説 NVIDIAがMamba-Transformerハイブリッド構造の4Bモデルを公開。9Bモデルからの構造化プルーニング＋2段階蒸留＋多段階RLという体系的な圧縮パイプラインが特徴的。Jetson Orin Nanoで18tok/sを実現し、ロボティクスやゲームAIなどエッジ推論の実用域に到達。GPT-4o miniやGemma等のクラウド前提モデルとは異なり、ローカル完結型AIの選択肢を広げる。開発者にとってはGGUF対応でllama.cppから即利用可能な点が実用的。

エッジAI モデル圧縮 Mamba NVIDIA 軽量LLM

hf-blog 7ヶ月前 4

PII保護SLMシリーズ公開、GPT-4.1に迫る性能

Anonymizer SLM series: Privacy-first PII replacement models (0.6B/1.7B/4B)

外部LLM送信前にPIIをローカル検出・置換する小型言語モデル（0.6B〜4B）シリーズがリリースされた。 GRPO強化学習により1.7B/4Bモデルがスコア9.2〜9.55/10を達成し、GPT-4.1（9.77）に肉薄する性能を実現。プライバシー規制対応が求められる企業や医療・法務分野での実用導入を大きく後押しする。

解説本研究はQwen3ベースの小型言語モデル（0.6B・1.7B・4B）を用いて、個人識別情報（PII：氏名・会社名・住所・金額など）をローカルデバイス上で検出・置換してからClaude・GPT-4・Geminiなどの外部LLM APIへ送信する「プライバシーファースト」なアーキテクチャを提案する。従来手法のPAPILLONはプロンプト全体を書き換えるため応答品質が85%に低下し7.5%の情報漏洩が発生したが、本手法は「外科的エンティティ置換」で文脈を維持しつつ漏洩を防ぐ。訓練は約3万サンプルによるSFT（教師あり微調整）、続くDPO（直接選好最適化）で+1.5〜2点向上、最終段階のGRPO（グループ相対方策最適化）でLLMジャッジスコアが4Bで6.38→9.55、1.7Bで5.67→9.20へ大幅に改善。GPT-4.1の9.77と比べGPT比較で約1000分の1のパラメータ数で同等性能を実現した点が特筆される。応答時間は1.7Bで1秒以下、4Bで2秒以下とリアルタイム利用に耐えうる。実用アプリ「Silo」としてApp Storeで公開済み。企業機密や内部告発など機密性の高いタスクでも強力なLLMを安全に活用できる実用的意義は大きい。

PII匿名化プライバシー保護小型言語モデル強化学習エッジAI

stability-blog 11ヶ月前 4

Stability AIとArm、オンデバイス音声生成モデルを共同リリース

Stability AI and Arm Collaborate to Release Stable Audio Open Small, Enabling Real-World Deployment for On-Device Audio Generation

Stability AIとArmが協力し、クラウド不要で動作する軽量音声生成モデル「Stable Audio Open Small」を公開。 Arm搭載デバイス上でリアルタイム音声生成が可能な設計で、スマートフォンやIoT端末への展開を想定。エッジAIの実用化を加速し、プライバシー重視・低遅延な音声生成アプリの開発に道を開く。

解説 Stability AIとArm（半導体IP大手）が共同で「Stable Audio Open Small」をリリースした。これはStability AIが公開しているオープンソースの音声生成モデル「Stable Audio Open」を、Armのチップアーキテクチャ（スマートフォンや組み込み機器に広く採用）向けに最適化した軽量版である。従来の大規模音声生成モデルはクラウドサーバー上での推論が前提だったが、本モデルはArmのNPU（ニューラル処理ユニット）やGPUを活用し、端末内で完結する推論（オンデバイス推論）を実現する。量子化・プルーニングなどのモデル圧縮技術によりモデルサイズを削減しながら、実用水準の音声生成品質を維持している。主なメリットは、①通信遅延がなくリアルタイムに近い生成が可能、②音声データをクラウドに送信しないためプライバシーが向上、③オフライン環境でも動作、の3点。ゲーム・映像制作・音楽アプリ・モバイルツールなど幅広いユースケースでの活用が期待される。開発者にとっては、Armベースのデバイス（AndroidスマートフォンやApple Siliconなど）向けアプリへの音声生成機能の組み込みが現実的な選択肢となる点で重要な発表である。

音声生成エッジAI オンデバイス Arm Stability AI

hf-blog 1年前 2

エッジAI時代の本命SLM、主要モデルを徹底解剖

Small Language Models (SLM): A Comprehensive OverviewFeb 22, 2025•147

1M〜10Bパラメータの小規模言語モデル（SLM）を網羅的に解説した技術記事が公開された。 Llama3.2・Phi-3.5・Gemma3など主要SLMを比較し、蒸留・量子化等の圧縮技術を体系整理。エッジ・モバイル展開を目指す開発者にとって実践的な参照資料となる内容。

解説 SLMはGPT-4oやClaude等の大規模モデルを補完する位置づけで、エッジデバイスやプライバシー重視の用途で需要が拡大している。本記事は包括的なサーベイとして有用だが、新手法の提案ではなく既存知見の整理である。開発者にとってはLoRAやOllamaを用いた実装例が実践的で、SLM導入の入門資料として価値がある。研究者には参照論文リストが出発点となる。

SLM モデル圧縮エッジAI 知識蒸留 LoRA

要約済み 5