最適化
要約済み 2
-
stability-blog 10ヶ月前 4SD 3.5、TensorRT最適化で推論速度2倍・VRAM40%減を達成Stable Diffusion 3.5 Models Optimized with TensorRT Deliver 2X Faster Performance and 40% Less Memory on NVIDIA RTX GPUs
Stability AIがStable Diffusion 3.5のNVIDIA TensorRT向け最適化版を公開した。 RTX GPU上で推論速度2倍、VRAMを40%削減する大幅な効率化を実現。 ローカル環境での高品質画像生成の敷居が下がり、個人開発者への恩恵が大きい。
解説 Stability AIはNVIDIAと連携し、画像生成モデル「Stable Diffusion 3.5」をTensorRT(NVIDIAの推論高速化SDK)向けに最適化したバージョンを公開した。TensorRTはニューラルネットワークをGPU向けにコンパイル・最適化することで、FP16やINT8などの低精度演算や演算カーネルの融合(Kernel Fusion)を活用し、推論速度を大幅に向上させる技術。今回の最適化により、NVIDIA RTX GPUを搭載した一般消費者向けPCでも2倍の生成速度と40%のVRAM削減が実現されており、これまでは高スペックGPUが必要だったSD 3.5のローカル運用の敷居が大きく下がった。開発者にとっては、クラウドAPIへの依存を減らしてオフライン・プライベートな環境での画像生成パイプライン構築が現実的になる点が重要。業界全体としても、高性能モデルをエッジデバイスで動かす「エッジAI推論」の潮流を加速させるニュースであり、コンテンツ制作・ゲーム開発・デザインツール分野への普及促進が期待される。 -
stability-blog 12ヶ月前 3Stability AI、Stable DiffusionをAMD GPU向けに最適化Stable Diffusion Now Optimized for AMD Radeon™ GPUs and Ryzen™ AI APUs
Stability AIがStable DiffusionをAMD RadeonおよびRyzen AI APU向けに最適化したと発表。 ROCmやDirectMLを活用し、NVIDIAなしで高速な画像生成が可能になった。 Windows環境や組み込みAIデバイスへの普及が加速し、AI民主化に貢献する。
解説 Stability AIは、画像生成AIモデル「Stable Diffusion」をAMDのRadeon GPUおよびRyzen AI APU(CPU・GPU・NPUを統合したチップ)向けに最適化したと発表した。これまでStable DiffusionはNVIDIA製GPUとCUDA環境での利用が事実上の標準であったが、今回の最適化によりAMDハードウェア上でも高速な推論が可能になる。技術的にはAMDのオープンソースGPUコンピューティング基盤「ROCm」やWindows向けの「DirectML」を活用していると見られ、モデルの量子化や演算カーネルのチューニングが施されている。Ryzen AI APUへの対応は、ノートPCや省電力デバイスでのローカル画像生成を現実的にする点で意義が大きい。NVIDIAへの依存を減らすことでエコシステムの多様化が進み、開発者はより多くのハードウェア環境向けにアプリを構築できる。特にWindowsユーザーや法人向けAMD搭載PCでの生成AI活用が加速する可能性がある。