AIフロントライン

公式ソースだけを集めたAIニュースを日本語要約でお届け

google-blog-ai 2026-04-02 07:00 ★3

Google、Gemini APIに2段階推論モードを導入

New ways to balance cost and reliability in the Gemini API

Gemini API Google 推論モード コスト最適化

要約

GoogleはGemini APIに「Flex」と「Priority」の2つの推論モードを新たに提供開始。 Flexは低コスト優先、Priorityは高信頼性・低レイテンシ優先で、用途に応じて使い分け可能。 コストと品質のトレードオフを開発者自身が制御できる柔軟性が、実運用での採用を後押しする。