Gemini API
要約済み 1
-
google-blog-ai 13日前 3Google、Gemini APIに2段階推論モードを導入New ways to balance cost and reliability in the Gemini API
GoogleはGemini APIに「Flex」と「Priority」の2つの推論モードを新たに提供開始。 Flexは低コスト優先、Priorityは高信頼性・低レイテンシ優先で、用途に応じて使い分け可能。 コストと品質のトレードオフを開発者自身が制御できる柔軟性が、実運用での採用を後押しする。