要約
GoogleはGemini APIに「Flex」と「Priority」の2つの推論モードを新たに提供開始。 Flexは低コスト優先、Priorityは高信頼性・低レイテンシ優先で、用途に応じて使い分け可能。 コストと品質のトレードオフを開発者自身が制御できる柔軟性が、実運用での採用を後押しする。
公式ソースだけを集めたAIニュースを日本語要約でお届け
New ways to balance cost and reliability in the Gemini API
GoogleはGemini APIに「Flex」と「Priority」の2つの推論モードを新たに提供開始。 Flexは低コスト優先、Priorityは高信頼性・低レイテンシ優先で、用途に応じて使い分け可能。 コストと品質のトレードオフを開発者自身が制御できる柔軟性が、実運用での採用を後押しする。