谷歌更新Gemini API定价,按推理使用分档计费

robot
摘要生成中

火星财经消息 4月3日消息,谷歌近日对Gemini API的计费档位进行更新,优化方案与定价均基于实际推理使用需求制定。本次新增的推理服务档位包括:标准(Standard)、弹性(Flex)、优先(Priority)、批量(Batch)和缓存(Caching)版。其中,弹性推理档位通过利用非高峰闲置算力资源,提供标准价格五折优惠,目标延迟为1至15分钟,但不提供延迟保证。批量API档位同样提供标准费率五折优惠,延迟最长可达24小时。缓存档位计费依据缓存词元(Token)数量与存储时长,推荐用于搭载复杂系统指令的对话机器人、长视频文件重复分析,以及大规模文档集查询等场景。优先档位定价则比标准价格高出75%至100%,延迟可控制在毫秒至秒级。谷歌建议该档位用于实时客服聊天机器人、实时欺诈检测及业务关键型智能助手等场景。(广角观察)

此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论
  • 热门 Gate Fun

    查看更多
  • 市值:$2224.13持有人数:1
    0.00%
  • 市值:$2234.48持有人数:1
    0.00%
  • 市值:$2231.03持有人数:0
    0.00%
  • 市值:$2246.35持有人数:2
    0.24%
  • 市值:$2238.35持有人数:2
    0.00%