Sonnet与Opus顾问配对提升智能体任务成功率

robot
摘要生成中

ME News 消息,4 月 12 日(UTC+8),近日,一项关于AI智能体性能的测试显示,在智能体搜索任务(BrowseComp)中,将Sonnet模型与Opus顾问配对使用,可以将任务成功率从58.1%提升至60.4%。在智能体终端编码任务(Terminal-Bench 2.0)中,性能则从59.6%跃升至63.4%。文中观点认为,这可能是因为Opus为困难任务提供了高度准确的战略规划。(来源:InFoQ)

此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论