关闭广告

Claude Opus 4.5来了!单次生成打造《我的世界》,还破解高难度Agent测评

智东西3239人阅读

智东西
作者 陈骏达
编辑 李水青

智东西11月25日报道,今天,Anthropic发布了自家的旗舰编程模型Claude Opus 4.5。Anthropic称,这是全球范围内在编程、agents和计算机使用方面最强大的模型。

在真实世界软件工程测试SWE-bench Verified中,Claude Opus 4.5成为首款得分超过80%的AI模型,不仅领先于自家的Claude Sonnet 4.5,还超过了上周发布的Gemini 3 Pro和GPT-5.1 Codex-Max。


Anthropic还把该公司面试人类工程师的高难度居

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

中方敦促波黑各方缓解紧张局势

国际在线 浏览 3459

OpenAI再度“挖墙角”,从谷歌挖来Albert Lee执掌公司发展

华尔街见闻官方 浏览 2899

何赛飞用肥皂卸妆 网友:张晚意找到“同皂中人”

台州交通广播 浏览 3026

南博"伪作"被估价8800万 国家级调查组下场后谜题浮出

新民周刊 浏览 6703

三只松鼠3个月两次调价,部分坚果礼拟从明日起出厂价上涨

红星资本局 浏览 2597

高市称若台湾有事日美将联合救助两国公民 外交部驳斥

外交部网站 浏览 6510

地点未定 摩擦又起 美伊核谈判开启前变数频生

极目新闻 浏览 2332

老己,买点什么犒劳辛苦了一年的你?

时尚COSMO 浏览 2947

马斯克:比尔盖茨最好尽快平掉特斯拉空头头寸

鞭牛士 浏览 3127

IPO带病闯关遭通报批评未满一年 英虎机械重启资本路欲挂牌新三板

叩叩财讯 浏览 3769

理想「断腕」:关店100家,李想手里还剩什么牌?

电车通 浏览 2417

雷军辟谣:小米SU3渲染图肯定是假的 目前还没有规划

太平洋汽车 浏览 2680

独家 | 好想来、良品铺子转型综合超市,筹划做“万市大集”

商业观察家 浏览 3811

美国“恢复核试验表态”背后有何考量

环球网资讯 浏览 3447

智元,想跟宇树争第一

定焦One 浏览 445

微软豪掷79亿美元投资阿联酋AI企业G42,加速中东AI设施建设

IT之家 浏览 3562

下一代GPU,竞争激烈

半导体行业观察 浏览 4362

男团奋勇剑指卫冕!王楚钦抢五过关 林诗栋完胜 梁靖崑完全觉醒

颜小白的篮球梦 浏览 178

以色列的新常态:创伤、分裂与集体错觉

澎湃新闻 浏览 3745

阿尔及利亚非洲杯名单:马赫雷斯、努里领衔,卢卡-齐达内入选

懂球帝 浏览 2932

菜鸟与蜜雪集团达成合作,为蜜雪打造AI供应链产品

财闻 浏览 2967
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1