关闭广告

Claude Opus 4.5来了!单次生成打造《我的世界》,还破解高难度Agent测评

智东西3741人阅读

智东西
作者 陈骏达
编辑 李水青

智东西11月25日报道,今天,Anthropic发布了自家的旗舰编程模型Claude Opus 4.5。Anthropic称,这是全球范围内在编程、agents和计算机使用方面最强大的模型。

在真实世界软件工程测试SWE-bench Verified中,Claude Opus 4.5成为首款得分超过80%的AI模型,不仅领先于自家的Claude Sonnet 4.5,还超过了上周发布的Gemini 3 Pro和GPT-5.1 Codex-Max。


Anthropic还把该公司面试人类工程师的高难度居

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

今年双11,搞出了点新意思

虎嗅APP 浏览 3929

美众院通过修正案 或禁止美军从中俄购买数字显示器

澎湃新闻 浏览 27144

前排双联屏+女王副驾 与众08内饰发布还配调光天幕

网易汽车 浏览 2310

白俄罗斯国防部长:边境出现“前所未有”军事集结

环球网资讯 浏览 3134

钟欣潼前夫被曝婚变,第三任妻子删光合照

树娃 浏览 4007

小米汽车事故后甩锅,真诚真的难吗?

宏哥谈商道 浏览 4232

票房炸裂,口碑崩塌,《731》到底值不值得我们为它买单

最爱酷影视 浏览 5027

50+女性秋冬穿搭指南,4个让年龄法则成为加分项,越穿越优雅

静儿时尚达人 浏览 2503

“这条围巾”才是今年的顶流单品,时髦的女人都有它

LinkFashion 浏览 3950

林子祥和学生结婚,78岁开演唱会,依然一票难求

犀利辣椒 浏览 3996

50+的女性,大衣、直筒裤、皮草这么穿,冬天保暖显瘦两不误

静儿时尚达人 浏览 2531

U23亚洲杯身价榜:中国第三力压日韩,沙特居首伊朗次席

懂球帝 浏览 3194

温州85后接棒,百亿企业大“换血”

中国企业家杂志 浏览 3931

晒意大利女总理"色情照"的网站发关闭声明:很快再见

中国新闻周刊 浏览 8728

马斯切拉诺:我对穆勒的记忆并不美好;希望运气在我们这边

懂球帝 浏览 3497

4岁娃吃席打翻盘子被要求道歉 父亲:"娃儿小"不是借口

封面新闻 浏览 18619

机酒价格普降两成 出境错峰游正当时

北京商报 浏览 4269

失业13个月 35岁巴神官宣登陆西亚2级联赛 已换13队+10年转会10次

我爱英超 浏览 3041

E句话| 儿子发文替闫学晶道歉,说像给灵魂动手术?

仙女事件簿 浏览 2605

17岁男生提供电话卡给网诈团伙被判8个月 称获利997元

红星新闻 浏览 9901

安德鲁被英王室扫地出门:曾3次强迫17岁女孩发生关系

新民晚报 浏览 9948
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1