2月18日,人工智能公司Anthropic发布了其中等规模Sonnet模型的新版本Sonnet4.6,保持了每四个月更新一次的频率。此次更新特别强调了模型在代码能力、指令遵循和计算机操作方面的显著提升。Sonnet4.6将成为免费版与Pro版用户的默认模型,其测试版支持的上下文窗口达到100万token,是之前Sonnet模型的两倍,能够容纳完整的代码库、长篇合同或数十篇研究论文。
在性能方面,Sonnet4.6在多项基准测试中表现突出,包括OSWorld和SWE‑Bench,这些测试分别用于评估计算机操作能力和软件工程。最引人注目的是,Sonnet4.6在衡量类人智能的ARC‑AGI‑2测试中得分达到60.4%,超越了大多数同级别模型。尽管如此,它在得分上仍然落后于Opus4.6、Gemini3DeepThink以及某一精调版GPT5.2等旗舰模型。此次发布紧随Opus4.6的推出,而新版Haiku模型也预计将在未来几周内发布。



来源:一电快讯
返回第一电动网首页 >
以上内容由AI创作,如有问题请联系admin#d1ev.com(#替换成@)沟通,AI创作内容并不代表第一电动网(www.d1ev.com)立场。
文中图片源自互联网或AI创作,如有侵权请联系邮件删除。