2月13日,Cerebras与OpenAI联合发布了最新的GPT-5.3-Codex-Spark模型,专注于实时编程领域。这一合作成果标志着双方在人工智能编程模型领域的首次公开合作。Codex-Spark模型旨在满足实时软件开发场景中对交互速度的高要求,能够实现超过1000tokens/s的推理速度,提供近乎即时的编码反馈。
Codex-Spark模型的设计强调快速、响应及时和可引导,以确保开发者在软件开发过程中保持主导地位。它被描述为一个“具备高度能力的小模型”,针对快速推理场景进行了优化。在软件工程基准测试SWE-BenchPro和Terminal-Bench2.0中,Codex-Spark在完成任务耗时上显著缩短,并提供了比GPT-5.1-Codex-mini更好的回答。该模型擅长精确代码修改、计划调整,并能围绕代码库进行上下文问答,适用于快速可视化新布局、优化样式和测试新的界面变更等工作。
此外,OpenAI还介绍了Cerebras的硬件能力,特别是Wafer-ScaleEngine,它拥有业内最大的SoC片上内存,支持用户实现每秒数千token级别的高速推理,并可扩展到数千套系统,将高速内存容量扩展到多TB级别,以支持万亿参数模型的训练与推理。OpenAI预计到2026年将这种“超高速推理”能力带到更大规模的前沿模型上。Codex-Spark将以研究预览形式向ChatGPTPro用户推送,覆盖Codex应用、CLI以及VSCode扩展,同时API访问将向部分设计合作伙伴逐步开放。

来源:一电快讯
返回第一电动网首页 >
以上内容由AI创作,如有问题请联系admin#d1ev.com(#替换成@)沟通,AI创作内容并不代表第一电动网(www.d1ev.com)立场。
文中图片源自互联网或AI创作,如有侵权请联系邮件删除。