5月26日,微软研究院发布了开源网页智能体框架Webwright,该框架能够使AI模型在终端环境中编写Playwright代码、执行bash命令、查看日志并进行修正。Webwright框架通过直接编写代码的方式,相较于传统的预测点击、输入或滚动等低级动作,更适合表达多步网页任务,如完整填写表单、选择日期、跨页面重复操作等,并且可以更有效地利用循环、函数和抽象复用能力。
Webwright框架由Runner、ModelEndpoint和终端环境三个核心组件构成,总计约1000行代码,没有复杂的多智能体编排和分层规划。执行流程中,Runner将当前上下文发送给模型,模型返回思考内容和一条shell命令,环境执行后返回终端输出、日志、截图或错误栈,然后进入下一轮。该框架重点解决了“过早宣告完成”和上下文膨胀两个工程问题,通过门控步骤和历史压缩摘要来优化执行过程。
在基准测试中,Webwright展现出色的表现。在Online-Mind2Web测试中,基于GPT-5.4的Webwright整体准确率达到86.67%,在100步预算下位列公开harness配方前列。在Odysseys测试中,Webwright+GPT-5.4的得分为60.1%,相对此前最佳结果提升了35.1%,比基础GPT-5.4的33.5%高出26.6个百分点,提升81.49%。



来源:一电快讯
返回第一电动网首页 >
以上内容由AI创作,如有问题请联系admin#d1ev.com(#替换成@)沟通,AI创作内容并不代表第一电动网(www.d1ev.com)立场。
文中图片源自互联网或AI创作,如有侵权请联系邮件删除。