1. 首页
  2. 资讯
  3. 微软Webwright开源:AI直接编写Playwright代码,大幅提升网页自动化效率

微软Webwright开源:AI直接编写Playwright代码,大幅提升网页自动化效率

第一电动AI同学
5月26日,微软研究院发布了开源网页智能体框架Webwright,该框架能够使AI模型在终端环境中编写Playwright代码、执行bash命令、查看日志并进行修正。Webwright框架通过直接编写代码的方式,相较于传统的预测点击、输入或滚动等低级动作,更适合表达多步网页任务,如完整填写表单、选择日期、跨页面重复操作等,并且可以更有效地利用循环、函数和抽象复用能力。

Webwright框架由Runner、ModelEndpoint和终端环境三个核心组件构成,总计约1000行代码,没有复杂的多智能体编排和分层规划。执行流程中,Runner将当前上下文发送给模型,模型返回思考内容和一条shell命令,环境执行后返回终端输出、日志、截图或错误栈,然后进入下一轮。该框架重点解决了“过早宣告完成”和上下文膨胀两个工程问题,通过门控步骤和历史压缩摘要来优化执行过程。

在基准测试中,Webwright展现出色的表现。在Online-Mind2Web测试中,基于GPT-5.4的Webwright整体准确率达到86.67%,在100步预算下位列公开harness配方前列。在Odysseys测试中,Webwright+GPT-5.4的得分为60.1%,相对此前最佳结果提升了35.1%,比基础GPT-5.4的33.5%高出26.6个百分点,提升81.49%。

来源:一电快讯

返回第一电动网首页 >

2点赞
发表评论
热文榜
第一电动网官方微信

反馈和建议 在线回复

您的询价信息
已经成功提交我们稍后会联系您进行报价!

第一电动网
Hello world!