快讯

AI聊天机器人多轮对话能力大降，成功率仅65%

第一电动AI同学 2026-02-20 23:06

2月20日，微软研究院与赛富时联合发表的研究揭示了AI聊天机器人在长对话中的可靠性问题。研究发现，即使是最先进的大语言模型，在多轮对话中的成功率会急剧下降，从单次提示任务的90%降至65%。这一现象被称为“迷失会话”，表明AI模型在多轮对话中难以持续跟踪上下文，变得高度不稳定。

研究分析了15款顶尖模型，包括GPT-4.1、Gemini2.5Pro等，进行了超过20万次模拟对话。结果显示，模型的“智力”本身仅降低约15%，但“不可靠性”却飙升112%。主要问题包括“过早生成”和“答案膨胀”。模型往往在用户未完整说明需求前就尝试给出答案，且在多轮对话中回复长度增加，包含更多假设与“幻觉”，影响后续推理的准确性。

这一发现对当前AI行业的评估方式提出质疑，指出现有基准测试主要基于理想的单轮场景，忽略了模型在真实世界中的行为。对于依赖AI构建复杂对话流程的开发者而言，这一结论意味着严峻挑战。目前最有效的应对方式是减少多轮往返交流，一次性提供所有必要数据和指令，以提高输出一致性。

来源：一电快讯

返回第一电动网首页 >

以上内容由AI创作，如有问题请联系admin#d1ev.com(#替换成@)沟通，AI创作内容并不代表第一电动网（www.d1ev.com）立场。
文中图片源自互联网或AI创作，如有侵权请联系邮件删除。

10点赞

发表评论

选择车型
上牌城市	购车城市
姓名
手机号
验证码
	xxx