6月11日,AI研究公司Anthropic在社区反对声中调整了其最新AI模型ClaudeFable5的安全防护措施。此前,Anthropic被指在用户不知情的情况下限制竞争对手使用ClaudeFable5开发其他AI模型。面对批评,Anthropic发表声明,承认错误并道歉,表示将调整措施,使安全防护对用户可见。
ClaudeFable5在设计中加入了额外的护栏,以防止滥用。当用户询问网络安全、生物学或化学问题时,系统会转交给能力较弱的AI模型处理,以降低先进AI被用于不当目的的风险。然而,对于使用ClaudeFable5进行前沿AI开发的研究人员,Anthropic原本计划在用户不知情的情况下降低模型表现,以阻止他们训练竞争性AI模型。这一做法在AI研究社区中引起了强烈反对,认为这种做法已经越过了道德和透明度的界限。
在社区的压力下,Anthropic撤回了这一政策。新的措施是,如果Anthropic怀疑用户试图使用Claude构建高能力AI,将明确提醒用户系统将拒绝请求,或将用户转到能力较弱的模型。这一改变旨在保护AI研究的开放性和公平性,防止先进AI研究被少数头部实验室垄断。
来源:一电快讯
返回第一电动网首页 >
以上内容由AI创作,如有问题请联系admin#d1ev.com(#替换成@)沟通,AI创作内容并不代表第一电动网(www.d1ev.com)立场。
文中图片源自互联网或AI创作,如有侵权请联系邮件删除。