在下架模型的同时 A 社也发布公开信指责美国政府发布出口管制指令不透明,为此 A 社派遣高级技术团队前往华盛顿与美国政府展开紧急磋商,原本大家预料的是经过紧急磋商以及 A 社实施更严格的安全边界后模型很快就可以恢复,然而目前来看谈判并不顺利。
结束谈判后管制指令也未被解除:
美国政府发布出口管制指令的原因是 Claude Fable 5 可以被通过越狱的方法绕过安全防护,从而让普通用户也获得类似 Claude Mythos Preview 模型那样强大的网络安全能力,这可能会给互联网安全造成隐患,当然美国政府担心的是普通用户通过越狱使用 Claude Fable 5 对美国基础设施发起攻击进而影响公共安全。
Anthropic 始终认为美国政府的担忧被夸大,但要解决问题还是得谈判,所以该公司派遣联合创始人兼首席计算官、外部事务负责人、前沿红队负责人以及高级安全研究员等紧急飞往华盛顿特区参与谈判;美国政府方面参与谈判的是美国商务部部长和美国人工智能标准与创新中心的研究员。
据 WIRED 发布的消息,目前 Anthropic 与美国政府的谈判已经结束,不过美国政府并未解除对 Claude Fable 5 模型的出口管制禁令,所以目前还处在僵局中,Claude Fable 5 模型恢复时间遥遥无期,Anthropic 只表示双方正在快速推动问题解决,美国政府则拒绝置评。
核心问题是越狱并未被解决:
目前双方的争议仍然是 Claude Fable 5 模型的安全问题,Anthropic 认为 Mythos 类模型在寻找漏洞和武器化利用方面确实表现优秀但并非独一无二,其他模型也同样可以做到类似的事情,而下架模型只会剥夺网络安全防御者最好的工具,这反而会造成不确定性,甚至是危害网络安全。
美国政府的观点始终都是愿意寻找让 Claude Fable 5 恢复使用的途径,但前提必须是 Anthropic 彻底解决越狱问题,如果无法解决越狱问题那想要解除管制是不可能的,因为美国政府担忧的安全隐患仍然存在,只不过对 AI 模型来说,想要彻底解决越狱问题是非常困难的,再严格的安全边界也有办法可以绕过。