品玩2月26日讯,Anthropic正式推出其《负责任扩展政策》(RSP)第三版,旨在应对AI系统潜在的灾难性风险。
新版RSP明确区分公司自身承诺与对全行业的安全建议,并引入三大核心机制:一是制定涵盖安全、对齐、防护与政策的“前沿安全路线图”;二是每3至6个月发布详细“风险报告”,披露模型能力、威胁模型及缓解措施;三是在特定情况下引入独立第三方专家对风险报告进行公开审查。
Anthropic表示,此举旨在提升透明度与问责制,同时承认单靠企业难以应对未来高阶AI风险,呼吁政府与行业协同建立多边治理框架。