Anthropic发布《负责任扩展政策》3.0版

Source

品玩2月26日讯，Anthropic正式推出其《负责任扩展政策》（RSP）第三版，旨在应对AI系统潜在的灾难性风险。

新版RSP明确区分公司自身承诺与对全行业的安全建议，并引入三大核心机制：一是制定涵盖安全、对齐、防护与政策的“前沿安全路线图”；二是每3至6个月发布详细“风险报告”，披露模型能力、威胁模型及缓解措施；三是在特定情况下引入独立第三方专家对风险报告进行公开审查。

Anthropic表示，此举旨在提升透明度与问责制，同时承认单靠企业难以应对未来高阶AI风险，呼吁政府与行业协同建立多边治理框架。