Anthropic公司今日在官网上线了一个名为“Project Glasswing”(玻璃翼项目)的特殊页面。据披露,该公司研发出了一款拥有极强渗透测试与代码分析能力的AI模型。该模型在内部评估中展现出了在数秒内发现零日漏洞并自主构建利用链(Exploit Chain)的能力。出于安全考量,Anthropic决定不向公众开放此模型。
“玻璃翼”模型目前仅向包括亚马逊AWS、微软、英伟达以及关键基础设施维护机构在内的40余家合作伙伴开放。Anthropic表示,该模型的逻辑推理能力已经进化到了“攻击性思维”阶段,如果落入不法分子之手,可能导致全球范围内的软件供应链崩溃。
为了抵消该模型的潜在威胁,Anthropic宣布投入1亿美元的算力额度,用于资助开源安全组织使用其防御性模型进行漏洞加固。行业观察家认为,AI攻防战已经进入了“核威慑”阶段,顶级模型研发商必须在商业利益与全球安全之间做出艰难的平衡,而“受限发布”或将成为未来顶尖AI模型的常态。

