今日凌晨,国内知名AI模型DeepSeek突发全球范围内的服务中断。包括网页端、App以及API调用在内的全线功能无法使用,修复时长超过12小时。此次事件引发了大量依赖DeepSeek API进行业务运行的企业关注,社交平台上关于“AI服务稳定性”的讨论热度激增。
DeepSeek官方随后发布声明称,故障原因为核心数据中心在进行架构升级时,底层分布式存储系统出现了罕见的逻辑错误,导致服务请求在大规模并发下出现死锁。虽然团队在第一时间启动了容灾备份,但由于数据同步的一致性检验耗时较长,导致恢复进度慢于预期。
目前,大部分核心业务已逐步恢复。此次事件也给整个行业敲响了警钟。随着AI模型逐步从“工具”转变为“基础设施”,其服务的高可用性(HA)变得至关重要。业内专家建议,企业在构建关键业务系统时,应考虑多模型容灾方案,不应过度依赖单一供应商,以规避因突发宕机带来的业务风险。

