Gary Marcus又开炮了。这位以"深度学习喷子"著称的纽约大学名誉教授,最新专栏把矛头直指一个老问题:为什么我们至今造不出真正可信赖的AI?他的答案并不新鲜——深度学习不可信——但这次给出的论证框架,比以往更完整,也更让人悲观。Marcus的切入角度很有意思:他不只谈技术局限,还把人类心理因素拉了进来。数学层面上,当前主流AI依赖的统计学习方法存在先天缺陷,模型对训练数据的依赖过重,泛化能力脆弱,遇到分布外的输入就可能给出离谱答案。这不是工程问题,是理论天花板。而人类心理那一层更麻烦:人类天然倾向于拟人化,会把AI的流畅输出误读为"理解"和"思考",从而产生虚假的信任。系统一旦出错,反噬会比传统软件猛烈得多,因为用户压根没防备。
所以Marcus的结论是:AI信任的崩塌不是"会不会"的问题,而是"什么时候"。现有架构没办法从根本上解决幻觉、推理脆弱、价值对齐这些顽疾,靠打补丁、加RLHF、堆参数量都是在拖延而非根治。他主张走神经符号融合的路子,把符号推理的严谨性塞进神经网络里,同时建立可验证、可解释的安全标准——而不是现在这种"出了事再道歉"的黑盒模式。这套观点值不值得全盘接受另说,但至少提醒了一件事:当下大模型的"惊艳表现"和"真正可靠"之间,隔着的不是几个月的产品迭代周期,而是基础理论的鸿沟。做AI安全的人,与其忙着给模型套护栏,不如先想想这个根本性差距到底怎么补。

