article_image

🔗 原文链接

2018 年,普林斯顿大学等离子体物理博士生尼克・麦格雷维满怀期待地将研究方向转向人工智能。彼时 AlphaFold 刚掀起结构生物学革命,学界充斥着 "AI 将开启科学发现黄金时代" 的乐观预言。然而六年后,这位物理学家在《IEEE 计算科学与工程》发表的论文却揭示了一个残酷现实:在偏微分方程求解这个 AI 最受追捧的科学应用领域,超过 79% 宣称 "颠覆传统方法" 的研究都存在严重的方法论缺陷。

这场个人科研历程的挫败,折射出整个 AI 科学界的系统性病症。当麦格雷维试图复现一篇引用率高达 14,000 次的论文提出的物理信息神经网络(PINN)时,这个被原作者称为 "能解决经典流体、量子力学、反应扩散系统" 的明星算法,却在他研究的等离子体方程面前屡屡失效。即便替换为更简单的一维弗拉索夫方程,结果依然与精确解大相径庭。"就像拿着万能钥匙开保险箱,结果发现连自家房门都打不开。" 他后来回忆道。更令人不安的是,当麦格雷维联系其他院校同行时,发现至少有数十个实验室在重复类似失败的实验,但这些经历从未出现在正式论文中。

这种 "幸存者偏差" 在 AI 科学界已成常态。2023 年 DeepMind 宣称发现 220 万种新晶体结构时,学界曾为 "材料发现进入新时代" 欢呼。但材料科学家很快发现,这些化合物中绝大部分稳定性存疑,有学者直言 "数据就像沙滩城堡,潮水退去后只剩残渣"。普林斯顿计算机科学家纳拉亚南团队更发现,648 篇涉及 30 个领域的 AI 科学论文存在 "数据泄露"—— 这种会导致结果过度乐观的方法论错误,在医学领域曾引发过严重的可重复性危机。

在麦格雷维的深度调研中,这种系统性失真暴露得尤为彻底。他与导师对 76 篇 AI 求解流体力学方程的论文进行溯源,发现 60 篇都采用了 "田忌赛马" 式比较:宣称速度提升百万倍的研究,对比的竟是上世纪 80 年代的经典算法而非最新优化方法。当团队用 2020 年代最先进数值方法重建实验环境时,AI 的所谓优势如同烈日下的薄雾般消散。"这就像用特斯拉对比福特 T 型车,然后宣布电动汽车速度提升 500%。" 该研究被领域权威芭芭教授称为 "揭穿 AI 科学泡沫的确凿证据"。

耐人寻味的是,明知存在方法论缺陷,科学家们仍在疯狂涌向 AI 赛道。统计显示,2015 至 2022 年间,AI 在科学论文中的使用率从 2% 飙升至 8%,在计算机领域更是突破 30% 临界点。驱动这种狂热的并非技术突破,而是赤裸裸的科研经济学:使用 AI 的科学家论文被引量达到普通研究的三倍,NVIDIA 等企业每年投入数亿美元塑造 "AI 科学革命" 叙事,而年轻学者们深知,转向 AI 意味着更丰厚的薪酬和更快的职称晋升。"我们像 19 世纪的淘金者,只不过金矿是引用量,铁镐变成了 GPU。" 一位匿名研究者如是说。

在这场集体狂欢中,真正的科学进步反而成了配角。当麦格雷维实验室尝试用 AI 加速聚变等离子体模拟时,发现现有模型在简单案例中表现尚可,但面对真实反应堆的复杂环境就漏洞百出。"它给出的解就像毕加索画作 —— 很有创意,但造不出托卡马克装置。" 更严峻的是,缺乏理论保证的 AI 算法会隐藏微妙错误,这些错误可能在工程应用时酿成灾难。正如谷歌研究院的霍耶所言:"当 AI 开始指导核聚变设计时,我们需要的不是更快的结果,而是可信的结果。" 当然,AI 并非全无建树。在天气预报领域,华为云团队开发的盘古气象大模型将台风路径预测误差缩小至 66 公里,较传统方法提升 20%;新药研发中,AI 设计分子的一期临床通过率确实呈现上升趋势。但若细究这些成功案例,往往具备两个共性:明确的评估标准(如 CASP 蛋白质折叠竞赛)和深厚的领域知识嵌入。反观那些宣称 "通用科学革命" 的尝试,大多陷入 "拿着锤子找钉子" 的窘境 —— 为了证明 AI 有效性,不少研究者选择攻击早已被传统方法攻克的问题。 这种扭曲的科研生态,正在催生学术史上罕见的奇观。那篇最初提出 PINN 的论文,尽管学界已知其存在严重局限性,引用量仍以每天 4 次的速度逼近历史第二数值方法论文宝座。而在材料科学领域,即便知道 DeepMind 的晶体数据库存在大量 "垃圾数据",仍有数千篇论文引用该成果作为研究基础。这种自我强化的引用泡沫,恰似 17 世纪荷兰的郁金香狂热 —— 人人都知道价格虚高,但没人愿意第一个戳破泡沫。

当被问及 AI 是否真能逆转科学停滞趋势时,麦格雷维给出了颇具物理学色彩的答案:"在量子世界,观测行为会影响系统状态。当整个科学界都在观测 AI 的可能性时,我们或许已经改变了未来的轨迹。" 这个充满不确定性的答案,恰恰揭示了 AI 科学革命的真实困境:我们既不能证伪它的潜力,又无法证明它的实效。唯一确定的是,在追逐星辰大海的征途上,人类仍需谨记科学探索的第一性原理 —— 真理从不诞生于论文引用数,也不会臣服于 GPU 的浮点运算。


author_avatar

UNTAG 官方