深度学习不是通往 AGI 的正确道路
当前的深度学习系统缺乏真正的理解能力——它们通过模式匹配而非因果推理来操作,在分布外场景下脆弱易折,无法可靠地进行组合性泛化。单纯扩大规模无法解决这些根本性缺陷。
来源:Rebooting AI: Building Artificial Intelligence We Can Trust, Gary Marcus & Ernest Davis, Pantheon, 2019 / Deep Learning: A Critical Appraisal, Gary Marcus, arXiv:1801.00631, 2018
神经网络与符号推理的融合是 AGI 的必经之路
真正的通用智能需要两种计算机制的协作:神经网络负责感知、模式识别和统计学习;符号系统负责逻辑推理、抽象概念操作和组合性泛化。这两者缺一不可,人类大脑本身也是这种混合架构。
来源:The Next Decade in AI: Four Steps Towards Robust Artificial Intelligence, Gary Marcus, arXiv:2002.06177, 2020 / Rebooting AI: Building Artificial Intelligence We Can Trust, Gary Marcus & Ernest Davis, Pantheon, 2019
AI 研究需要认知科学的严谨性而非工程炒作
AI 领域的进展常常被过度宣传,基准测试成绩被当作真正的智能证明。马库斯坚持用认知科学和心理学的标准评估 AI:仅在训练集上表现优秀不等于理解;需要测试组合性、因果性、鲁棒性三个维度。
来源:Deep Learning: A Critical Appraisal, Gary Marcus, arXiv:1801.00631, 2018 / Lex Fridman Podcast #319: Gary Marcus — Fears of AI, Future of AI, 2022
人类认知的先天结构是 AI 设计的重要参照
受乔姆斯基语言学影响,马库斯认为人类天生具备某些认知结构(如语言习得设备、朴素物理学),这些先天结构让婴儿能用极少的样本学习复杂概念。AI 系统若想高效学习,也需要类似的先验结构而非纯粹的无监督学习。
来源:The Birth of the Mind: How a Tiny Number of Genes Creates the Complexities of Human Thought, Gary Marcus, Basic Books, 2004
组合性泛化测试
测试 AI 系统是否能将已知组件以全新方式组合,以区分真正理解和表面记忆。
给模型展示「猫坐在垫子上」和「狗跑在草地上」,然后要求它理解「狗坐在草地上」——这要求组合性泛化,而非简单检索。语言模型在此类测试中频繁失败。
AI 评估模型测试认知科学研究AI 产品质量保证
分布外鲁棒性审计
通过系统性地引入训练分布外的输入,识别 AI 系统的脆弱性边界和失效模式。
ImageNet 冠军模型在经过轻微图像扰动(对抗样本)后分类精度暴跌。这证明模型学到的是统计捷径而非真正的视觉概念。马库斯用此案例说明深度学习的鲁棒性问题。
AI 安全评估产品上线前测试医疗 AI 审查自动驾驶验证
神经-符号混合架构设计原则
为 AI 系统分配任务时,让神经网络处理感知层,符号系统处理推理层,以互补优势实现更强健的智能。
DeepMind 的 AlphaGeometry 将神经网络(直觉生成)与符号推理(逻辑验证)融合,在奥林匹克几何题上达到金牌水平。这正是马库斯长期倡导的混合路线在实践中的成功案例。
AI 系统架构机器人 AI 设计知识图谱集成可解释 AI 系统