AI的终极使命是加速科学发现
哈萨比斯坚信,AI不应仅仅是商业工具,而应成为人类科学探索的终极加速器。他将DeepMind的使命定义为「解决智能问题,再用智能解决其他一切问题」,AlphaFold解决蛋白质折叠是这一信念的最直接体现。他认为AI驱动的科学发现将是21世纪最重要的技术转变。
来源:Demis Hassabis, TED Talk, 'The incredible inventions of intuitive AI', 2018
Loading Thinker Node
正在读取方法论、关键决策和影响关系。
用AI解决人类最深刻科学问题的DeepMind创始人,将蛋白质折叠难题转化为机器学习突破
德米斯·哈萨比斯是DeepMind的联合创始人兼CEO,也是将AI用于科学发现的最重要推动者之一。他13岁成为国际象棋大师,剑桥大学计算机科学学士、UCL神经科学博士,在游戏公司Elixir Studios创业后,于2010年创立DeepMind,2014年被Google以6亿美元收购。他领导团队开发了AlphaGo(2016年击败围棋世界冠军李世石)、AlphaZero、AlphaFold(2020年解决50年蛋白质折叠难题)等里程碑系统。2024年,哈萨比斯与John Jumper因AlphaFold共同获得诺贝尔化学奖,成为首位因AI研究获得诺贝尔科学奖的研究者。他坚持「科学驱动AI」哲学:AI的终极使命是加速科学发现,而非单纯商业化。同时他是AGI安全的重要倡导者,认为不安全的AGI比没有AGI更危险。
哈萨比斯坚信,AI不应仅仅是商业工具,而应成为人类科学探索的终极加速器。他将DeepMind的使命定义为「解决智能问题,再用智能解决其他一切问题」,AlphaFold解决蛋白质折叠是这一信念的最直接体现。他认为AI驱动的科学发现将是21世纪最重要的技术转变。
来源:Demis Hassabis, TED Talk, 'The incredible inventions of intuitive AI', 2018
哈萨比斯认为,开发不安全的AGI比不开发AGI更危险。他在DeepMind内部设立了专门的AI安全团队,并主张在能力研究与安全研究之间保持同步推进。他的立场与Yann LeCun的技术乐观主义形成对比,与Geoffrey Hinton的晚期警示立场更为接近。
来源:Demis Hassabis, Time Magazine interview, 'DeepMind CEO Demis Hassabis on the Path to AGI', 2023
哈萨比斯的UCL神经科学博士背景使他相信:理解大脑如何工作是构建真正智能AI的必要路径,而AI研究反过来也能帮助理解大脑机制。他将这种双向启发关系视为DeepMind区别于纯工程导向AI公司的核心特征。
来源:Hassabis, D., Kumaran, D., Summerfield, C., Botvinick, M., 'Neuroscience-Inspired Artificial Intelligence', Neuron, 2017
AlphaFold的成功核心在于将蛋白质折叠这一生化难题重新表述为「从氨基酸序列预测三维结构」的序列-结构映射问题。哈萨比斯认为,许多看似无法用传统方法解决的科学问题,一旦被正确地表述为ML问题,就能被现代深度学习以前所未有的方式攻克。
来源:Jumper, J., Evans, R., Pritzel, A., ..., Hassabis, D., 'Highly accurate protein structure prediction with AlphaFold', Nature, 2021
哈萨比斯从儿时国际象棋经历中形成了对游戏作为智能测试床的深刻理解。他认为游戏提供了明确的规则、可量化的评估指标和无限的探索空间,是研究通用智能的理想环境。Atari游戏、围棋、星际争霸等游戏研究项目是这一信念的直接体现。
来源:Demis Hassabis, Royal Society lecture, 'The Story of AlphaGo', 2016
将传统科学难题重新表述为机器学习问题,释放深度学习在科学发现中的潜力
蛋白质折叠问题困扰生物学家50年。传统方法(物理模拟、分子动力学)计算代价极高,精度有限。哈萨比斯团队将其重构为:给定氨基酸序列,预测每个原子的三维坐标——这是一个有监督的序列到结构映射问题,可以用深度学习的注意力机制和多序列比对数据训练。AlphaFold2在CASP14竞赛中以平均TM-score 0.92的成绩解决了这一难题,相当于实验精度。
用游戏作为通用智能算法的压力测试环境,从简单游戏到复杂游戏逐步验证算法的通用性
DeepMind的游戏研究路径体现了从简单到复杂的系统性验证:DQN(2013-2015)在49款Atari游戏上达到人类水平,验证了端到端RL的可行性;AlphaGo(2016)在围棋上击败世界冠军,证明RL可以处理超大状态空间;AlphaZero(2017)在无任何人类先验知识的情况下自学达到超人水平,证明了自我博弈的通用性;AlphaStar(2019)在星际争霸II中达到大师级,证明RL可以处理部分可观测的实时策略游戏。每一步都是在更复杂的环境中验证更通用的智能。
将神经科学、计算机科学、数学和特定领域知识融合,产生单一学科无法实现的突破
DeepMind的研究团队构成本身就是跨学科综合的体现:神经科学家(哈萨比斯本人)、物理学家、数学家、计算机科学家和领域专家(生物学家、医学专家)共同工作。AlphaFold团队包含了蛋白质结构生物学专家,他们的领域知识直接影响了网络架构设计(如如何编码氨基酸间的距离矩阵)。这种跨学科整合使DeepMind能在AI公司中独树一帜地发表Nature/Science级别的科学论文。
AI能力研究与安全研究必须同步推进,能力超前于安全是系统性风险
哈萨比斯在DeepMind内部建立了专门的AI安全研究团队(DeepMind Safety Team),与能力研究团队并行运作。在AlphaGo项目中,他们同时研究了如何让系统在人类希望时停止(可中断性),这成为AI安全领域的经典论文(Hadfield-Menell et al., 2016)。他在多次采访中强调:「我们不会为了更快到达AGI而牺牲安全性,因为不安全的AGI没有任何价值。」
将复杂问题分解为可枚举的状态空间,通过前瞻性推理和模式识别找到最优路径
哈萨比斯13岁成为国际象棋大师(2365 Elo评分),是英格兰历史上最年轻的大师之一。他将国际象棋训练中形成的系统性思维直接应用于科研和公司管理:将长期目标分解为可管理的里程碑,在每个决策节点评估多条路径,优先选择保留最多未来选项的策略。AlphaGo的树搜索架构(MCTS)也可以看作是这种思维方式的算法化。
哈萨比斯是全球最积极推进AGI研究的人之一,同时也是AGI安全最重要的倡导者之一。他既全力推动AGI能力的边界,又坚持认为不安全的AGI是最危险的技术。这种内在张力使他在AI界独树一帜:既不是单纯的技术乐观主义者,也不是主张暂停研究的悲观主义者,而是「负责任地全速前进」的代表。
哈萨比斯将DeepMind卖给Google,获得了巨额资金和计算资源,但也面临商业压力与科学使命之间的持续张力。他坚持DeepMind保留独立的研究文化,拒绝将所有研究成果直接商业化,但Google的商业需求不可避免地影响了研究优先级。这种平衡是他管理风格中最具挑战性的部分。
哈萨比斯的职业路径从国际象棋神童到游戏公司创始人,再到诺贝尔化学奖得主,跨越了娱乐与严肃科学的巨大鸿沟。他用游戏研究(Atari、围棋、星际争霸)推动了最严肃的AI能力进展,又用这些能力解决了最严肃的科学问题(蛋白质折叠)。游戏与科学在他这里不是对立的,而是同一思维方式的不同表达。
国际象棋神童、剑桥计算机学士、游戏公司创业、UCL神经科学博士
哈萨比斯4岁开始下国际象棋,13岁成为大师级棋手(2365 Elo)。剑桥大学以一等荣誉学位毕业后,加入Bullfrog Productions参与《主题医院》等游戏开发。1998年创立Elixir Studios,开发了《共和国》(Republic: The Revolution)和《邪恶天才》(Evil Genius)。2005年重返学术,在UCL攻读神经科学博士,研究海马体在情节记忆和想象未来场景中的作用,2009年毕业并在哈佛、MIT做博士后。这段跨越游戏创业与神经科学的经历,为DeepMind的跨学科基因奠定了基础。
创立DeepMind、被Google收购、DQN在Atari游戏上达到人类水平
2010年,哈萨比斯与Shane Legg、Mustafa Suleyman联合创立DeepMind,专注于构建通用学习算法。2014年,Google以约6亿美元收购DeepMind,哈萨比斯坚持保留研究独立性。2013-2015年,DeepMind发布DQN(Deep Q-Network),在49款Atari游戏上达到人类水平,仅使用原始像素输入,引发全球对深度强化学习的关注,论文发表于《Nature》。这是AI历史上第一次展示单一系统可以在多种不同任务上达到人类水平。
AlphaGo击败李世石、AlphaZero自学达到超人水平、AlphaStar征服星际争霸
2016年3月,AlphaGo以4:1击败围棋世界冠军李世石,被全球媒体誉为「AI里程碑时刻」。2017年,AlphaZero在不使用任何人类棋谱的情况下,通过自我博弈在围棋、国际象棋、将棋上均达到超人水平,证明了通用自我学习算法的可行性。2019年,AlphaStar在星际争霸II中达到Grandmaster级别,证明RL可以处理部分可观测的实时策略游戏。这一时期DeepMind成为全球最重要的AI研究机构之一,哈萨比斯的科学驱动AI哲学获得广泛认可。
AlphaFold解决蛋白质折叠难题、诺贝尔化学奖、Google DeepMind合并、AGI安全倡导
2020年,AlphaFold2在CASP14竞赛中以压倒性优势解决蛋白质折叠问题,2021年在《Nature》发表,2022年向全球开放超过2亿种蛋白质结构数据库。2023年,DeepMind与Google Brain合并为Google DeepMind,哈萨比斯出任CEO。2024年,哈萨比斯与John Jumper因AlphaFold共同获得诺贝尔化学奖,成为首位因AI研究获得诺贝尔科学奖的研究者。同年,他持续推动AGI安全研究,并公开呼吁国际社会对AI发展建立监管框架。
背景:哈萨比斯4岁由父亲教会下国际象棋,展现出超凡天赋。他系统研究棋谱,参加少年锦标赛,迅速成长为英格兰历史上最年轻的大师级棋手之一。
决策:在学业与国际象棋之间选择两者兼顾,将棋局分析中形成的系统性思维方式迁移到学术研究中。
决策推理:国际象棋训练了他在复杂状态空间中进行前瞻性推理的能力,以及在不确定性下识别模式和做出最优决策的直觉——这些能力后来直接影响了他对AI研究问题的思考方式。
结果:成为英格兰历史上最年轻的大师级棋手之一,同时在学业上保持顶尖水平,为日后剑桥大学一等荣誉学位奠定基础。
洞见:在一个领域的深度训练所形成的思维模式,往往可以迁移到完全不同的领域。国际象棋不仅是技能,更是一种思维训练。
背景:从剑桥大学以一等荣誉学位毕业后,哈萨比斯在Bullfrog Productions参与了《主题医院》等游戏开发,积累了游戏行业经验。他决定自己创业,在伦敦创立Elixir Studios。
决策:放弃继续深造的机会,选择游戏创业,专注于开发具有复杂AI系统的策略游戏,将AI研究与游戏设计结合。
决策推理:哈萨比斯认为游戏是测试和展示AI能力的理想平台。他想创造具有真正智能行为的游戏角色,这需要解决实质性的AI问题。游戏创业是他探索AI的第一个实验场。
结果:Elixir Studios开发的《共和国》(2003)和《邪恶天才》(2004)获得了游戏界的好评,但公司最终因资金问题于2005年关闭。这段创业经历让哈萨比斯深刻理解了将研究成果转化为产品的挑战。
洞见:创业失败是宝贵的学习经验,而非终点。Elixir Studios的关闭促使哈萨比斯重返学术,攻读神经科学博士,最终为DeepMind的创立积累了更深厚的科学基础。
背景:Elixir Studios关闭后,哈萨比斯意识到要构建真正的通用AI,需要更深入理解大脑的工作机制。2005年他进入UCL神经科学系,师从Eleanor Maguire,研究海马体在情节记忆(episodic memory)和想象未来场景中的作用。
决策:选择研究海马体与情节记忆,而非直接研究计算机视觉或语言处理等更直接的AI相关课题,以神经科学视角理解智能的底层机制。
决策推理:哈萨比斯相信,大脑的海马体不仅存储过去的记忆,还能将这些记忆重新组合以想象未来场景——这正是通用智能的核心能力之一。理解这一机制对构建能够规划和推理未来的AI系统至关重要。
结果:博士论文揭示了海马体损伤患者不仅无法回忆过去,也无法想象未来场景,证明了情节记忆与未来规划共用同一神经基础。这一发现发表于《PNAS》,成为神经科学领域的重要成果,也直接影响了DeepMind对记忆增强神经网络(如Neural Turing Machine)的研究方向。
洞见:最深刻的技术洞见往往来自跨越学科边界的研究。神经科学训练使哈萨比斯能够从生物智能中汲取灵感,设计出与纯工程方法截然不同的AI架构。
背景:完成哈佛、MIT博士后后,哈萨比斯与Shane Legg(UCL同学,AGI风险研究先驱)和Mustafa Suleyman(社会活动家)在伦敦创立DeepMind。初期资金来自Founders Fund(彼得·蒂尔)等风险投资机构。
决策:将DeepMind定位为「科学研究机构」而非「AI产品公司」,明确使命为构建通用学习算法,而非针对特定应用场景开发AI工具。
决策推理:哈萨比斯认为,真正的突破来自对通用智能原理的理解,而非针对特定任务的工程优化。通用学习算法一旦实现,可以自动适应任何问题,比专用AI系统具有指数级更大的影响力。
结果:DeepMind成为全球最重要的AI研究机构之一,吸引了大量顶尖研究人员,在强化学习、神经网络架构、AI安全等领域发表了数百篇顶级论文,并最终实现了AlphaFold等改变科学史的突破。
洞见:使命的清晰度决定了组织的长期竞争力。DeepMind「解决智能」的使命吸引了与商业AI公司截然不同的人才,形成了独特的研究文化,这是其持续产出科学突破的根本原因。
背景:2013年DQN论文引发全球AI公司对DeepMind的关注。Facebook、Google等科技巨头展开竞购。哈萨比斯在谈判中坚持要求DeepMind保留研究独立性,Google同意在收购协议中加入伦理委员会条款。
决策:选择Google而非Facebook,主要因为Google承诺了更大的研究自主权,并同意成立独立的AI伦理委员会作为收购条件之一。
决策推理:Google的计算资源和数据规模是DeepMind实现宏大科学目标所必需的。但哈萨比斯深知,一旦失去研究独立性,DeepMind的科学文化将迅速商业化,无法再吸引顶尖科学家。因此研究自主权是不可谈判的底线。
结果:收购后DeepMind获得了Google的计算资源,研究规模大幅扩张,相继发布了AlphaGo、WaveNet、AlphaFold等里程碑成果。但与此同时,DeepMind与Google之间的文化张力和商业压力也持续存在,成为哈萨比斯管理的核心挑战之一。
洞见:在与资本合作时,预先谈判并书面确认研究自主权,比依赖口头承诺更可靠。结构性保障(如伦理委员会条款)比个人信任更持久。
背景:围棋被认为是AI最难攻克的棋盘游戏:状态空间约10^170,远超国际象棋,且难以用传统树搜索方法处理。2015年AlphaGo击败欧洲冠军范辉,DeepMind随即挑战世界顶尖棋手李世石。比赛在首尔进行,全球超过2亿人观看直播。
决策:将深度神经网络与蒙特卡洛树搜索(MCTS)结合,训练策略网络(Policy Network)和价值网络(Value Network),并通过与自身对弈(self-play)不断提升棋力。
决策推理:围棋的状态空间太大,无法用穷举搜索。策略网络缩小了需要考虑的候选手的范围,价值网络估计局面优劣,两者结合使MCTS的搜索效率大幅提升。这是神经网络与树搜索的首次成功大规模结合。
结果:AlphaGo以4:1获胜(李世石赢得第四局),被《自然》《科学》等顶级期刊报道,全球媒体将其定性为「AI超越人类智能的转折点」。这一事件使AI从学术话题变为全球公众议题,推动了各国政府对AI政策的关注。
洞见:选择正确的「展示平台」与技术突破本身同样重要。围棋比赛的全球直播使AI突破获得了远超学术论文的公众影响力,推动了全球对AI的严肃讨论。
背景:蛋白质折叠问题——从氨基酸序列预测蛋白质三维结构——自1972年被提出以来困扰生物学家近50年。CASP(蛋白质结构预测关键评估)是该领域的权威两年一度竞赛。2018年AlphaFold1已在CASP13中取得领先,但与实验精度仍有差距。
决策:全面重新设计AlphaFold架构,采用基于注意力机制的Evoformer模块处理多序列比对(MSA)信息,以及结构模块(Structure Module)直接预测原子坐标,训练数据包含已知蛋白质结构的PDB数据库和大规模未标注序列数据。
决策推理:蛋白质折叠的关键洞见:氨基酸序列中的共进化信息(两个位置的氨基酸在进化中协同变化)暗示了它们在三维空间中的接近程度。注意力机制能够直接捕捉这种长程依赖关系,而传统方法难以处理。
结果:AlphaFold2在CASP14中以平均GDT_TS分数92.4获胜,远超第二名(74.9),达到实验级精度。2021年论文发表于《Nature》,引用次数迅速超过2万次。2022年向全球免费开放超过2亿种蛋白质结构数据库,覆盖已知几乎所有蛋白质,被《Science》评为2021年年度突破。
洞见:将领域知识(蛋白质共进化信息)与最新ML架构(注意力机制)深度融合,比单纯堆叠算力或套用通用模型更有效。科学突破往往需要对问题本身有深刻的领域理解,而非仅仅掌握ML工具箱。
背景:瑞典皇家科学院宣布将2024年诺贝尔化学奖一半授予David Baker(蛋白质计算设计),另一半授予Demis Hassabis和John Jumper(AlphaFold蛋白质结构预测)。这是AI研究首次直接获得诺贝尔自然科学奖,也是AI系统首次被认可为解决重大科学问题的工具。
决策:哈萨比斯在诺贝尔颁奖典礼上将荣誉归功于整个DeepMind团队,并在演讲中强调AlphaFold只是AI科学发现潜力的开端,未来AI将在材料科学、药物设计、气候变化等领域产生类似突破。
决策推理:诺贝尔委员会的认可反映了科学界对AI作为科学工具的态度转变——从怀疑到接受。AlphaFold的成功证明了哈萨比斯「科学驱动AI」哲学的正确性,也为DeepMind后续的科学研究项目提供了最强有力的背书。
结果:诺贝尔奖使哈萨比斯成为AI界最重要的公共权威之一,其「AI加速科学发现」的愿景获得了最高级别的科学认证。同时,这一荣誉也引发了关于「AI研究者是否应获得科学奖项」的广泛学术讨论。
洞见:坚持「科学驱动AI」哲学,即使在商业压力下也不妥协,最终获得了科学界最高荣誉的认可。长期主义的科研投入,往往在最意想不到的时刻得到最大的回报。
哈萨比斯在2021年多次公开场合推荐这本书,认为它是理解AI对齐挑战的最佳入门读物。他在接受Time杂志采访时表示,这本书准确描述了DeepMind安全团队正在努力解决的核心问题。
哈萨比斯在Royal Institution Christmas Lectures(2017年)中推荐了这本书,认为Dawkins对基因和进化的信息论视角——将生命理解为信息处理过程——与他对AI和智能的理解有深刻共鸣。他认为这是理解生物智能的基础读物。
哈萨比斯在多次采访中将这本书列为对他影响最深的书籍之一,称它在他少年时代「改变了他对意识和智能的整体理解」。Hofstadter对自我指涉系统、意识和形式系统的探讨,直接影响了哈萨比斯对AGI本质问题的思考框架。
哈萨比斯在多次演讲和采访中将Sutton和Barto的《强化学习导论》列为DeepMind研究的理论基础,称其为「强化学习领域的圣经」。DeepMind的所有RL研究(DQN、AlphaGo、AlphaZero)都直接建立在这本书的理论框架之上。
哈萨比斯在Wired 2017年深度采访中提到,Penrose的这本书是他少年时代对意识和AI问题产生浓厚兴趣的重要启蒙读物,尽管他最终不同意Penrose「计算无法产生意识」的核心论点。
图灵的「机器能思考吗?」问题和图灵测试直接定义了哈萨比斯对AI目标的理解。他在多次演讲中将图灵视为AI研究的精神导师,DeepMind的通用智能使命直接继承了图灵的愿景。
辛顿的深度学习研究为哈萨比斯提供了核心技术基础。哈萨比斯在多次采访中将辛顿的反向传播工作列为现代AI革命的基础,DeepMind的深度强化学习研究直接建立在辛顿的深度学习框架之上。
Sutton是强化学习理论的奠基人,其《强化学习:导论》是DeepMind研究的理论基础。哈萨比斯将Sutton的「奖励假说」(所有智能行为都可以被理解为最大化累积奖励)视为通用AI的核心理论框架。
UCL神经科学博士导师,指导哈萨比斯研究海马体与情节记忆。Maguire的研究方法——通过精心设计的实验揭示大脑特定区域的计算功能——深刻影响了哈萨比斯对科学研究方法的理解。
AlphaFold2的首席研究员,在哈萨比斯的领导下主导了AlphaFold2的技术架构设计。Jumper与哈萨比斯共同获得2024年诺贝尔化学奖,是哈萨比斯「科学驱动AI」哲学的最重要实践者之一。
DeepMind强化学习研究负责人,AlphaGo和AlphaZero的主要研究员。Silver在哈萨比斯的领导下将强化学习推向了人类水平乃至超人水平,是DeepMind游戏研究范式的核心执行者。
DeepMind联合创始人,后创立Inflection AI并加入微软。哈萨比斯的科学驱动AI哲学对Suleyman产生了深远影响,尽管两人后来在AI应用方向上产生分歧——Suleyman更倾向于将AI直接应用于社会问题解决。
与哈萨比斯在AI安全和负责任AI开发方面立场最为接近的深度学习先驱。两人共同签署了多份AI安全倡议声明,都认为AGI安全是当前AI研究最紧迫的优先级之一。
哈萨比斯的技术启蒙者,也是在AI安全议题上立场最接近的前辈。两人都认为AGI风险是真实且紧迫的,都选择了公开发声而非沉默。哈萨比斯曾公开表示辛顿是「让现代AI成为可能的人」。
DeepMind联合创始人,AGI风险理论的早期研究者,其博士论文《Machine Super Intelligence》是AGI安全研究的早期奠基文献。Legg与哈萨比斯共同定义了DeepMind的使命和AGI安全研究方向。
Geoffrey Hinton's work on backpropagation is what made the modern AI revolution possible. Without it, none of what we see today would exist.
Demis is one of the most brilliant scientists I know. What he has accomplished with AlphaFold is nothing short of revolutionary — it will change biology forever.
Demis Hassabis has done more to demonstrate the real-world scientific impact of AI than anyone else. AlphaFold is the proof that AI can solve problems we thought were unsolvable.
What Demis and the DeepMind team have achieved with AlphaGo and AlphaFold represents a fundamental shift in what we thought AI was capable of. He has shown that intelligence can be used to solve intelligence.