
选项A:拿下1000万,别去读大学
选项B:去剑桥念书
你怎么选择?给你10秒钟时间思考。
你可能常常在小红书、公众号、虎扑看到这样的选择题,大多数人只会想问:我该去哪领钱?
但...这个极端不现实的场景,确实Google AI的负责人在31年前真实面临的选择。
1993年,16岁的Demis Hassabis被剑桥大学录取了,但因为年纪太小,还不满足入学的条件,所以需要等一年再去读大学。
怎么利用这一年的Gap Year呢?
环游世界?还是在家玩游戏?
都不是,从小爱玩游戏的Demis Hassabis选择去一家游戏公司打「黑工」。
也就是在这一年时间内,他主导设计了一款史上十大最畅销游戏之一——《主题公园》(Theme Park),这款游戏累计卖出了超过1500万份。

Peter Molyneux是全欧洲最好的游戏公司创始人。他提出了一个条件:
给Demis 100万英镑,但他不能去读大学。
那在20世纪90年代是一大笔钱。对于一个17岁的穷小子来说,这是改变命运的机会。
但Demis拒绝了。
他说:"我从一开始就有个计划。我的计划一直都是要去剑桥大学读书。"
Peter至今依然记得送Demis去火车站的那天:"他就如同一粒即将破土而出的小种子,但在牛蛙制作公司,他是无法做到的。我至今依然记得这个小精灵角色消失在那条隧道里的画面。那是个令人极其伤感的时刻。"
为什么?
一个17岁的天才少年,怎么会有魄力拒绝100万英镑?
他在追求什么?
答案要从6年前说起。

1988年,列支敦士登的一个山间教堂里,12岁的Demis正在参加一场国际象棋锦标赛。
对手是前丹麦冠军,三十几岁。比赛持续了10个小时。
到了最后,Demis明明可以逼成平局——只需要放弃皇后,棋局就会陷入僵局。但他太累了,误以为被将军是无可避免的,于是认输了。
对手跳了起来,开始大笑。他问:"你为什么要认输?这是平局。"然后他立刻用夸张的动作,给Demis演示平局该怎么走棋。
Demis感到很不舒服。但真正让他开始思考的,不是这次挫败本身,而是他环顾四周时看到的景象:
教堂里坐着数百名国际象棋棋手。所有人都在全神贯注地对弈,消耗着巨大的脑力。
他突然想到一个问题:
"我们是在浪费头脑吗?这就是脑力最好的用武之地吗?如果可以把那300个大脑连接到一个系统上,那种脑力水平也许能够用于根治癌症。"
那一刻,即便热爱国际象棋,Demis也决定:这不该是他一生的事业。
这个12岁时的问题,成为了他一生的追问:智力的最好用处是什么?
6年后,当Peter Molyneux提出100万英镑时,Demis拒绝的原因很简单:
做游戏不是答案。钱也不是。
他要去找那个答案。
30年后,2024年10月,Demis Hassabis因为用AI解决了50年未解的蛋白质折叠问题,获得了诺贝尔化学奖。
这篇文章想讲的,不只是他怎么拿到诺贝尔奖,而是他怎么找到了那个12岁时的问题的答案。
答案就是一个词:Simulation(模拟)。
这个词贯穿了他整个人生。
一、17岁:第一次模拟一个世界
要理解Demis为什么拒绝100万英镑,得先知道他是怎么走到那一步的。
Demis 4岁学国际象棋,几周后就击败了父亲和叔叔。13岁时达到大师级别(Elo 2300),Under-14年龄组的世界第二。
列支敦士登的那次挫折,让他开始思考国际象棋之外的可能性。
1990年,他看到杂志上的一个比赛广告:创作《太空侵略者》的原创版本,获胜者能去牛蛙制作公司(Bullfrog Productions)工作。
Demis做了一款叫《国际象棋入侵者》的游戏,赢得了比赛。
创始人Peter Molyneux至今记得他第一次见到Demis的场景:"他走进门,看上去大概12岁上下。我心想:'天啊,我们该拿他怎么办?'"
因为太小不能合法雇用,Demis的薪水都是装在棕色纸信封里发的。
1994年,17岁的Demis和Peter Molyneux一起设计了那款改变他命运的游戏:《主题公园》。
玩家可以建造主题公园,设计过山车,给炸鱼薯条店的东西定价。
但最重要的是:游戏里的游客有自主行为。
Demis设计的AI模拟了真实的人类行为:
如果离惊险的过山车距离太近,过山车上刚吃过东西的人就会呕吐
当其他人看到地上的呕吐物时,他们也会呕吐
这样就得有很多清扫人员,以便赶在被人们看到前快速清扫干净
这些细微的模拟动作,Peter Molyneux说,是"前所未有的发明,独一无二"。
这是Demis第一次用代码模拟一个世界。他发现了一件事:模拟不只是娱乐,模拟是理解世界的方式。
游戏大获成功。1500万份。
Peter看到了Demis的天赋,于是提出了那个100万英镑的条件。
但Demis拒绝了。
同学都觉得他疯了:"你为什么不拿钱?100万英镑可是一大笔钱!"
Demis心里很清楚:做游戏很有趣,也能赚钱。但那不是12岁时那个问题的答案。
他要去剑桥,去理解什么是智能,什么是理解。
Demis去了剑桥,学Computer Science。但真正改变他轨迹的,是1997年发生的一件事。
二、剑桥:模拟不是计算,理解才是智能
1997年5月,IBM的"深蓝"击败了国际象棋世界冠军卡斯帕罗夫。

全世界都在欢呼人工智能的胜利,但Demis的反应很不一样。
他说:"我对'深蓝'的印象并不深,卡斯帕罗夫的思维让我印象更深。"
为什么?
"卡斯帕罗夫在国际象棋上的造诣跟野兽般的机器不分伯仲,但卡斯帕罗夫还能做到人类能做到的其他所有事。这是一项巨大的成就,而'深蓝'只会下象棋。它的系统里缺少了我们所认为的智能,即通用性和学习的想法。"
深蓝是暴力计算。它每秒评估2亿个棋局,靠穷举,不是理解。
Demis意识到:真正的智能不是计算,是理解。
而理解的核心能力,是模拟。
在剑桥,他接触到不同学科的人——生物学家、哲学家、艺术家。有人不断跟他讲一个问题:"蛋白质折叠"。
蛋白质是生命的机器。由氨基酸链构成,折叠形成特定结构。如果能从氨基酸序列预测蛋白质结构,就能设计出治愈癌症或分解塑料的新型蛋白质。
这个问题从20世纪60年代起就有人研究,但没人解决。
Demis当时想:"人类是否真的智慧到能够折叠蛋白质?我觉得它是可以解决的,但我认为需要人工智能来解决。"
但在创办AI公司之前,他决定先去理解人类大脑本身是如何工作的。
2005年,他去了UCL(伦敦大学学院),攻读神经科学PhD。
三、神经科学:大脑如何模拟未来?
Demis在UCL的研究主题是:想象、记忆和失忆症。
他想搞清楚的核心问题是:人类大脑是如何模拟未来场景的?
他的第一篇论文发表在PNAS上,是个里程碑式的发现:
海马体****受损的患者,既有失忆症(无法记忆过去),也无法想象新体验(无法模拟未来)。
这证明了:记忆和想象是同一个系统。
换句话说,大脑模拟未来的能力,依赖于它存储过去经验的能力。
这篇论文被Science杂志评为"2007年度十大科学突破"之一。
但对Demis来说,这个发现的意义远不止于此。它回答了一个更深层的问题:
什么是智能?
Demis的答案是:智能就是模拟的能力。
一个智能系统,不只是记住过去发生了什么,还要能模拟未来可能发生什么,然后基于这些模拟做决策。
这让人想起物理学家Richard Feynman说过的一句话:
**"What I cannot create, I do not understand."**(凡是我不能创造的,说明我还不够理解。)
Demis想明白了:要理解智能,就要能创造智能系统。而创造的方式,就是模拟。
DeepMind后来做的所有事,都是这个思路。
2007年,在UCL的一次演讲上,Demis遇到了Shane Legg。
Shane当时在讲:"机器真的变得更智能了吗?有人说是,有人说不是。它们现在的计算速度变得快多了,但在通用智能方面,我们真的在进步吗?"
两个人聊完后,Demis感觉:"我们俩守护着一个不为人知的秘密。"
那个秘密是:通用人工智能(AGI)是可能的,而且需要用模拟的方式去实现,而不是深蓝那样的暴力计算。
但在学术界,这个想法是不被接受的。
Demis说:"学术界没人会支持我们所做的事。几乎可以说在学术界,'人工智能'一词是个令人尴尬的词。如果你说自己在研究人工智能,那显然你不是一个真正的科学家。"
所以,他说服Shane:正确的做法是创办一家公司。
四、DeepMind:在模拟中自我进化
2010年,DeepMind成立。前两年完全隐身,办公室在秘密地点,没有网站。

去面试的人会说:"我刚刚给我妻子发了短信告诉她我要去的具体地方,以防这是个可怕的骗局,我会遭到绑架。"
他们在做什么?
Demis的目标很清楚:建造世界上第一台通用学习机器。
他们的方法是:让AI在模拟环境中自我学习。
第一个测试是雅达利游戏。
他们创建了一种叫DQN的算法,结合了强化学习和深度学习。目标是:用同一个系统,玩几十款不同的游戏。
第一个游戏是Pong(乓)。

开始时,AI根本不知道要做什么。它只知道得分是好事,其他什么都不知道——不知道自己在控制什么,不知道规则,不知道目标。
Demis当时对Shane说:"也许我们错了,我们甚至连《乓》都玩不好。"
但突然,它拿到了第一分。
"这是偶然吗?不,不是。它真的得分了。"
接着它得了一些分,然后赢了第一场比赛。3个月后,没有人类能击败它。
从像素到动作,完全自学。这在当时是第一次有人做到。
然后他们试了《Breakout》(打砖块)。
300场比赛后,它的水平几乎和任何人类一样出色。但他们让系统又玩了200场比赛,它做了一件很惊人的事:
它发现最佳策略是在一侧打通一条通道,把球打到墙后面。
这不是人类教它的。这是它自己在模拟中发现的。
50个游戏之后,DQN可以从头开始自我训练,达到人类水平甚至超过。
2014年,Google以4亿英镑收购了DeepMind。
但真正让全世界震惊的,是2016年发生的事。
五、AlphaGo:模拟出人类从未走过的棋
围棋被认为是人工智能的圣杯。它的潜在棋谱比宇宙中的原子还多。
多年来,所有用AI试验围棋的尝试都失败了。
2016年3月,韩国首尔,AlphaGo对战李世石——过去十年里最伟大的棋手之一,"围棋界的罗杰·费德勒"。

第37步棋,AlphaGo走了一步没有哪个人类棋手会走的棋。
专业评论员说:AlphaGo认为,这步棋只有万分之一的概率是人类会走的。
但它走了。而且是对的。
一位棋手说:"我原以为AlphaGo是基于概率计算的,而且它只是一台机器。但AlphaGo肯定很有创意。围棋已经被研究了几千年,AlphaGo发现了一些全新的东西。"
AlphaGo赢了。李世石投子认输。
这一刻,全世界意识到:地球上诞生了新事物。
对中国来说,这是"斯普特尼克时刻"——像1957年苏联发射人造卫星一样,引发了全球AI竞赛。
但Demis没有停下来。
2017年,DeepMind发布了AlphaZero。
AlphaGo是基于人类数据训练的——它先观看了10万场厉害的业余棋手的比赛,然后通过强化学习与自己对弈数百万次。
但AlphaZero完全不需要人类数据。
它剥离了所有人类的知识,完全从零开始,在模拟中与不同版本的自己对弈,从错误中学习。
训练速度有多快?
AlphaGo需要几个月。
AlphaZero早上开始训练,完全随机对弈。到茶歇时达到超人类水平。到晚餐时,成为有史以来最强大的象棋实体。
它成了自己的老师。
Demis一直相信的事得到了证明:真正的智能不是学习人类的经验,而是在模拟中自我进化。
但他想做的,远不止游戏。
六、AlphaFold:模拟生命的基础

2018年,DeepMind参加了CASP——蛋白质结构预测关键评估,每两年举行一次,被称为"蛋白质折叠的奥运会"。
评分标准:超过90分算成功。
CASP13的结果出来了:DeepMind以50%的优势击败了第二名。
但约翰·穆特(CASP的联合创始人)说了一句话,让Demis很失望:
"阿尔法折叠没有获得足以让其切实得以被利用的数据。"
诺贝尔奖得主Paul Nurse也说:"比如说像我这样的人查验我自己的生理问题——阿尔法折叠做不到。"
Demis后来回忆:"那个时刻让人感觉有些惭愧。我们觉得自己非常努力,也成功了,而且在一个难住了全世界的问题上我们的表现是最好的。我们知道我们很烂。"
团队里有人开始质疑:"这在某种程度上是一场愚蠢的冒险。也许考虑人工智能的现状,那还是太难了。"
有人说了一句话:"最长的梯子并不能帮你登上月球。"
什么意思?用现有的方法优化,可能永远也到不了目标。需要完全不同的思路。
2019年,Demis做了一个决定:
"从这里开始,我们需要加倍努力并尽快实现。我觉得我们不能再浪费时间了。"
他组建了一个突击小组,约翰·江珀(John Jumper)担任组长,加入了生物学专家。
关键是:他们重写了整个数据管道,而不是在原有系统上修修补补。
有人说:"你必须给那些花朵绽放的空间,不能在创作阶段强迫它。"
4个月后,进展出现了。
速度突破:CASP13期间1-2天折叠1个蛋白质,现在1秒折叠数十万个。
质量突破:许多结构达到高精度水平。
2020年11月,CASP14的结果公布了。
约翰·穆特发来邮件:
"你们团队在CASP14中表现得非常出色,不论是相对于其他组还是在模型的绝对准确性方面。恭喜你们完成了这项工作,真的非常出色。"
约翰·江珀说:"半个世纪之后,我们终于找到了蛋白质折叠问题的解决方案。"
Demis给父母打电话:"嘿,妈妈,我有事要告诉你。我们做了一件事,可能是件大事。"
接下来,Demis做了一个决定:
"我们想将这个公开,不仅确保代码是公开的,我们还要让所有人都能便利地获得这些预测结果。"
他们在一个月内预测了所有已知的序列,公开了2亿个蛋白质结构。
发布当天,从655个用户暴涨到10万个并发用户。
Demis说:"这些是馈赠给人类的礼物。"
2024年,Demis Hassabis和John Jumper因为这项工作,获得了诺贝尔化学奖。
但故事还没有结束。
七、World Models:模拟世界,才能理解世界
2025年12月,在一次年终访谈中,Demis谈到了DeepMind现在在做的事:World Models(世界模型)。

他说了一段很关键的话:
"LLM理解语言,但缺少空间感知。World Models理解物理世界的因果关系。"
这是DeepMind和大多数AI公司的差异。
大多数公司在做什么?
Scaling LLM——让模型更大,数据更多,训练更久。LLM学的是语言的统计规律。
但Demis认为,这还不够。
费曼说过:"凡是我不能创造的,说明我还不够理解。"
Demis现在要做的,就是创造(模拟)整个物理世界,来真正理解世界。
真正的智能,需要模拟物理世界。
DeepMind现在有两个系统:Genie和Simma。
Genie生成可交互的虚拟世界,Simma在虚拟世界中探索。
把它们组合起来:Simma在Genie生成的世界中学习,Genie按需生成无限的训练场景,AI可能实现"自我进化"。
这就像当年的AlphaZero:不需要人类数据,在模拟中自我学习。
但这次模拟的不是围棋,而是整个物理世界。
Demis说:
"我的梦想是在模拟中重新运行生命进化,观察意识、社会结构如何涌现,理解我们从哪里来。"
这让人想起他在剑桥时的那个直觉:蛋白质折叠可以用AI解决。
现在他在追问更大的问题:意识、创造力、情感…这些是可计算的吗?
他说:
"这是我人生的核心问题:图灵机的极限在哪里? 到目前为止,宇宙中没有发现任何不可计算的事物。"
"如果我们造出AGI,然后用它模拟人类心智,对比真实心智,就能看出差异在哪里。也许差异是creativity?emotions?dreaming?consciousness?这将回答'人之为人'的本质。"
当AlphaGo击败李世石时,Demis说他的感受很复杂:
"我既兴奋又有点失落。围棋是美丽的神秘,我们破解了它。这有点苦乐参半。"
科学家的宿命是:解开谜题的同时,失去神秘感。
但Demis还是选择了这条路。
尾声:智力的最好用处
从12岁在列支敦士登的教堂里问出那个问题,到48岁获得诺贝尔奖,Demis花了36年。
回过头看,他的整个人生都在围绕一个核心理念:Simulation(模拟)。
17岁,他模拟了一个主题公园。神经科学PhD,他研究大脑如何模拟想象和记忆。AlphaGo/AlphaZero,在模拟对弈中自我进化。AlphaFold,模拟蛋白质折叠。World Models,模拟整个物理世界。
而他一直在追问的,是那个12岁时的问题:智力的最好用处是什么?
答案是:
用最好的头脑,去模拟和理解整个世界。
不是为了下好一盘棋,不是为了赢一场比赛,而是为了解决癌症、阿尔茨海默病、能源危机、气候变化——那些真正能改变人类命运的问题。
在2025年的那次访谈里,Demis说:
"我的使命是帮助全人类安全地跨越AGI这条线。完成这个任务后,我会好好休个假。"
"我为这个时刻准备了一生。从下棋、做游戏、研究神经科学…都是为了这个时刻。"
"这是我一生一直为之奋斗的时刻。"
也许,这就是智力的最好用处。