不到4年完成顶级AI实验室博士、顺便辅修了哲学、GPT图像生成核心5人研究团队成员、OpenAI视频生成模型Sora小组成员……刚刚,OpenAI华人研究科学家陈博远,完成了MIT博士论文答辩!
他激动地表示:
我很兴奋能够在工业界继续推进世界模型的发展——现在加入了GPT图像生成和Sora视频团队。
没有什么比看到自己的研究改变领域范式更令人兴奋的事情了!
在如此重要的时刻,他自然也感谢了导师和亲友,得到了大家的祝贺。
最后,他强调:视觉世界模型对于具身智能将至关重要。
此外,他承诺,一如既往地与社区分享知识。
华人天才,剑指世界模型
陈博远(Boyuan Chen),现任OpenAI研究科学家,负责训练GPT图像生成技术的五位研究人员之一,同时也是Sora视频生成团队的成员。
他拥有麻省理工学院(MIT)电子工程与计算机科学(EECS)博士学位,并辅修哲学。
他的研究重点是世界模型、具身人工智能和强化学习。
他认为,结合这些领域,AI能够更好地理解并与物理世界互动。
2023年5月-2023年8月,在GoogleDeepMind实习期间,他跟随Fei Xia博士学习。
在DeepMind,他主要参与了基于大规模合成数据的多模态大语言模型(MLLM)训练项目;构建完整数据合成pipeline,其指令微调技术后续被Gemini 2.0采用。
在博士答辩中,陈博远特意感谢了DeepMind的导师Fei Xia。
陈博远还是个高中生时,参加了一个夏令营。
这是两人第一次见面,Fei Xia就向陈博远介绍了深度学习——那时他甚至还不懂Python和NumPy。
这正是他踏入AI领域的起点,Fei Xia就像他的“吴恩达”。
Fei Xia两次邀请他到GoogleDeepMind完成高含金量实习。
读博第一年,陈博远因为没有论文产出陷入低谷。这是他读博最艰难阶段,而Fei Xia协助他发表了首个爆款研究NLMap。
项目地址:https://nlmap-saycan.github.io/
此后,两人还合作了SpatialVLM。
论文链接:https://arxiv.org/abs/2401.12168
他发表的多篇论文,在学术界和工业界均获得认可,包括《Diffusion Forcing》、《SpatialVLM》和《History Guidance》等。
矢志通用机器人
在去年的博客中,他对具身智能做出了乐观的判断:
我可以负责任地告诉大家具身智能一定是下一个一百年最令人激动的技术,并且我们在有生之年很有希望见证通用机器人的诞生。
同时,他也更愿意看到社会细水长流地投入通用机器人的发展——
看到科研工作者,如我导师Russ所说的那样,“可以以结果为导向的科研,但不可以网红视频为导向”;
看到政府和投资人在长线看好具身智能的同时,不因为硬件公司的融资需要而盲目相信机器人大模型;
看到创业者勇往直前,用细分领域的成功为真正的通用机器人铺路。
在随笔最后,他表示,“自己也愿意用自己的一生给世界带来真正的通用机器人”
而OpenAI被曝出:在通往通用人工智能(AGI)的竞赛中,加大了机器人技术的工作力度,正在组建一个能够开发控制机器人算法的团队,并且似乎正在聘请专门从事人形机器人研究的机器人专家。
师出名门,文理双修
在2021-2025年期间,他在MIT计算机科学与人工智能实验室(MIT CSAIL)读博士,师从Russ Tedrake教授和Vincent Sitzmann教授。
2017-2021年,在加州大学伯克利分校本科阶段,他师从机器人领域大牛Pieter Abbeel教授,获计算机科学荣誉专业(EECS荣誉班)、应用数学双学位。
他本科毕业于加州大学伯克利分校,主修计算机科学和数学,并在伯克利学过一年哲学。
在读本科期间2017年11月-2020年3月,他还创办了一家面向中小学的机器人教育公司,主导竞赛用机器人套件的软硬件开发,产品直接面向参赛学生群体。