本届诺奖的“含AI量”仍在持续上升。继2024年诺贝尔物理学奖出乎意料地颁发给两位AI先驱后,10月9日,2024年诺贝尔化学奖揭晓,来自美国华盛顿大学的生物化学教授大卫·贝克(David Baker)因构建全新蛋白质而获奖,来自谷歌DeepMind公司的丹米斯·哈萨比斯(Demis Hassabis)和约翰·乔普(John M. Jumper)则因开发了蛋白质结构预测“神器”AlphaFold获奖。他们的获奖背后同样与人工智能技术息息相关。
蛋白质之谜
诺贝尔化学奖为什么跟人工智能扯上了关系?这要从小小的蛋白质说起。蛋白质是生命活动的物质基础,尽管只有纳米大小,其复杂程度却可以超过任何一台人造机器。
此前科学家们发现,蛋白质只由20种简单的氨基酸经过排列组合拼接而成,就像有设计图纸一样,一条氨基酸序列可以自发折叠成唯一的三维结构,然后在细胞内发挥特定的功能——有的可以结合DNA,控制基因的开关;有的可以识别病原体,启动免疫反应。
蛋白质折叠有无数可能性。图源:瑞典皇家科学院
然而,一条氨基酸序列从理论上来说可以有无数种折叠方式,直到1980年代,生物化学家们仍然没搞明白,蛋白质是如何在一瞬间自主找到正确的结构并发挥功能的,其过程犹如变形金刚从钢铁巨人瞬间变成跑车般神奇。
因此,蛋白质三维结构和功能的预测发展成了现代生物化学和分子生物学中的一个重要研究领域,此前确定蛋白质结构的传统方法,如X射线晶体学和冷冻电子显微镜,既耗时又昂贵。
从文科生到“上帝之手”
事实上,本届诺奖得主大卫·贝克早期在哈佛大学学习的专业是哲学和社会科学,是100%纯文科生。但就在大学最后一年,他选修了发育生物学,在这门课堂上接触了蛋白变性剂实验后,从此开启了“新世界的大门”。
1984年,大卫·贝克从哈佛大学本科毕业,不久后,他加入了美国加州大学伯克利分校细胞生物学家兰迪·谢克曼(Randy Schekman,2013年诺贝尔生理或医学奖得主)的实验室,并于1989年获该校博士学位。1993年,大卫·贝克加入华盛顿大学开始了独立研究生涯,2003年晋升正教授,2006年当选美国科学院院士。
大卫·贝克。图源:华盛顿大学官网
为了破解“蛋白质结构”之谜,开始从事独立研究的大卫·贝克决定开发一套能够根据序列预测蛋白质结构的软件,也就是后来大名鼎鼎的Rosetta系列软件,它通过巧妙设计,能够模拟出蛋白质大致的形状,使研究人员可以更快预测出蛋白质的结构。
既然能够预测蛋白质结构,那么能不能“从头设计”蛋白质?早在2003年,大卫·贝克的团队就设计出了一个新型蛋白,这是人类第一次创造出自然界中不存在的全新蛋白,他也被媒体称为“上帝之手”,并因此获得了本届诺贝尔化学奖。
谷歌AlphaFold半路杀出
不同于许多共享诺奖得主间的合作关系,大卫·贝克与来自谷歌的丹米斯·哈萨比斯和约翰·乔普则是“相爱相杀”的竞争关系。
在蛋白质结构预测领域,大卫·贝克的Rosetta软件成绩一向名列前茅。在每两年举行一次的预测比赛中,Rosetta作为“常胜将军”占据着统治地位,而这一格局被来自谷歌的人工智能科学家打破。2020年,谷歌第二代AlphaFold击败了Rosetta,一举成名。
AlphaFold是谷歌DeepMind团队开发的一项基于深度学习和神经网络技术的算法,它拥有强大的运算能力,通过不断地升级改进,其预测结果几乎达到了实验测定的精度。借助AlphaFold能够预测的蛋白质结构已达到近2亿种。
丹米斯·哈萨比斯和约翰·乔普。
预测“神器”AlphaFold的AI模型由丹米斯·哈萨比斯和约翰·乔普共同提出。丹米斯·哈萨比斯是DeepMind公司的联合创始人,毕业于剑桥大学计算机科学专业,后在伦敦大学学院获得认知神经科学博士学位。约翰·乔普则是DeepMind高级研究科学家,曾被《自然》杂志列为2021年度十大科学人物。
在和AlphaFold的竞争中,大卫·贝克意识到AI的强大,他将深度学习技术引入Rosetta软件,并率先公开了源代码。随后,AlphaFold2也很快开源。而正是这种良性竞争推动着这一新技术快速发展,双方最终共同问鼎“诺奖”。
编辑 黄力雯 审读 伊诺 二审 张玉洁 三审 詹婉容