颜宁回国的原因可能有很多,但应该和AlphaFold无关

#颜宁发文回应离美归国:行胜于言#

1. 网上人均结构生物学家?

前几天颜宁回国就任深圳医学科学院首任院长的新闻刷屏。和几年前她离开清华去普林斯顿一样,各种揣测满天飞。不过让我感到最为神奇的是网上突然成了人均结构生物学家,一个被到处转的说法是因为AlphaFold的出现,颜的实验室做的冷冻电镜工作已经落伍了。只要用AlphaFold,一切蛋白结构就能知道。

我不是结构生物学出身,让我看任何一个蛋白结构,我都是一脸懵逼。可是就我对冷冻电镜等结构生物学技术粗浅的认识,以及AlphaFold出现后的一些报道的跟踪,尚且无法想象AlphaFold如何把颜宁等结构科学家取代掉——要是结构生物学家都消失了,甭管是电镜解出来的还是AlphaFold预测出来的蛋白结构,俺看不懂问谁去啊?

最逗的是,有网友居然在微信群里发了AlphaFold网页,说去上面把氨基酸序列一打,蛋白结构就出来了,所以颜这些结构生物学家都可以被淘汰了。我看了心里都乐了,互联网果然卧虎藏龙,这些结构我是毛都看不懂,随便一网友就能了如指掌,把普林斯顿的结构生物学家都比下去了。下次诺贝尔奖还是颁给为广大网友得了。

说这些大话的人,我都不确定是否对蛋白结构有基本的认识,对AlphaFold到底是干啥的,估计也很无知。

2. 蛋白结构和AlphaFold

构成生命体的几类生物大分子,多糖和脂肪在人体里主要是能量来源,理解它们怎么代谢储能供能比较关键,具体结构不是那么重要——对不少人来说,脂肪的位置可能比脂肪的结构关键得多。核酸如DNA,是储存遗传信息。虽然双螺旋结构人尽皆知,但对于这类分子,我们更关注里面存了什么信息,不是分子的结构。

不是说以上各类分子的结构真不重要,只是对于了解这些分子的功能来说,结构不是那么关键。可蛋白质不一样,蛋白质的功能与它的分子结构息息相关。比如现在大家都知道新冠病毒通过S蛋白与人体ACE2受体结合进入人体细胞。S蛋白和ACE2受体为什么能结合?这是它们的蛋白质分子结构决定。新冠S蛋白不能和小鼠的ACE2受体结合,为什么?因为小鼠ACE2受体在结构上与人的有差异,让S蛋白没法结合了。

从上述例子不难看出认识蛋白质的分子结构对于我们理解它的功能很有帮助。但想认识蛋白质的结构非常困难。这和核酸不一样,核酸只要知道序列——四种碱基的排列,然后知道哪里是起始位点——就是该从哪里开始“读”序列,整个遗传信息就能读出来了。蛋白质由20种氨基酸构成,但知道蛋白质的氨基酸序列(生物学上叫做一级结构),我们是看不出最终分子结构的。

还是以S蛋白为例,拿着S蛋白的基因序列,也就是核酸序列,一个学过遗传学的生物学本科生就能把它转换成蛋白质氨基酸序列,也就是把遗传密码给翻译出来。但拿着翻译出来的S蛋白氨基酸序列,如果你要找人“画”出三维结构,那么不好意思,全世界最好的生化学家、蛋白结构专家,都没法仅凭这一点信息给“画”出来。

所以蛋白质的结构需要实验去解析出来,像颜宁的实验室是用冷冻电镜这个技术来解析蛋白质结构。但解蛋白质的结构不是那么容易的,有些蛋白质比较复杂,完成实验解析就很难,需要非常长的时间,甚至会有做不出来的。这导致我们现在知道结构的蛋白质远远少于现实世界里的蛋白质。

可随着基因测序技术的发展,我们有海量的基因组序列信息,这些对应了海量的蛋白质氨基酸序列信息。如果在氨基酸序列到蛋白质结构可以做到一定程度的预测,那么就可以立刻填补大量的蛋白质结构信息空缺。AlphaFold就是在这个氨基酸序列到蛋白质结构预测上的突破,不过要注意,它还只是一种预测的工具。

在AlphaFold之前预测蛋白质结构也有多年积累。主要问题是准确度比较低,没法实际应用。但近年来随着AI,机器学习以及神经网络构架投入到这一领域,预测的准确度开始攀升,AlphaFold则做到了一个飞跃,2020年出道的AlphaFold2准确度可以用于实践[1]。

AlphaFold大幅提升了蛋白结构预测准确性

3. AlphaFold取代蛋白结构学家?

AlphaFold2预测蛋白结构的准确程度可以进入实践运用,是不是就意味着结构生物学家们饭碗不保?这种说法简直就是在说DNA测序技术飞跃了,所以遗传学家要被取代了。真当以前的遗传学家就是做测序?做蛋白结构的科学家就是画个三维蛋白结构图?

其实很多做蛋白结构的科学家都是迫不及待地尝试运用AlphaFold来辅助、促进他(她)们的研究。今年6月Science上发了一系列细胞核核孔复合物的结构解析论文[2]。核孔复合物决定什么物质能进出细胞核,从分子角度看它是个极为复杂的庞然大物——由600-1000个蛋白组成。看Science上发的这一批论文的标题:

Science上核孔复合物一系列论文标题

你看,人家AI,AlphaFold用得可欢了,但是是取代关系吗?看最后一篇论文的标题,是冷冻电镜(cryo-EM)和AlphaFold结合。

对蛋白结构,我知之甚少,就像在文章开头说的,给我一个蛋白结构,我真看不懂,是不明白在看啥,毕竟不像有些网友那么牛逼,直接网页在手,什么蛋白结构都懂。所以对于AlphaFold的应用,我推荐去看洛斯·阿拉莫斯国家实验室的一个讲座视频[3]。推荐这个视频的原因主要有以下几点:

  1. 它比较清楚地说明了AlphaFold的作用,特点包括优缺点
  2. 从蛋白结构研究的实践出发分析了应用AlphaFold的一些场景
  3. 最重要的一点,看不懂蛋白结构的我,居然能大概听明白。在微信群里感到被碾压的智商,终于在这个讲座里找了回来。

可以看一下讲座的关键结论:

最关键的是第一点(主讲人语),AlphaFold是提供蛋白结构假说(hypotheses)的良好工具。注意是假说,不是真实的蛋白结构。这类良好假说能辅助结构科学家,加速利用包括冷冻电镜在内的实验解析结构。而AlphaFold预测出的结构也能由结构生物学家来完善。最后,它让蛋白结构研究有了一个新的工作流程(work-flow)。什么叫新的工作流程?是加入了AlphaFold,不是说没工作了。

而且AlphaFold仍然有缺陷,比如:

AlphaFold的一些局限性

AlphaFold的原理是让AI“学习”利用已知的蛋白结构,寻找规律,再利用AI自学出来的规律,预测没“学”过的蛋白结构。要进一步完善AlphaFold,大概也离不开蛋白结构研究的继续发展。

4. 偏离正题的AlphaFold猜疑

颜宁归国出任深圳医学科学院这事本身有挺多值得讨论的地方。但说她因为AlphaFold就过气了啥的,这都不是不值得讨论的问题,而就是离谱。

就深圳医学科学院本身而言,从各种报道来看是对标美国NIH。这个定位是挺奇怪的。毕竟NIH是一个非常庞大的机构,NIH名字里的I其实是institutes,研究所的复数,多个和健康相关的研究单位的合集。而且NIH的涉及范围极为庞杂,不仅是一些报道里提到的自己有研究,也资助其它研究单位、项目。NIH很多时候还提供了重要的基础设施构架。比如新冠药物研发的不少关键临床试验就利用了NIH在这方面建设出来的框架,得以加速完成。

从广泛的健康相关研究,到大量经费支持院外科研,再到诸多科研基础设施建设,要说中国需要一个类似NIH的机构,这个想法不错,但由深圳医学科学院来做是否合适?甚至它是否真有能力做?

然后媒体报道中的不定级别、编制的社会化用人制度。可NIH恰恰是美国官僚体系的一部分。很多时候我们对中国学术单位的官僚气息极为厌恶,认为都是行政级别、事业编制的错,搞得竞争力缺乏。可是我们需要区分僵硬的官僚体系,与必要的行政管理(administrative work)。别说对标NIH这样庞大的科研机构群,即便是NIH属下一个NCI或NIAID,“灵活”的级别编制真的可行吗?是否能完成有效的管理?

就颜宁出任院长一事,更值得讨论也应该是,作为一个科学家,她过往的经历经验,是否有足够的准备去构建并管理一个看来会比较庞大的机构?她本人无疑是非常出色的科学家,AlphaFold之类的也不会影响她继续成为优秀且成功的科学家。可是出色的科学家与出色的管理者能否对等?出色的管理者与一个能有效管理庞大机构的出色管理者是否亦有区别?

这些或许是更值得探讨的话题。而探讨这些,不是为了说深圳医学科学院哪里有问题,或颜宁哪里不好,而是希望通过此类讨论,真正让深圳医学科学院这类新设立的机构,有一个明确、合理的定位。

可惜,我们的主流媒体忙着发通稿,而自媒体忙着八卦。

参考资料:

1.https://www.nature.com/articles/d41586-020-03348-4

2.https://www.science.org/doi/10.1126/science.abq4792

3.https://www.renafobis.fr/seminaires-web-renafobis/alphafold-changes-everything-incorporating-predicted-models-in-x-ray-and-cryo-em-structure-determination

展开阅读全文

页面更新:2024-03-24

标签:分子结构   生物学家   受体   氨基酸   深圳   序列   蛋白质   蛋白   科学家   原因   结构   颜宁

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020-2024 All Rights Reserved. Powered By 71396.com 闽ICP备11008920号-4
闽公网安备35020302034903号

Top