亚马逊云科技助力生物计算设计发展 两大方向实现突破

本报记者 曲忠芳 李正豪 天津报道

“工业生物(工业菌种)相当于IT领域的芯片,是实现串联整个生物技术的一个最关键核心,要设计好工业生物,非常需要数字技术的支撑。”近日,在中国科学院天津工业生物技术研究所(以下简称“天津工业生物所”)与亚马逊云科技联合举办的生物计算设计沟通会上,天津工业生物所所长王钦宏向《中国经营报》等媒体记者如是解释。

天津工业生物所成立于2012年,是由中国科学院和天津市人民政府共建的科研机构,目前已建设全链条的国家级创新科技平台。2019年,天津工业生物所成立了生物设计中心平台实验室,围绕生物计算设计,与亚马逊云科技共同探索生物技术和信息技术相结合(即“BT+IT”)。截至目前,双方合作通过突破传统开发模式提升了科研效率,加速了科研成果的转化,尤其是核心数据库和专业应用工具设计两大研发方向上实现了技术突破,推动了合成生物学的发展。

记者了解到,生物计算是指以生物分子作为“数据”的计算模型,最早于上世纪下半叶提出并发展起来,它是一门涉及生物学、生物工程、计算机科学与工程等跨学科的科学,尤其是近十年里伴随着数字技术的进步与突破,日益走上发展的快车道。

亚马逊云科技中国区商用与公共市场事业部总经理李晓芒表示,通过云原生技术及行业积累实践,能够推动合成生物学领域的技术进步,开拓生物制造产业的数字化创新路径。

核心数据库 专业工具设计实现突破

云原生架构能够帮助企业充分利用按需交付、快速拓展部署、弹性和更高级别的服务,可以提高开发人员的工作效率、业务敏捷性、可扩展性、可用性、资源利用率和成本节约。亚马逊云科技与天津工业生物所经过四年多的合作,从最初的数字中心到现在的所有IT架构、开发理念、开发模式都以云原生的方式实现,大致经历了三个阶段:第一阶段,从2019年至2020年属于初步尝试的阶段,学习了解云计算技术及新工具,认识理解云计算在解决具体场景需求方面的能力。第二阶段,到了2021年步入快速发展期,陆续有10多个软件应用实现了云上部署,并尝试构建云原生现代化应用,探索出适合生物设计中心业务模式的最佳实践。第三阶段,从2022年到现在,使用托管服务和创新服务进行云原生创新,加大对云计算优势的利用,在提升科研效率的同时实现成本节约。天津工业生物所生物设计中心副主任廖小平指出,通过与亚马逊云科技的合作,主要是在核心图数据库、专业应用工具设计两大研发方向上取得了突破。具体来讲,推出了全球首个基于图数据库的大肠杆菌调控代谢关系知识图谱ERMer,以及全流程高通量编辑序列设计云平台AutoESD等20多项生物计算设计工具和软件应用。

“细胞中的代谢调控非常复杂,通常不同类型的调控数据散落在各个不同的数据库,生物学家很难通过仅关注与所研究的代谢物/蛋白质密切相关的一两类相互作用来识别这种复杂调控级联关系。”廖小平表示,ERMer首次提供了全局的代谢调控图谱,并通过可视化框架实现了丰富的搜索功能,如多步查询、最短路径查询等。ERMer采用专门为高度关联的复杂数据集的高效存储和查询设计图数据库架构,这打破了传统的低效数据检索方式,有效增强用户和图谱的人机交互,降低了使用门槛。

面向微生物遗传操作,天津工业生物所生物设计中心团队开发得到了第一个能够在所有操作类型、任何基因组位点和跨物种上进行精确、自动化和高通量编辑序列设计的云平台AutoESD。AutoESD的开发采用了基于云端的无服务器架构,确保了高可靠性、稳健性和可扩展性,能够在几分钟内并行处理包含上千个编辑序列设计目标的数百个设计任务,从而帮助天津工业生物所团队进一步简化运维,使得开发人员可以专注于业务代码和创新,与传统开发方式相比,开发时间缩短75%,总体拥有成本降低50%。

布局大模型 探索AI 2.0

谈及新一轮由大语言模型引发的AI热潮,亚马逊云科技在AI领域已有积累和布局,尤其是对AI大模型的底层支持方面,主要表现在:一是通过与英伟达等硬件厂商的合作,实现对不同算力需求的供给;二是数据存储的支撑以及相应的数据处理和大数据服务。亚马逊云科技的生态中包括许多科研机构,积累合作了许多公开数据集,在全世界范围内免费开放,能够支持数据的预处理和训练;三是公司内部已有很多AI团队,如上海的AI实验室开发了DGL深度图学习框架,此外还有Amazon SageMaker代表的端到端平台,提供了机器学习的相关服务及算法。

天津工业生物所生物设计中心主任马红武表示,天津工业生物所肩负国家工业生物技术发展的重任,并正在加速利用云计算推动相关技术的研发和成果落地。当前AI正在步入2.0时代,因此希望与亚马逊云科技的合作也进入2.0时代,在更广泛的领域开展深度合作,未来要把AI大模型、图数据库、知识图谱和工业生物大数据结合起来,推动生物计算设计乃至合成生物学的进一步发展和突破。

廖小平也表示,生成式AI对各个行业领域的冲击较大,对生物计算设计同样如此。在AI领域,团队已有一定的积累且取得了一定成果,我们发现借助大语言模型,可以快速地提升目前预测的效果,因此下一步将尽快部署在生物计算领域——或者合成生物计算领域自己的大语言模型。

记者了解到,天津工业生物所“十四五”期间将在二氧化碳人工合成淀粉等三大主攻方向及五个新兴前沿方向做探索。随着云原生、AI等数字技术与生物学的深度交叉与融合发展,有望进一步推动我国合成生物学的突破与进步。

(编辑:吴清 校对:颜京宁)

展开阅读全文

页面更新:2024-05-29

标签:亚马逊   中国科学院   生物   科技   天津   图谱   助力   生物学   架构   模型   方向   领域   数据库   工具   工业   数据   技术

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020-2024 All Rights Reserved. Powered By 71396.com 闽ICP备11008920号-4
闽公网安备35020302034903号

Top