北鲲云为基因测序数据分析提供算力基石

我国十三五期间对150万人进行了基因组测序，每个人大约产生300-500GB的数据，基因数据总量在十三五末期达到EB级别。而对于宏基因组学，仅1克土壤样品的宏基因组测序就可以产生50TB的原始数据。当前基因组数据正以12-18个月10倍以上的速度增长，远远超过了著名的摩尔定律。

如何高效处理大规模基因测序数据是高性能处理生物信息分析必须面对的课题，而对大规模的生物信息数据的研究将有助于突破健康医疗、环境污染、新能源等领域传统方法的限制，为相关行业的发展提供新的解决方法。

基因测序数据分析需要海量算力的支持

基本的数据处理和分析涉及以下四步：第一步，对测序获取的短序列进行比对拼接；第二步，比对拼接后，进行全基因组基因注释。包括基因组组分分析，SNP分析，编码基因预测，重复序列注释，Non-codingRNA基因注释，MicroRNA基因注释等；第三步，对预测的基因进行功能注释；第四步，比较基因组和分子进化分析，如快速进化分析、共线性分析、基因家族分析等。常用的进化树分析软件如 MEGA。

在整个过程中，需要用到近百种软件。各个软件资源使用特征又差别很大，例如，拼接软件需要大量的内存消耗，比对软件则是典型的数据密集型计算。复杂的生物信息计算使得生物测序数据的处理和分析需要海量的计算资源，这对高性能计算平台提出了更高的要求。

如何高效进行基因测序数据分析？

鉴于许多用户受限于内存容量以及相应的计算能力而不能应用于大规模超长生物序列分析工作，北鲲云提供包括基因测序数据分析软件、计算资源、数据库的整体解决方案，帮助用户解决高通量测序所带来的海量生物数据的存储与处理等问题。用户无需任何编程基础，无需安装复杂的生物信息数据分析对比软件，无需下载庞大的生物数据库，只需在图形化界面进行简单点击操作，就能在云上搞定基因测序数据分析。

北鲲云预装了300+行业主流软件以及Genbank、EMBL等常用参考数据库，并提供高性能计算软件及基于各种MPI的自研软件的安装、部署、调试服务；峰值计算能力达到140Pflops，存储容量为10PB，可极大地加快生物测序数据处理过程，提高研究效率。

数据资源的极速膨胀迫使人们需求一种强有力的工具去分析这些数据，从海量的生物学数据中需求生物学规律，这些规律是解释生命之谜的关键。在这条生命科学的漫漫征程中，北鲲云将紧跟科技的发展和用户需求的变化，持续进行研发迭代升级，伴随生命科学行业一路前行。

除基因测序数据分析外，北鲲云还提供了蛋白折叠、虚拟筛选、蛋白结构模拟、分子动力学模拟等应用场景的高性能计算解决方案，助力生命科学领域的研究和发展。

展开阅读全文

页面更新：2024-04-22

标签：序数基因基因组高效生命科学基石海量注释序列需求生物数据用户资源信息软件

1 2 3 4 5

北鲲云为基因测序数据分析提供算力基石

团购特惠｜造价师BIM造价软件套包推荐，让你的效率提高到飞起

震惊，某上市公司营销总监周末摆地摊，超低地摊价硬核来袭

热烈祝贺｜斯维尔入选广东省首批建设培育产教融合型企业

深度学习模型识别耳部疾病，准确率提升至95%

分子对接从数周缩短至2小时，北鲲云为新药研发按下加速键

借力北鲲云超算，深圳大学智能机器人科研再提速

全国优秀工程应用大赛报名通道已开启，号角已吹响，邀您来战

「工程造价知识小课堂」阳台女儿墙部分算面积吗

斯维尔BIM+GIS项目管理平台助力雄安新区建设

板面筋外伸，如何布置？

特斯拉超级计算机算力全球第五，展现无人驾驶领域野心

第十五届“斯维尔杯”全国优秀工程应用大赛获奖名单

答疑解惑｜BIM软件4大常见问题解答

助力鲲鹏生态，斯维尔与华为鲲鹏成立联合实验室

冠军回访｜第十一届BIM-CIM大赛冠军团队背后的故事

团购特惠｜造价师BIM造价软件套包推荐，让你的效率提高到

答疑解惑｜BIM软件4大常见问题解答

北鲲云亮相第七届全国计算生物学与生物信息学学术会议

北鲲云应邀出席第三届大数据与人工智能在海洋环境分析

2020年，这些远古生物的谜题被解开

未来自动翻译软件如何突破多语种翻译障碍？

3D打印的生物反应器中可培育出微小的大脑

警惕“安全提示”陷阱手机清理软件“坑”过你吗？

科学家试图通过基因改造蚊子来遏制疟疾

百万级遥感图像细粒度目标识别数据集发布