精准快速 宝德八路服务器解决高通量生物测序难题

高通量测序,又称为下一代测序技术,可以一次性对几十万至几百万条DNA分子进行序列测定,对一个物种的转录组和基因组进行深入、细致、全貌的分析,是现今应用最广泛的测序技术。高通量测序数据广泛应用于生物学、医学、遗传科学等诸多领域,具有重要研究价值。

精准快速 宝德八路服务器解决高通量生物测序难题

随着测序技术的不断改善和测序成本的持续降低,每天都会有海量的DNA序列产生,使得生物数据量呈指数规模增长,计算机是存储和处理DNA数据的主要工具,DNA测序数据的增长速度已经远远超过了计算机微处理器和存储设备的增长速度。

面对如此迅速增长的庞大的短读序列数据集,武汉市中心医院认为传统的数据挖掘算法和工具遭受了巨大的挑战:如何建立智能学习数据库系统;如何对生物大数据存储访问和计算;如何进行隐私保护;如何结合领域知识设计新的适用于生物大数据挖掘分析的算法和工具。如何有效管理、分析、充分利用这些信息,已成医院发展亟需解决的问题。

精准快速 宝德八路服务器解决高通量生物测序难题

具体来说,院方主要面对三个层次的挑战。第一个挑战是数据的访问和程序的运算。因为大数据都是分布式存储的,随着数据量的增长,如何建立一个有效的平台,使分散存储的数据能够摆脱计算机内存的限制和大数据处理的障碍,进行分布式计算。第二个挑战是不同的大数据有不同的语义和领域知识,如何能够更好地挖掘语义和领域知识,为数据所有者和消费者服务。第三个挑战集中在算法设计方面,生物大数据稀疏且具有各种各样的混合数据,数据有不确定性、不完整性和多源性等特点,如何用数据融合技术进行处理,并挖掘出蕴含其中的复杂和动态信息,通过局部学习,得到一个反映全局问题的融合模型。

高通量测序数据有其自身的特点和规律,存在大量的信息冗余,如果不对其进行压缩而直接存储或传输会消耗巨大的硬件存储设备,同时也会给网络传输带来很大的负担。传统的数据压缩算法并不能够很好地压缩序列,这就需要开发专门针对序列的数据压缩算法和工具。而尽管高通量测序数据的压缩研究已取得一定成果,但其在计算资源、压缩算法方面仍面临巨大挑战,对计算资源的要求也越来越大,处理时间过长是数据分析最重要的问题。

精准快速 宝德八路服务器解决高通量生物测序难题

宝德“超人”系列PR8800G

为此,宝德为武汉市中心医院提供“超人系列八路服务器PR8800G+双路云服务器PR2710G+磁盘阵列GS6316D”的计算存储一体化解决方案,以卓越的处理性能、强大的I/O能力和RAS特性,对高通量测序下的短读序列进行数据处理和压缩存储。凭借高通量和低成本的强大优势,使科研人员更易于开展大规模全基因组测序,并得到最高效、最充分的测序技术应用。同时,科研人员能够对珍贵的动植物样本进行高覆盖率、高测序深度的测序,深入挖掘样本中的信息,帮助临床医生结合患者表型进行精准医疗决策。

展开阅读全文

页面更新:2024-05-18

标签:通量   序数   武汉市   生物   基因组   语义   数据处理   分布式   精准   序列   算法   难题   领域   快速   服务器   计算机   工具   数据   技术   科技

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020-2024 All Rights Reserved. Powered By 71396.com 闽ICP备11008920号-4
闽公网安备35020302034903号

Top