服务器、存储产品购买热线:400-860-6708 ERP、管理软件购买热线:400-658-6000云服务产品销售热线:400-607-6657
生命科学高性能解决方案
摘要:

  生物信息学(Bioinformatics)是在生命科学的研究中,以计算机为工具对生物信息进行储存、检索和分析的科学。它是当今生命科学和自然科学的重大前沿领域之一,同时也将是21世纪自然科学的核心领域之一。其研究重点主要体现在基因组学(Genomics)和蛋白质组学(Proteomics)两方面,具体说就是从核酸和蛋白质序列出发,分析序列中表达的结构功能的生物信息。

背景介绍:

  生物信息学在短短十几年间,已经形成了多个研究方向,其中与高性能计算相关的主要研究重点如下。

  序列比对

  序列比对(Sequence Alignment)的基本问题是比较两个或两个以上符号序列的相似性或不相似性。从生物学的初衷来看,这一问题包含了以下几个意义:从相互重叠的序列片断中重构DNA的完整序列。在各种试验条件下从探测数据(probe data)中决定物理和基因图存贮,遍历和比较数据库中的DNA序列,比较两个或多个序列的相似性,在数据库中搜索相关序列和子序列,寻找核苷酸(nucleotides)的连续产生模式,找出蛋白质和DNA序列中的信息成分。在序列对比的过程中将会产生巨量的数据,这对我们的存储系统带来了较大规模的挑战。

  现在用于存储的硬盘容量每14个月会有一倍的增长,而基因序列的数据量则每5月左右会翻一番,例如:CeleraGenomics 和Sanger Centre 等主要基因研究机构都在管理数以万亿字节计的数据,其数据库信息量已经超过美国国会图书馆全部藏书,也超过了人类开展生物学研究以来积累的数据量。

  序列拼接

  序列拼接是将测序生成的reads短片段拼接起来,恢复出原始的序列。该问题是序列分析的基本任务,是基因组研究成功与失败的关键,拼接结果直接影响到序列标注,基因预测、基因组比较等后续任务。基因组序列的拼接也是基因组研究必须解决的首要难题。其困难不仅来自它的海量数据(以人类基因组序列为例,从数量为10兆级的片断恢复出长度为亿级的原始序列),而且源于它含有高度重复的序列。

  从计算机方面来讲,在拼接初期,会有大量的初始数据导入内存,然后对这些数据进行处理,因此,序列拼接对于计算机的内存量和计算能力都有非常大的需求。

  基于结构的药物设计

  人类基因工程的目的之一是要了解人体内约10万种蛋白质的结构,功能,相互作用以及与各种人类疾病之间的关系,寻求各种治疗和预防方法,包括药物治疗。基于生物大分子结构及小分子结构的药物设计是生物信息学中的极为重要的研究领域。为了抑制某些酶或蛋白质的活性,在已知其蛋白质3级结构的基础上,可以利用分子对齐算法,在计算机上设计抑制剂分子,作为候选药物。然后在数据库中进行对比并且得到优势结构,选择使用分子模拟的方法实现药物分子的设计。

解决方案介绍:

  基于分析我们得出,生物信息学类计算的核心内容是内存密集型,存储密集型,结合浪潮多年来的经验,我们为客户提供针对化专业化的解决方案。

  浪潮高性能应用集群主要解决了生物信息学中的四个主要问题:

  高性能

  对于高性能计算而言,一方面是浮点处理性能,另一方面为CPU本身的综合性能,浪潮结合生物信息学行业的特点,推荐使用Intel处理器,不仅实现了较高的处理性能,并且在能效比,内存支持,以及CPU本身的架构上intel都有很大的优势。

  内存问题

  在生物信息学应用中,先期数据的载入对于内存容量的要求越来越高,浪潮采用大内存服务器四路或者八路胖节点,可以在单节点中配置高达2TB内存,充分达到应用的实际需求。

  存储容量问题

  海量存储系统是生物信息学计算的先决条件。浪潮不仅可以提供了专业级的直连存储,更有8Gb接口的光纤存储系统,通过专有的存储节点构建Lustre并行文件系统,接入以太网,甚至40GB的Infiniband网络,总体容量可达到PB级,除此之外还考虑到用户的数据安全,数据备份等,从根本上解决了生物信息学的数据存储难题。

  系统高稳定性

  一套高稳定性的系统能够使我们的生物信息学应用更加方便快捷,同时也能够高效率的处理数据,保证业务不中断,浪潮通过统一的集群监控管理,作业调度,结合浪潮高性能的服务器,从各个方面保证了整套系统的稳定性,大大提高了用户的使用稳定性和减少了故障率,为用户提高生产力提供持续不间断的支持。

  http://10.110.9.115:8080/lcjtww/resource/cms/2014/09/2014090315331694743.png

客户收益:

  应用分析

  浪潮拥有一支专业化的HPC应用分析团队,可以针对客户应用,运用测试工具得出具体的硬件平台需求,从而帮助浪潮提为客户提供针对性的高性价比HPC解决方案。

  应用加速

  浪潮不仅为客户提供硬件产品、解决方案,而且研究HPC技术发展,在异构并行计算领域提前布局,建立一个优秀的国际应用开发团队,可以满足客户各种定制化开发服务,满足用户的特殊需求。

  在CPU技术方面,该团队成功与BGP合作完成单频属性提取、多时窗倾角扫描、体曲率提取、构造导向滤波、特征值相干、纹理属性提取、数据分离等石油勘探解释与处理CPU多核并行算法开发和优化项目。

  在GPU技术方面,浪潮具备从算法级、桌面级、集群级开发能力,与北京基因组所、中国科学院、西北工业大学、BGP合作完成Blastn、LES-LBM、PSTM、RNA等多款GPU软件,较原有软件获得几十倍性能提升。

  在MIC技术方面,浪潮在2011年8月24日与Intel成立中国并行计算联合实验室,目前实验室成功地在生命科学、计算流体力学、气象、石油、计算金融领域开展MIC研究,其相关成果在SC11、IDF12上被展出。

相关产品:

1

相关案例:

关于浪潮

集团简介 文化理念 资质荣誉 董事长致辞 新闻与公告 市场活动

探索浪潮

关键应用主机 通用服务器 浪潮云 浪潮云ERP 大数据资源与交易 智慧城市

支持服务

产品资料下载 查询服务进度 获取帮助 安全通告

联系浪潮

招聘 营销网络地图 联系我们

快速链接

ERP支持与服务 浪潮电子采购平台 投资者关系 投行项目 道德遵从

在社交媒体上关注我们

拨打咨询电话