华大基因与华为云的“智慧碰撞”让测序效率稳步提升

支付几百元将你的唾液邮寄,你的基因组序列就会得到分析,所得出的结果不仅可以诊断疾病,还可以用于未来疾病的风险预测。相信已经有不少人耳闻甚至使用过这样的基因测序“黑科技”产品。

近年来,随着基因产业迅速崛起,测序门槛也越来越低。如果把人体比作一台精密的机器,基因测序就好比“人体机器”的“使用说明书”。随着未来基因技术的不断发展,人类或许有能力解读自己的生命图纸,并获得开发人体潜力极限的能力。

华为云基因测序解决方案架构/来源:华为云官网

云计算:打通线上线下形成容器混合云,容器镜像自动同步,资源、应用统一管理运维,使得线上线下功能和环境一致,用户使用习惯一致。

据业内人士分析,虽然目前因疫情影响导致在拍剧组全部停工,但整体上第一季度甚至未来更长一段时间,对已经拿到发行许可证的电视剧影响并不明显。“排播、备播剧是充足的,已经拿到证的甚至可以消化一部分内存。任何情况下,只要剧的质量过硬,播出都没有问题。目前在播的一些剧目也有播出效果很好的,比如湖南卫视播出的《下一站幸福》这类甜宠解压剧。另外《孤城闭》《大宋宫词》等本身市场期待值很高的作品,影响也不大。只是在宣传上,受到大环境和观众整体情绪影响,需要更低调谨慎一些,一些话题和宣传点可能不再适用。”

此外,线下集群架构不支持高通量基因测序数据的多任务并行,面对海量基因数据,每个基因测序都是一个极其消耗计算资源的过程,传统的数据存储和分析方式并不能支持高通量测序的需求。

科技服务部门有很多复杂基因组,在各个测序分析的阶段需要借助不同规格的计算资源,线下计算集群往往无法适应快速的扩缩容;

面对海量测序数据,华大基因的痛点如何化解?

2019年第四季度,全国各类电视剧制作机构共计生产完成并获准发行国产电视剧91部3868集。其中,现实题材剧目共计60部2314集,分别占总比例的65.93%、59.82%;历史题材剧目共计31部1554集,分别占总比例的34.07%、40.18%;古代题材剧目共计17部898集,分别占总部数、集数的18.68%、23.22%。

目前,华为云团队已经协助华大基因平滑上云,双方一起完成超过300万核时计算,平稳运行超过100天,实现了基因测序环境快速部署,从过去的3-5天缩短到仅需20分钟。与此同时,双方还通过构建2万核资源池,满足了海量数据、高并发处理的需求。如今,华大基因已可以灵活应对业务波动,按需使用和释放计算资源,在尽可能提升测序效率的情况下,有效降低测序工作的IT成本。

计算资源比较紧张,在使用峰值时,任务经常需要排队等候;

由于基因测序对算力的需求是波动的,通常第四季度的消耗最大而第一季度最少,这会导致服务器的数量无法得到很好的控制。如果选择采购可以满足最大峰值的集群,那么在业务量不能时刻保持高峰时,就会存在很大的成本浪费。而一旦服务器不足,则无法满足业务高峰时的测序任务;

2019年第四季度“拿证”的剧目包括杨幂主演的《暴风眼》、王凯主演的《孤城闭》、刘亦菲和井柏然主演的《南烟斋笔录》,以及李少红执导的《大宋宫词》等。

在未来生物技术发展与云计算的共同推动下,基因测序“黑科技”必然会造福更多的人类。也许有一天,现有的医学疑难杂症也会被一个个攻克。在这条生命科学的漫漫征程中,面向未来,华为云将紧跟科技的发展和用户需求的变化,持续进行研发迭代升级,伴随基因产业一路前行!

除了华大基因外,在国内基因行业Top 15的企业中,14家选择了与华为云合作。

经过多方考量,华大基因选择了华为云作为合作伙伴。据悉,华为云在2018年全球首家推出了以Kubernetes为基础的基因容器服务GCS,能够支持集群自动扩缩容,灵活应对业务增长对资源带来的压力。当测序需要大量资源时,云平台能够快速扩容提升处理能力,解决峰值压力;在业务低谷时,可以释放资源,降低成本。在不同的测序分析阶段,GCS都能为测序企业提供不同规格的计算资源。

事实上,生命科学的研究竞赛,很多时候已经变成了一场“算力”的比拼。好的科研成果通常是基于庞大的计算数据。随着越来越多临床基因检测,如:产前检测、肿瘤检测等,项目的落地,对算力的需求也会逐步增加。那么,该如何为基因测序提供更强的算力呢?

华为云基因容器GCS:20分钟快速部署,成本下降30%

“云+AI+5G”引领基因产业智能化升级

值得一提的是,在本次项目中,华为云基于轻量级的容器技术,对华大基因常用的测序软件进行了针对性的优化处理。借助容器的高并发度,每个节点上可同时执行多个任务,带来整体计算性能的提升,一举解决了线下集群和公有云服务都难以解决的高通量测序问题,让基因测序数据的计算分析更省时、更轻松。

目前,基因测序技术在基础研究、技术研发和临床实践上已经得到了大量应用。而这背后离不开云计算、AI、大数据等新一代信息技术的鼎力支持。

其中,武汉未来组作为国内首家长读长测序服务公司,承接了大量动植物基因组、转录组、微生物基因组及宏基因组测序分析等科研服务项目,月产出数据量高达数十Tb。华为云为其提供Kunlun超大内存裸金属服务器,支持承载重楼百合150G基因组装,使得测序原始数据处理速度得到快速提升。华为云还协助未来组打通了线下数据生产平台与云端高性能计算平台之间的网络链路,让线下产生的数据可以快速上传到云端,从而进行后续的分析。并由华为云专业的技术团队负责整体的运维管理,大大降低了未来组的IT运维压力。

人工智能(AI):通过作业群组管理、拓扑感知的亲和性调度,GPU线性加速比提升35%,降低人工智能50%训练时间。

借助GCS的生物信息流设计器,再复杂的业务也可以编排到一个流程中,一键搞定测序任务,避免多套系统操作带来的不便;专为国内“生信人”设计的流程控制语法,结构简练、易懂,既满足了流程编写的易用性,同时也保证了流程迁移的方便性;GCS的流程热力图,以非常直观的方式随时了解测序进展,精确掌握资源消耗走势,指导优化方向;还可根据判断条件选择执行分支,满足企业复杂的流程管理需求。

吴清辉指出,事故现场小客车压在翻覆的出租车上,横躺在内侧及中线车道。据初步调查,小客车准备下交流道时,与行驶在中线的出租车擦撞。两名驾驶员酒测都没有酒精反应。

鲲鹏算力:整型计算+多核契合测序分析,Minimap2软件在鲲鹏920下性价比领先同代X86 20%。

作为全球领先的生命科学前沿机构,目前华大基因已经完成HPV检测总数超过420万例,完成耳聋基因检测250余万例,完成无创产前检测510多万例。这些基因测序的流程中,动辄涉及到数万/数十万个基因测序及模型建立,依赖大量的计算和存储资源,随着未来业务量的那一步扩展,将使华大基因的传统IT架构面临一定挑战:

华为云GCS助推测序企业提升竞争力

在医疗健康行业智能升级的大背景下,基因测序也需要融合更多的新兴技术手段来达到更高的精准度和科学性,华为云将释放“云+AI+5G”的强大动能,让测序企业更省、更快、更安心,实现行业的智能化升级。

此外,华为云GCS还具备全自动化测序分析能力,为用户提带来便捷、安心的一站式服务:

大数据:通过计算存储分离、内存及分布式缓存、智能调度,大数据性能提升40%,成本降低50%。

桃园市消防局表示,现场伤员共有5名,无人受困,其中99岁的老妇在到院前已无呼吸心跳,急救后宣告不治。另一名67岁女性有胸痛症状,但意识清楚,也已经送医治疗,另外3名轻伤患者未送医。

kensez.com

Related Posts

Read also x