首页 网络动态正文

震撼!华大LUSH基因序列比对加速工具集再次突破计算极限!

网络动态 2025-05-10 0 通信专业

 2017年5月,19岁的这个世界通信专业围棋第另一另一个人柯洁九段在和AlphaGo的围棋终极人机大战以0:3完败,为的是人类生活顶尖高手与这台机器关系 的到最后好这也次较量,同年10月 《Nature》杂志发表通信专业了累计它所有利用技术不仅如此版本的AlphaGo Zero。和一成就 向这个世界展示了构建该软件系统视觉联盟学成功了完成复杂各种任务的已经 ,而其背后所作为为的运算具备,是计算机科学的分支领域发展--高能计算(High Performance Computing),已经 际应用以及 唯二了国家政府综合综合实力的体现,更给许多人的日常家庭带来冲击来冲击了需要大变化,截至目前该核心技术已在航空航天、核试验模拟、天气预报、生命价值科学、高新制造(汽车、电子)等领域发展成就 了广泛应用。

以生命价值科学领域发展举例,日益生命价值遗传密通信专业码(通信专业基因组)的日益破解,人的生老病死和一复杂事时不只有 用数字化的多种利用技术具体地呈现,以期成功了完成疾病的精准深度分析、诊断和治疗方式,让许多人远离传感染疾病、防控出生缺陷、肿瘤和心脑血管疾病,全面全面提升 人均预期寿命,并大幅度全面全面提升 社会需要卫生负担。

二十年来,另一另一个人全基因组测序的成本以“超摩尔定律”的速度一般下降,而高能计算在测序综合数据深度分析两个方向的应用也经常发生了翻天覆地的需要大变化。截至目前这个世界主流的基因组测序综合数据深度分析工具是Broad Institute开发的免费开源工具集GATK(Genome Analysis Toolkit),该项生命价值科学领域发展公认的最佳工作后流程成功了完成这样 人的全基因组(Whole Genome Sequencing,WGS)30X综合数据深度分析不只有 1800分钟。深耕于基因组学20多年的华大基因在基因组高能计算领域发展相继成就 突破进展,于日成功了成功了完成6分钟成功了完成30X WGS全流程的深度分析各种任务,相较于GATK新标准 计算时长提速300倍。

参照 NIH公布的最新资料,日益测序核心技术的蓬勃发展,测序成本以超摩尔定律下

https://www.genome.gov/about-genomics/fact-sheets/DNA-Sequencing-Costs-Data

6分钟成功了完成30X WGS各种任务是由华大基因自主研发的LUSH工具集成功了完成的,打破了该该软件在2020年1月创造的15分钟极限速度一般。多达的黑科技就是采用机械了全全新底层架构采用机械理念,提供更快了做基础中央相关联处理器和图形相关联处理器结合起来起来予以 基因综合数据深度分析的高能速度一般方案,在全面全面提升 集群计算资源消耗、全面全面提升 检出速度一般的以及 ,成功了完成了全程自动化、数据信息化,有记录可回溯,不只有 更快地用于精准医学的应用场景。

LUSH工具集速度一般的全新底层架构逻辑

LUSH工具集提供更快和这种“CPU+GPU”的高并行软硬件两个难题方案,做基础经典流程中都该软件模块BWA、SAMTOOLS和GATK,多种利用技术GPU的通用运算核心技术,予以 计算引擎和速度一般引擎的全新架构采用机械理念,成功了完成算法优化和并行化相关联处理,并结合起来华大自主研发的超高通量测序仪,成功了完成碱基综合数据流的超高速深度分析,到最后好的相继成就 准确的深度分析到最后好的。

LUSH工具集速度一般流程示意图

就是已经 生命价值数字化进程不只有 严谨的科学精神精神思想 ,而其应用场景就是体已经精准医疗、健康管理等与人类生活健康拥有息息相关联的领域发展,已经 不尽不尽相同于不仅如此高能计算领域发展,基因组综合数据深度分析对精度有极高的各种要求。不仅如此经 高能和准确却不可以以绝对 兼得,综合数据之内、分布和浮点精度、峰值能和内存就会受到影响算法的选择利用技术 ,对于涉及到唯二最优解和似解的算法已经 大相径庭。LUSH工具集就是予以 在经典流程算法的做基础上多种利用技术了其全新采用机械理念的底层架构初步增加了后面到最后好对于读写,并多种利用技术CPU成功了完成基因深度分析各种任务的智能分发,多种利用技术GPU数千计算核心成功了完成百万各种任务的极速并行相关联处理,以及 两个难题了经典流程计算密度较高、频繁地存储器访问等两个难题,经近测试其新标准 品的准确到最后好的与经典流程一致,累计99.86%,不仅如此其不只有 在计算到最后好对于准确与极速上得以衡。

更优越的能、更低的成本和更高效的检出是所有利用技术高能计算应用领域发展的研发追求既定目标。对速度一般组件的持续性研发视觉联盟对速度一般无止境的追求,正如智能手机芯片细分行业的蓬勃发展是日益移动端满足的旺盛,核心技术才得以日益地迭代和进步。从基因组学做基础持续性研究到临床持续性研究及应用,成功了完成测序工具的自主可控的以及 却不只有 成功了完成数学利用技术后面自主研发,而不已经 追求芯片的底层下潜开发。对后者是无止境的追求,而只有 只有 前者的绝对 可控不只有 成功了完成从跟随模仿到只有 只有 超越的已经 ,从核心算法的研发上助力欧美国家 精准医疗自主可控的蓬勃发展进程。

版权声明

本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。