英伟达与华大基因合作,使用 CUDA 进行全基因组测序
雷锋网消息,12月18日,GTC 2019大会在苏州举行。在长达两个小时的大会上,英伟达CEO黄仁勋带来了 AI框架、开发工具、数据科学、云计算、实时渲染以及 5G 等等方面的新动作。而在垂直领域,黄仁勋则表示,从运输、医疗、金融到零售,各行各业都在争相利用AI的自动化能力。
今年,英伟达为CUDA增加了两个新的主流应用——5G vRAN和基因组处理,基因组行业的华大基因对应用实现了支持。
据雷锋网 (公众号:雷锋网) 了解,华大基因的生命科学超级计算机以每天60个基因组的吞吐量,改变了全基因组测序(WGS:Whole Genome Sequencing),并同时降低了成本。
全基因组测序会分析整个基因序列,可以检测由遗传性疾病引起的DNA突变,突变导致的癌症扩散,或是追踪基因突变引发疾病的机制。
同时这项技术也用于研究畜牧业、农特和导致疾病的微生物。
但是,如何解决大数据存取能力以及计算能力不足等瓶颈问题,是基因组学研究和应用面临的一大难题。基因组处理流程在行业标准中被称为GATK,这一过程可根据参考绘制DNA短链,以重建基因组并找出变异,属于计算密集型任务。
现场,黄仁勋发布NVIDIA Parabricks基因组分析工具包,Parabricks是一个基于CUDA加速的基因组处理工具包,可以用于发现变异,并能产生与GATK最佳实践流程一致的结果,实现30-50倍的加速。
Parabricks提供了DeepVariant工具,利用深度学习技术进行基因变异检测。现在,华大基因就采用了Parabricks。借助若干GPU服务器,华大基因可以按照测序仪生成数据的速率来处理基因组。
当然,除了发布会上推出的工具包,2018年11月,英伟达还推出了专门针对医疗影像的超算平台Clara,让开发人员通过开发各种应用程序来处理现有数据 。但是,在今天的发布会上,黄仁勋并没有现场展示CLARA的相关内容。
对此,在接受采访时,黄仁勋开玩笑说,发布会只有短短的两个小时,他无法将所有的东西都展示出来。但是他特别提及了联邦学习,他表示,很多公司都希望利用这种方法去解决数据隐私问题。“事实上,上午我们展示联邦学习技术在自动驾驶上的应用,在医学影像上也是共通的。英伟达提供的 Drive Federated Server Global Model 可以提供给每个 OEM 厂商使用,结合各自的数据,帮助各个厂商提升彼此的模型。”
此前,英伟达医疗副总裁Kimberly Powell曾向雷锋网表示,医疗领域是英伟达规模最大、也是最为成熟的一个领域。而英伟达更多的是扮演一个“赋能者”的角色,为整个AI生态系统打造了一个完善的开发工具,帮助创业公司更好地执行医疗AI的应用。
。