合作将加速基因组分析的工作流程;我们将共同开发一个大规模的语言模型,用于发现和开发靶向治疗。
英伟达今天宣布与麻省理工学院和哈佛大学下属的布罗德研究所合作,为Terra云平台提供快速分析海量医疗数据所需的AI和加速工具。这将使超过25,000名平台用户受益,包括来自学术界、初创企业和大型制药公司的生物医学研究人员。
此次合作旨在将英伟达在人工智能领域的专业知识和医疗计算平台与博德研究所全球知名的研究人员、科学家和开放平台连接起来,重点关注三个关键领域:
在Terra平台上提供NVIDIA Clara Parabricks:Parabricks是一个GPU加速软件套件,用于测序数据的二次分析,现在可以在六个新的Terra工作流中使用。用户现在可以使用Clara Parabricks在1个多小时内完成整个基因组的分析,而在基于CPU的环境下完成这项工作需要24个小时,使用Parabricks的计算成本降低了一半以上。
构建大语言模型(LLM):为了深入探索人类生物学,研究人员将使用今天发布的针对生物学LLM模型的AI应用框架——NVIDIA BioNeMo,开发DNA和RNA(生命的“基本构建模块”)的基本模型。
为基因组分析工具包(GATK)带来更强大的深度学习:英伟达致力于为博德研究所(Bode Institute)的GATK工具包创建一个新的深度学习模型,这是一个超过10万名研究人员使用的行业标准工具,用于帮助研究人员识别与疾病相关的基因变异。这将有助于新药开发者研究新的治疗方法。
英伟达医疗业务副总裁金伯利鲍威尔(Kimberly Powell)表示:“整个医疗生态系统需要更先进的计算工具,以便我们能够在理解疾病、开发诊断和提供治疗方案方面取得突破。通过扩大与博德研究所的合作,我们可以发挥大规模语言模型的力量,并最终提供联合解决方案,让研究人员的深入见解真正惠及患者。\”
博德研究所希望提供一个开放的云平台,将研究人员相互连接起来,将研究人员与实现科学突破所需的数据集和工具连接起来,从而实现新一代的生物医学合作研究。
博德研究所首席数据官安东尼菲利帕基斯(Anthony Philippakis)表示:“生命科学领域正处于一场数据革命,研究人员迫切需要一种新的方法将机器学习引入生物医学。我们希望通过此次合作,进一步落实‘数据共享与合作进程’的使命,拓展基因组学研究。”
用于疾病研究的大规模语言模型
英伟达的BioNeMo框架包括蛋白质和化学领域的预训练LLM模型,可以简化训练、推理和扩展。BioNeMo是NVIDIA NeMo威震天框架在化学、蛋白质和DNA/RNA序列方面的扩展。
通过BioNeMo,开发人员可以有效地训练和部署具有数十亿参数的生物LLM模型。
基于这一合作,两个团队将共同创建一个新的模型,将其添加到BioNeMo集合中,并在Terra平台上提供。
特定领域人工智能的英伟达软件
NVIDIA Parabricks GPU的加速工作流为研究人员提供了更快的周转时间和更低的成本来进行广泛的基因组数据分析。在博德院GATK最佳实践——生殖细胞突变检测分析流程中,Parabricks在GPU上的分析速度提升了24倍,而成本减半。
博德研究所的研究人员还可以访问——MONAI,这是一个用于医学成像AI的开源深度学习框架,以及——NVIDIA RAPIDS,这是一个用于加速数据准备的GPU加速数据科学工具包。后者可用于基因组单细胞分析。
了解有关Clara Parabricks与Terra集成的更多信息,并注册NVIDIA BioNeMo LLM服务以抢先体验。
观看英伟达创始人兼首席执行官黄仁勋的GTC主题演讲,了解英伟达与博德学院的更多合作。