近日,全球基因测序和芯片技术的领导者因美纳(纳斯达克股票代码:ILMN),宣布推出全新的人工智能(AI)算法--PrimateAI-3D,它能高度准确地预测患者的致病基因突变。相关研究结果发表在6月2日的《科学》(Science)期刊(第6648期)的两篇论文里,文章详细介绍了这种算法的训练方式及其在英国生物样本库(UK Biobank)队列中50万个基因组的应用情况。另外两篇关于灵长类动物进化研究的论文也同期发表,并为PrimateAI-3D的开发提供了信息。
"PrimateAI-3D将最新的人工智能技术与先进的基因测序能力结合在一起,这一产品的推出,振奋人心。"因美纳首席执行官Francis deSouza表示,"因美纳将持续助力临床医生和研究人员同步研究大量基因组数据,并有可能成倍地加速正在进行的关键工作,以更好地为患者提供服务。"
根据美国国家卫生研究院发布的数据,每年生成的基因组数据量接近400亿GB。若想解锁更多发现来促进人类健康并改善精准医疗水平,共享、分析和解读基因组数据的能力尤为重要。
经过自然选择训练的AI算法
每个人都携带着数百万种基因变异,正是这些变异导致了健康和疾病风险的个体差异,但目前大多数变异的作用方式尚不明确。PrimateAI-3D可高度准确地发现致病变异,解决疾病面临的关键挑战,从而成功实现个体化基因组精准医学。
为了获得先进的性能,PrimateAI-3D采用了与ChatGPT和AlphaFold类似的深度神经网络架构,不同之处在于PrimateAI-3D是根据基因组序列而不是人类语言来进行训练。另外,在ChatGPT等生成性语言模型中,现有的文本就可以为训练提供信息,而人类基因组中导致疾病的基因变异在很大程度上却是未知的。
为解决这个问题,PrimateAI-3D有效地利用自然选择来训练深度神经网络的参数。这种训练基于此前对233种不同灵长类动物进行测序时发现的数百万种良性基因变异来开展,这也是迄今为止开展的最大规模的非人类灵长类物种测序工作。对非人类灵长类动物开展测序可以帮助科学家推断人类遗传变异的致病性,从而更好地解读全基因组范围内的临床变异。
结果发现深度神经网络不仅能在所有接受测试的六组临床队列中高度准确地识别致病变异,还能提供个性化的遗传病风险预测,这些预测已在近50万人的队列中得到验证。
因美纳人工智能副总裁、上述出版物的通讯作者Kyle Farh表示:"由于非人类灵长类物种的基因组与人类基因组相近,它们具有独一无二的优势,既可以帮助我们了解人类疾病的遗传基础,也可以让我们了解它们自身的真实情况。"
解码精准医疗和基于基因的药物靶点发现
正如《科学》(Science)期刊上发表的相关论文所述,因美纳的科学家与学术界的合作者一起将PrimateAI-3D算法应用到了英国生物样本库的近50万个个体中,用于识别罕见的致病突变。他们发现,在调查的90种不同临床病症中,普通人群里97%的健康成员的基因组中至少潜伏着一种高度可干预变异。PrimateAI-3D还大幅提高了遗传风险预测的准确性,首次证明了多基因风险评分在很大程度上不受祖先偏差影响,为公平地实施基于基因的精准医疗迈出关键一步,适用于更多元化的人群。
因美纳首席技术官Alex Aravanis表示:"将最新的人工智能技术应用于基因组学,以揭示糖尿病、心脏病和自身免疫性疾病等复杂遗传疾病的关键底层信息,这一技术的推出为因美纳在遗传风险预测和药物靶点发现方面给来巨大机遇。"
PrimateAI-3D将集成在因美纳的互联软件中,供基因组学界广泛使用。