华大基因大语言模型驱动的新方法,助力提升遗传病分析解读水平

人工智能(AI)技术随着科技的飞速发展已广泛渗透至多个领域。在生命健康层面,AI凭借其独特优势在推动基因组医学的创新发展中扮演着重要角色,尤其是在罕见遗传疾病诊断中展现出了巨大的潜力。然而,利用基因测序技术对海量的基因组变异进行大规模、高效精准的致病因素识别,仍然是一个挑战。因此,基于基因检测大数据,并以AI算法作驱动的智能化筛选工具的研发,将进一步推进罕见病的诊断进程。作为中国基因科技领域的的先行者,华大基因长期致力于多组学大数据技术的创新,其研发出的大语言模型驱动的新方法Genetic Transformer(GeneT),对助力科研与临床应用转化、加速生命科学研究步伐以及深化生命大数据应用具有重要意义。

近十年来,人工智能(AI)在罕见遗传病致病基因和变异筛选领域取得巨大进步。这些方法通过语义的相似性将患者表型与已知致病基因相关联,并结合变异位点注释信息构建评分或预测模型,以此过滤与排序候选变异,其代表性工具包括Exomiser, VAAST, Xrare, AMELIE, GEM, Emedgene, and AI-MARRVEL等。尽管这些工具在临床诊断中展现出重要价值,但其多数是基于表型语义相似性度量,需将患者临床表型信息转化为标准化表型词条,并通过遗传分析专家进行校准。这一过程不仅耗时耗力,还对基因型与表型关联数据库的全面性以及患者临床表型描述的精准度存在高度依赖,大大加深了筛选罕见遗传病致病基因和变异的难度。而大型语言模型(LLM)的最新发展,为罕见病的分析解读提供了新的视角与策略。其在处理大规模文本数据及复杂问题上的能力,可更为高效地助力临床医师与科研人员识别疾病相关基因与变异,以此推进个性化精准医疗进程。

作为全球精准医学与公共卫生领域的先行者,华大基因AI团队在近期研究工作中开创性地应用了微调大语言模型对罕见遗传病致病变异进行有效识别,研发出了大语言模型驱动的新方法Genetic Transformer(GeneT),以助力提升遗传病分析解读能力。该方法基于公开数据构建的数万例阴阳性病例训练数据集,将资深遗传病分析专家解读思维链构建的提示词作为模型微调的逻辑基础,指引基础大语言模型学筛选罕见遗传病致病变异的能力。GeneT在模拟样本及真实临床样本中致病变异召回率分别高达99%和98%,分析效率提升了20倍。华大基因的这一成果有望取代传统表型驱动筛选方法,推动罕见遗传病的研究与临床应用,助力患者群体获得精准诊疗。

华大基因的AI科研团队创新性地引入大语言模型,以识别罕见遗传病的致病变异。该模型相较于传统工具及遗传病人工筛选在真实临床场景验证展现出显著优势,能灵活应对多样化的临床表型信息,实现变异筛选与排序的高效精准,并结合RAG技术,提供更新且更及时的数据库检索服务,有望解决当前遗传病分析解读中的痛点与难点。未来,华大基因将持续深耕基因科技领域,通过不断创新推动精准医疗发展,帮助罕见遗传病患者获得更为高效的精准诊疗,为增加人类健康福祉贡献力量。

作者: admin2

为您推荐

广告位

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

联系我们

15205378440

在线咨询: QQ交谈

邮箱: 1719530292@qq.com

本站所有文字、图片、视频、音频等资料均来自互联网,不代表本站赞同其观点,本站亦不为其版权负责。相关作品的原创性、稳重陈述文字无法一一核实,如果您发现本网站上有侵犯您的合法权益的内容,请联系我们,本站将立即予以删除
返回顶部