来源:秒懂AI
2023-03-01 17:57:20
来自进化生物学研究所 (IBE)、基因组调控中心 (CRG) 的国家基因分析中心 (CNAG-CRG) 和塔尔图大学基因组学研究所的研究表明:人工智能能识别到未知的人类祖先。
他们使用了现代人类和已知人类祖先的基因组数据,以及一些之前未知的基因组数据,其中包括一些来自非洲的古老DNA数据。
(相关资料图)
Nature发文:基于深度学习算法寻找人类古老基因
然后,利用人工智能算法对这些数据进行了分析和比较,以推断这些人类群体之间的关系。
结果显示,这些未知的DNA样本来自一个之前未知的人类群体,该人类群体可能是现代非洲人和尼安德特人之间的一个共同祖先。
DNA序列三维图
在过去的几十年中,人类学家一直在研究人类演化的历史。他们使用骨骼、化石和基因组等数据来了解不同人类群体之间的关系。
但是,由于受限于样本数量和质量等因素,人类学家们并没有完全了解所有已知人类群体的演化历史,更不用说那些未知的人类祖先了。
人类基因组示例
这项研究的意义在于,它展示了人工智能技术在人类学领域的应用潜力。
通过结合基因组数据和人工智能算法,人类学家可以更好地了解人类演化历史,尤其是那些未知的人类祖先。这项技术还可以用于其他领域,如药物研究、基因治疗等,有助于推动科学研究的进步。
依靠人工智能进行基因检测和深度检查(概念图)
生命基本分子,也就是蛋白质的三维结构,如果用传统的实验方法来确定蛋白质的结构通常是耗时且昂贵的,因此需要一种快速、准确、可扩展的方法来预测蛋白质的结构。
该结构在生命过程中发挥了许多关键的作用,如催化反应、传递信号和维护细胞结构。
空间蛋白质结构
AlphaFold基于深度神经网络和深度学习技术,利用已知的蛋白质序列和结构信息来预测未知的蛋白质结构。
它的预测精度已经超过了先前所有竞争性方法,并且在2020年的CASP14比赛中获得了第一名。它可以加速药物发现过程,缩短研发时间,降低研发成本,提高疾病治疗效果。
AlphaFold预测过程
这种方法的成功也展示了深度学习技术在生命科学领域的巨大潜力,为生命科学和人工智能之间的跨学科研究提供了重要的思路和方法。
除了AlphaFold,还有类似的大模型:
RoseTTAFold:由美国华盛顿大学、英国剑桥大学和DeepMind等机构共同开发的蛋白质结构预测模型,基于AlphaFold2,并在其基础上进行改进,最终获得了与AlphaFold2相当的性能表现。ProteinNet:由斯坦福大学开发的一种蛋白质结构预测模型,它使用一个由多个神经网络组成的框架来预测蛋白质结构和相互作用。RGN:由华盛顿大学和谷歌等机构共同开发的一种蛋白质结构预测模型,它使用一种称为Recursive Neural Network(RNN)的深度神经网络结构来建模蛋白质序列和结构之间的关系。EVFold:由欧洲分子生物学实验室(EMBL)开发的一种蛋白质结构预测模型,它利用进化信息来预测蛋白质结构,并且在预测速度和准确度方面表现出色。
人工智能可以在大规模基因测序数据中发现模式和关联,帮助研究人员理解基因组的组成和功能,以及与疾病相关的基因变异。
例如,人工智能可以用于基因序列比对、变异检测和功能注释等任务。
基因组序列比对
还可以利用基因测序数据,为患者提供个性化医疗建议;预测患者的药物反应和风险,并为患者推荐最有效的治疗方案。
帮助预测受孕率和胚胎植入成功率,并为生殖医生提供更准确的诊断和治疗建议;预测患者患有染色体异常的风险,并提供相应的生殖健康咨询。
AI医疗诊断
对于遗传学研究,人工智能可以对大规模基因测序数据进行分析,以发现新的基因突变和表观遗传变化,并帮助研究人员揭示这些变化与疾病之间的联系。
甚至远程机器人辅助治疗研究,也在研究当中。
机器人辅助治疗
AI是手段、工具和技术,人类可以将它应用在基因组学、蛋白质组学、医疗诊断和个性化治疗当中,可以加速科学研究和治疗方法的发展。
我们期待更多的研究发现人类基因更多的秘密。