【导读】2025年11月17日发表于《美国科学院院刊》的一项研究,利用裂解气相色谱-质谱联用技术结合监督式机器学习,分析了406份涵盖陨石、现代生物及太古宙岩石的多样化样本,发现该方法能有效区分高度降解的生物与非生物有机质,在33.3亿年前的岩石中识别出生物成因特征,并在25.2亿年前的样本中确认了光合作用信号。该成果将保留生物演化信息的有机质记录时间跨度延长了近一倍,为揭示地球早期生命演化提供了新途径。在探索地球生命起源的征途中,科学家长期依赖岩石中的化石形态或碳同位素记录来推断早期生命的存在。然而,这些古老的岩石往往经历了数十亿年的地质变迁,高温高压使得原本复杂的生物大分子严重降解。长期以来,学术界普遍认为,能够明确指示生物分类和代谢特征的完整“分子化石”(如脂类或卟啉)只能追溯到约16亿年前。这一时间限制使得我们对更古老时期的生命演化细节知之甚少。近期,一项结合了有机地球化学与机器学习技术的突破性研究,成功将这一记录向前推进了近一倍的时间,在超过30亿年的古老岩石中提取出了关键的生物学信息。这项研究并未试图寻找完整的分子,而是关注有机物质降解后的碎片模式。研究团队收集了406份来源多样的样本,包括现代生物组织、石油、煤炭、含有古老有机质的沉积岩,以及富含非生物有机质的碳质陨石和实验室合成混合物。通过使用裂解气相色谱-质谱联用技术,研究人员将这些样本加热至高温,使其分解为数以万计的微小分子片段,从而获得复杂的化学指纹图谱。面对如此庞大且复杂的数据集,传统的分析方法往往束手无策。研究人员引入了监督式机器学习算法,训练计算机识别不同类别样本之间细微的化学成分差异。经过训练的人工智能模型表现出了极高的准确率,不仅能以超过90%的精度区分生物成因与非生物成因的有机质,还能准确辨别样本是否源自光合作用生物。这种方法证明,即便经过了数十亿年的地质降解,生物有机质中仍然保留着区别于非生物过程的特征性信息。利用这一新方法,研究团队对一系列地质年代久远的岩石样本进行了重新评估。模型在约35.1亿年前的辛格布拉姆克拉通(Singhbhum Craton,位于印度)和33.3亿年前的约瑟夫斯达尔燧石层(Josefsdal Chert,位于南非巴伯顿绿岩带 Barberton Greenstone Belt)的样本中,识别出了明确的生物成因信号。这一发现有力地支持了在古太古代时期地球上就已经存在繁盛的微生物生态系统,且这些有机物质并非来自外太空的陨石撞击。更进一步,该研究在代谢方式的演化探索上也取得了重要进展。光合作用是地球生命史上最重要的代谢创新之一,它导致了地球大气的氧化。机器学习模型在25.2亿年前的加莫汉组(Gamohaan Formation,位于南非)和23亿年前的葛瓦干达组(Gowganda Formation,位于加拿大)的样本中,检测到了属于光合作用生物的化学信号。这些数据与地质记录中关于微化石形态和地球大气氧化的时间节点相吻合,为新太古代晚期至古元古代早期光合自养生物的活跃提供了独立的地球化学证据。这项研究不仅将保留生物演化信息的有机质记录的时间跨度大幅延长,更展示了数据驱动的分析方法在古生物学领域的巨大潜力。通过解码那些高度降解、肉眼无法分辨的分子碎片,科学家们不仅能够重建地球早期生命的演化历史,还为未来分析火星等其他星球上可能存在的古老生命痕迹提供了强有力的技术手段。M.L. Wong, Organic geochemical evidence for life in Archean rocks identified by pyrolysis–GC–MS and supervised machine learning, Proc. Natl. Acad. Sci. U.S.A. 122 (47) e2514534122, https://doi.org/10.1073/pnas.2514534122 (2025).
本文由"地刊速览"写作,转载请在文章开头醒目位置标注"本文来源:地刊速览"。