诺贝尔奖团队突破基因组研究瓶颈 非编码区功能解析获重大进展

人类基因组这部由30亿个遗传字母组成的"天书"长期困扰着科学家;其中仅占2%的编码区能够指导细胞制造蛋白质,这部分已被基本破译。而占据98%的非编码区虽然不直接合成蛋白质,却掌控着基因的开启、剪接与表达,其变异更是诸多疾病的根本诱因。此广阔的未知领域成为生命科学研究的重大瓶颈。 传统计算方法在破译非编码区时面临多重困难。一类模型只能读取短段DNA序列,容易遗漏远处的关键信息;另一类模型虽能处理长段序列但无法精确到细节。此外,现有模型各自只能解读特定功能,需要多个模型协同工作,效率低下。这些局限性严重制约了对基因调控机制的深入理解。 由2024年诺贝尔化学奖得主戴米斯·哈萨比斯领导的研究团队推出的AlphaGenome模型彻底改变了这一局面。该模型能够输入百万碱基长度的DNA序列,并以单碱基分辨率预测RNA表达量、剪接结构、染色质可及性、转录因子结合位点及三维结构等近6000项调控特征。这意味着它既能读透百万量级的长段DNA,又能看清单个碱基的细微变化,同时揭示这段DNA在细胞中的具体功能。 AlphaGenome的突破建立在哈萨比斯团队既往成就的基础之上。2016年问世的AlphaGo在围棋领域击败世界冠军,2020年推出的AlphaFold破解了蛋白质折叠难题,这些创新为当前研究奠定了基础。项目团队专家程俊表示,自博士阶段起就致力于遗传突变预测研究,曾主导AlphaMissense项目解读基因组2%的编码区,"剩下的98%一直是我们想要照亮的未知领域,这正是AlphaGenome诞生的初衷"。 这一突破在医学应用中已显示出显著潜力。在癌症研究领域,AlphaGenome已成功破解T细胞急性淋巴细胞白血病的致病机制,能够精准定位导致癌基因异常激活的非编码突变,并阐明这些突变如何通过改变基因调控引发癌症。这使科学家能够更快速地锁定癌症驱动突变,发现新的治疗靶点。 非编码区密码的破译将为医学诊断和治疗带来深远影响。对于长期查不出病因的疾病,其根源可能正是DNA非编码区的基因突变。AlphaGenome能够精准识别这些"元凶",特别是在罕见病和遗传病诊断中具有重大意义。通过阐明发病的基因机制,科学家可以开发更有效的药物,甚至为患者设计个性化治疗方案。从更深层次看,这一突破将加深人类对生命本质的理解,为后续更多生物医学创新奠定基础。

基因组的价值不只在于"写了什么",更在于"如何被读取与执行"。若能在开放数据、严谨验证与规范应用中持续迭代,非编码区的功能预测工具将推动基础研究与临床实践之间的壁垒更降低,为罕见病确诊、肿瘤靶向治疗及药物研发提供更坚实的科学支撑,也为人类理解生命运行的底层逻辑打开新的窗口。