AI预测蛋白质复合物结构的重大进展。科技日报北京3月22日消息,记者张佳欣报道,在人工智能领域,“阿尔法折叠”这个工具这次做了个大升级,给全球科学家们带来了一个重磅消息:他们能在最新的数据集里看到由数百万个AI预测出来的蛋白质复合物结构了。这个升级是欧洲分子生物学实验室、欧洲生物信息学研究所、谷歌旗下的“深度思维”公司、英伟达还有韩国首尔大学合作完成的,给了科学界迄今为止最大规模的蛋白质复合物预测数据集。这个数据集不光是普通蛋白质结构了,还加入了170万个高置信度的同源二聚体结构,它们是由两个一样的蛋白质凑在一起形成的复合物。“阿尔法折叠”数据集自2021年开放以来,已经收录了约2亿个单个蛋白质结构预测结果。不过这次不一样,这次他们给科学家提供了大量像“乐高”积木一样相互拼合形成的复杂蛋白质复合物结构。以前研究单个蛋白质结构很容易,但要预测两个或更多蛋白质凑在一起形成复合物就难多了,而且非常消耗算力。所以研究团队花了不少力气分析了包括人类、小鼠、酵母和结核分枝杆菌在内的20种物种,生成了大约3000万个同源二聚体预测结果,最后筛选出了170万个高质量的数据放进了数据库里。把蛋白质复合物纳入结构数据库就好比是从单个积木块迈向更复杂的搭建网络一样。科学家们发现,有些蛋白质只有在成了复合物的时候才能看到真正的样子。不过用这些AI预测出来的结果还得小心点,毕竟有些和真实的生物状态可能有点不一样,最好还是做实验来验证一下再说。未来“阿尔法折叠”还会继续扩张,打算把不同类型的蛋白质凑成的异源二聚体结构也给加上去。这次升级让科学家们不仅能看清每块“乐高”积木的样子,还能照着说明书快速设计出复杂的蛋白质结构了。这么一来科研效率就大大提高了,解析生命机制和研发新药什么的都变得容易多了。这不仅是给基础科学研究开了条新路,对新药研发也很有帮助。以后随着生物技术越来越发达,AI在生命科学领域的应用肯定会越来越广泛。 这样做不仅能让我们更好地理解生命的本质,还能帮我们探索更多未知的科学奥秘。 毕竟生命本来就是由一个个相互协作的小部件构成的嘛!