“机器化学家”带来科研新范式

作为人工智能发展的一大趋势,国际学术界已对“人工智能驱动的科学研究”形成共识:人工智能将带来科研范式的变革和新的产业业态。

在中国科学技术大学校园里,化学与材料科学学院的一群科研人员正积极投身这项实践:深耕精准智能化学领域,推动科研范式变革,并取得了一系列令人瞩目的科研成果。

“机器化学家”展现出智能新范式的巨大优势

如何创制一款芬顿催化剂?在中科大“机器化学家”实验室里,大量瓶瓶罐罐的实验工作被人工智能“取代”,科研人员无需试来试去,整个过程简单而高效。

记者在实验室看到,科研人员在人工智能程序中输入问题:什么类型的非贵金属元素常用于芬顿催化剂?很快,程序就会给出答案。程序提供的答案来自自主研发的文献机器阅读系统,它能迅速读取海量文献,基于统计数据分析,帮助科研人员选择最佳的元素组合。接下来,就可以调出“机器化学家”平台中保存的芬顿催化剂实验模板,根据人工智能推荐的元素组合编辑液体进样站的参数,并让名为“小来”的“机器化学家”平台帮助进行实验验证。这样,“小来”便可以开始它的芬顿催化剂创制之旅。

“实验数据经处理后,输入‘小来’独有的计算大脑中,产生人工智能模型,可以帮助科研人员优化实验方案。”中科大化学与材料科学学院教授江俊告诉记者。

“小来”等人工智能工具和平台,是中科大化学与材料科学学院江俊团队的研发成果。其中,人工智能程序由化学数据驱动,并结合人类化学家的知识进行机器学习训练,能够针对使用者提出的问题给出初步的实验建议。“小来”则是团队自主开发的集阅读文献、自主设计实验、材料开发于一体的“全流程机器化学家”平台,它能够从数以亿计的可能组合中找到最优解,进而加快材料研发。

实验室里,由“小来”驱动的机械手臂伸缩自如,精确抓取配制试剂。

“全流程机器化学家”平台到底有多强大?以潜力巨大的高熵化合物催化剂为例:获得最优配方需要测试极其庞大的化学配比组合,如果依赖传统研究范式,这一过程可能需要1400年,而“机器化学家”发挥数据驱动和智能优化的优势,从55万种可能的金属配比中找出最优的高熵催化剂,仅需要5周时间。

专家认为,这种“机器化学家”的研究工作摆脱了传统研究范式的限制,展现出智能新范式的巨大优势。

利用人工智能将科学知识数字化、代码化

猜测、尝试、纠错,再猜测、再尝试……在过去150多年里,传统的化学研究范式深度依赖“试错法”,其局限性使得物质创制的周期长、成本高,难以实现高效、节能。

此后,由量子力学发展而来的量子化学,成为化学家使用的工具。化学家们可以在计算机上进行模拟实验来验证某个理论,大大提升了效率。然而,化学研究对象日益复杂化、高维化,面对庞大的化学空间,配方和工艺的搜索常常止步于局部最优,无法进行全局探索。

在计算化学领域有过10年研究经历的江俊感慨:“我们的化学体系非常复杂,超算虽然进化很快,但还是无法应对它的复杂度。”

怎么办?必须找到新的方法。

和江俊一样,中科大教授李震宇也一直在关注和思考这个问题。

“精准化是所有化学家的一个梦想。我希望把这个东西放进去,想让它转化成什么就能百分百转化成什么,过程中还不会产生任何另外的东西。”李震宇说,“这就要求整个化学研究能做到精准的设计、表征、制备和调控,要求整个过程是透明可控的,里面的机理也是清楚的。要实现这个目标,整个研究范式必须改变。”

逐渐兴起并快速迭代进化的大数据与人工智能技术,让江俊和李震宇看到了解决这些难题的希望。

江俊认为,大数据与人工智能技术可以把科学知识数字化、代码化,并进行迁移。“也就是说,我们随时调用优秀研究者发明的代码。他们的智慧结晶,只要我用一个‘子函数’就能调用过来。如果只靠人脑来学习、实践和训练的话,整个过程就会很漫长,知识的迁移就会变得低效。”

于是,江俊心中萌生了一个想法:是否可以借助人工智能技术开发一种新工具?在他的构想当中,这个工具能够帮助科学家突破思维局限,利用数据建立有效的复杂模型,从而指导化学实践。

2014年,江俊团队提出“机器化学家”概念并开展相关科研工作。经过8年攻关,团队通过开发和集成移动机器人、化学工作站、智能操作系统、科学数据库等技术,在2022年成功研制出数据智能驱动的“全流程机器化学家”。

“机器化学家”助力催生化学研究新范式

如今,“全流程机器化学家”在科学研究中发挥着积极作用。中科大邹纲团队筛选光学活性薄膜材料时,为找到目标材料,需要混合多种分子来控制薄膜厚度、应力、灰度等工艺条件,其可能性有上百万种。团队努力了10年,终于将不对称因子提高到了1.2,但离理论极限2.0还有非常大的差距。借助“小来”,他们在两个月内找到了不对称因子1.95的工艺条件,高度逼近理论极限。

江俊成功走出了第一步,让化学科学家们深受鼓舞,更加坚定了以人工智能技术推动化学科研范式变革的决心。

今年1月,中国科学院精准智能化学重点实验室正式获批建设,李震宇担任实验室主任。“实验室主要面向世界科技前沿,聚焦如何改变化学研究范式这一关键科学问题,探索建立化学研究的精准化、智能化双驱动模式。”李震宇介绍。

李震宇认为,当前人工智能技术应用于化学研究最大的困难和挑战来自数据。“已有的大量数据来源复杂,质量参差不齐。这些数据混在一起,让人工智能去学习,很可能会学到一些错误的知识。所以,我们希望发展一些新的技术,能够进行一些更高精准度的表征,同时还能够形成一套数据标准,在这个基础上去做数据驱动的智能化学。”

“机器化学家”的出现,让化学家们解放了双手。也有人担心:未来化学家们可能会无事可做。江俊表示不用为此多虑:“一个好的技术工具出来,也会赋予更多的可能性,让科研人员做更多的事情,发现更多的前沿理论。”

“机器化学家”的出现,推动化学研究范式的改变,也对未来的化学发展提出了新的要求。江俊说,比如,在人才培养方面,既需要具备扎实的化学基础,还要有开放的心态,要善于、敢于学习各种新知识。

未来,江俊希望建成一个“机器化学家”大科学装置:在一整栋大楼里,布置上百个机器人、上千个智能化学工作站。基于这样一个大平台,各个课题组的实验数据可以交汇、共享,产生海量数据,自动提炼出数字化的知识图谱和人工智能的模型,进而指导机器人自动优化生产更好、更高效率的化学品或新材料,实现数据智能驱动的化学研究新范式。

对于精准智能化学重点实验室的首个重点应用研究,李震宇和同事们目前有了一个明确的目标:基于精准化、智能化双驱动的化学研究新范式,对现有氮资源转化相关反应进行全面评估,提出绿色低能耗转化新路径,创制新型催化体系,在氮资源综合利用领域实现突破。

李震宇说:“氮资源高效转化是一个极具挑战性的难题,希望新的研究范式能够给我们带来帮助。”