【导语】在合成化学领域,面对无限的分子宇宙和日益严苛的新物质需求,传统的“试错”与手工实验模式已难以满足高效研发的需求。6月29日闭幕的“合成化学研究新范式——机器人融合AI研讨会”汇聚顶尖学者与产业专家,共同探讨如何利用人工智能(AI)和机器人自动化技术为合成化学注入新活力。从自动化实验设备的高效执行,到AI在分子设计与实验预测中的起步应用,合成化学正迈向一个智能模型与自主化实验相结合的未来,旨在加速新物质的发现与应用,重塑人类生活与文明。
·用人工智能(AI)来设计实验甚(shén)至(zhì)在(zài)某(mǒu)些(xiē)场(chǎng)合(hé)取(qǔ)代(dài)化(huà)学(xué)家(jiā)的(de)“直(zhí)觉(jué)”,用(yòng)机(jī)器(qì)人(rén)等(děng)自(zì)动化技术来高效做实验,部分解放化学家的双手,已经成为很多人眼中合成化学的未来愿景。
合成化学就是一门以原子和分子为“砖瓦”,在现实世界中创造新物质的基石学科。从化肥的基石合成氨,到开启材料革命的尼龙,再到拯救无数生命的青霉素,合成化学的每一次突破都在重塑我们的衣食住行和人类文明。然而,当今社会对新物质、新材料性能的要求日益严苛,传统的依赖化学家经验不断“试错”和手工“摇瓶子”的研发(fā)模(mó)式(shì)需(xū)要(yào)提(tí)升(shēng)效(xiào)率(lǜ)。
在(zài)6月(yuè)29日(rì)闭幕的“合成化学研究新范式——机器人融合AI研讨会”上,中国科学院院士麻生明、中国工程院院士杨为民等顶尖学者与产业专家共同探讨了如何利用人工智能(AI)和机器人自动化这两股强大的技术浪潮,为合成化学学科注入新的活力。
化学家的困境:在无限的分子宇宙中“寻路”
合成化学是创造物质的科学,从化肥、塑料到为人类健康保驾护航的药物,都(dōu)源(yuán)于(yú)化(huà)学(xué)家(jiā)和(hé)药(yào)物(wù)学(xué)家(jiā)等(děng)在(zài)分(fēn)子(zi)层(céng)面(miàn)的(de)精(jīng)妙(miào)设(shè)计(jì)。中(zhōng)国(guó)科(kē)学(xué)院(yuàn)院(yuàn)士(shì)、复(fù)旦(dàn)大(dà)学(xué)化(huà)学(xué)系(xì)教(jiào)授(shòu)麻(má)生(shēng)明(míng)介(jiè)绍(shào)了(le)其(qí)团(tuán)队(duì)对(duì)联(lián)烯(xī)(allenes)的(de)合(hé)成(chéng)、反(fǎn)应(yīng)、性(xìng)质(zhì)等(děng)方(fāng)面(miàn)近(jìn)30年(nián)的(de)研(yán)究(jiū),展(zhǎn)现(xiàn)了(le)化(huà)学(xué)家(jiā)在(zài)寻(xún)找(zhǎo)与(yǔ)构(gòu)造(zào)分(fēn)子(zi)、探(tàn)究(jiū)和(hé)优(yōu)化(huà)反(fǎn)应(yīng)路径上(shàng)的(de)求(qiú)索(suǒ)。
这(zhè)些(xiē)工(gōng)作(zuò)的(de)核心挑(tiāo)战(zhàn)在(zài)于(yú)化(huà)学(xué)空(kōng)间(jiān)的(de)广(guǎng)袤(mào)无(wú)垠(yín)。浙(zhè)江(jiāng)大(dà)学(xué)化(huà)学(xué)系(xì)研(yán)究(jiū)员(yuán)、博(bó)士(shì)生(shēng)导(dǎo)师(shī)洪(hóng)鑫(xīn)在(zài)会(huì)上(shàng)介(jiè)绍(shào)道(dào),理(lǐ)论(lùn)上(shàng)可(kě)合(hé)成(chéng)的(de)中(zhōng)小(xiǎo)分(fēn)子(zi)的(de)数(shù)量(liàng)高(gāo)达(dá)10的(de)60次(cì)方(fāng),这(zhè)是(shì)一(yī)个(gè)远(yuǎn)超(chāo)宇(yǔ)宙(zhòu)中(zhōng)恒(héng)星(xīng)数(shù)量(liàng)的(de)天(tiān)文数(shù)字(zì)。在(zài)这(zhè)片(piàn)无(wú)限(xiàn)的(de)“分(fēn)子(zi)宇(yǔ)宙(zhòu)”中(zhōng)寻(xún)找(zhǎo)具(jù)备(bèi)特(tè)定(dìng)功(gōng)能(néng)的(de)“新(xīn)星(xīng)”以(yǐ)及(jí)它(tā)们(men)之(zhī)间(jiān)的(de)关系(xì),传(chuán)统(tǒng)上(shàng)依(yī)赖(lài)实(shí)验(yàn)与(yǔ)理(lǐ)论(lùn)两(liǎng)种(zhǒng)路径。
第(dì)一(yī)种(zhǒng)是(shì)“自(zì)上(shàng)而(ér)下(xià)”(Top-down)的(de)实(shí)验(yàn)驱(qū)动(dòng)模(mó)式(shì)。如(rú)同(tóng)经(jīng)验(yàn)丰(fēng)富(fù)的(de)探(tàn)险(xiǎn)家(jiā),化(huà)学(xué)家(jiā)依(yī)赖(lài)已(yǐ)有(yǒu)的(de)知(zhī)识(shi)地(de)图(tú)和(hé)敏(mǐn)锐(ruì)的(de)直(zhí)觉(jué),在(zài)实(shí)践(jiàn)中(zhōng)不(bù)断(duàn)调(diào)整(zhěng)路线(xiàn)。优(yōu)秀(xiù)的(de)化(huà)学(xué)家(jiā)可(kě)以(yǐ)基(jī)于(yú)有(yǒu)限(xiàn)的(de)实(shí)验(yàn)数(shù)据(jù),通(tōng)过(guò)调(diào)整(zhěng)催(cuī)化(huà)剂(jì)或(huò)反(fǎn)应(yīng)物(wù)的(de)细(xì)微(wēi)结(jié)构(gòu),“迭(dié)代(dài)”出(chū)性(xìng)能(néng)优(yōu)异(yì)的(de)新(xīn)反(fǎn)应(yīng)。这(zhè)种(zhǒng)方(fāng)式(shì)不(bù)仅(jǐn)依(yī)赖(lài)大(dà)量(liàng)的(de)实(shí)验(yàn)与(yǔ)试(shì)错(cuò),有(yǒu)时(shí)候(hou)还(hái)依(yī)赖(lài)于(yú)科(kē)学(xué)家(jiā)对(duì)实(shí)验(yàn)结(jié)果(guǒ)的(de)敏(mǐn)锐(ruì)捕(bǔ)捉(zhuō)。
第(dì)二(èr)种(zhǒng)“自(zì)下(xià)而(ér)上(shàng)”(Bottom-up)的(de)理(lǐ)论(lùn)驱(qū)动(dòng)模(mó)式(shì)是(shì)理(lǐ)论(lùn)与(yǔ)计(jì)算(suàn)化(huà)学(xué)家(jiā)的(de)路径。他(tā)们(men)从(cóng)量(liàng)子(zi)力(lì)学(xué)的(de)第(dì)一(yī)性(xìng)原(yuán)理(lǐ)出(chū)发(fā),通(tōng)过(guò)超(chāo)级(jí)计(jì)算(suàn)机(jī)模拟分子的相互作用,精算出反应的每一步能量变化,从而在原子层面揭示反应为何发生、选择性从何而来。
此法极为精准,但代价是极其高昂的计算成本和时间。洪鑫提到,如果要精确理解一个催化剂的作用机制和构效关系,背后可能需要成千上万的过渡态计算。这使得它难以及时指导实际场景的合成决策。
在浩瀚的分子空间面前,这两种路径一个依赖经验与直觉,一个依赖算力与理论,两者都面临着效率和普适性的巨大挑战,这为新工具的出现创造了迫切的需求。其中,用人工智能(AI)来设计实验甚至在某些场合取代化学家的“直觉”,用机器人等自动化技术来高效(xiào)做(zuò)实(shí)验(yàn),部(bù)分(fēn)解(jiě)放(fàng)化(huà)学(xué)家(jiā)的(de)双(shuāng)手(shǒu),已(yǐ)经(jīng)成(chéng)为(wèi)很(hěn)多(duō)人(rén)眼(yǎn)中(zhōng)合(hé)成(chéng)化(huà)学(xué)的(de)未(wèi)来(lái)愿(yuàn)景(jǐng)。
新(xīn)工(gōng)具(jù)的(de)实(shí)践(jiàn):自(zì)动(dòng)化(huà)的(de)现(xiàn)实(shí)与(yǔ)AI的(de)起(qǐ)步(bù)
让(ràng)“不(bù)知(zhī)疲(pí)倦(juàn)”的(de)机(jī)器(qì)人(rén)等(děng)自(zì)动(dòng)化(huà)设(shè)备(bèi)根(gēn)据(jù)设定好的程序代替人去做实验,可以大大提升实验驱动的合成化学研究的效率。在产业界,对效率的追求早已将自动化推向了研发一线,远早于近年来生成式AI的突破。
中国工程院院士、中国石化上海石油化工研究院院长杨为民在演讲中提到,在石油化工领域,一个新催化剂的开发过去遵循着“十年磨一剑”的漫长周期。早在2010年左右,杨为民所在的中石化上海院便与美国公司合作,引入了高通量(High-throughput)技术平台,用机器人手臂和精密的流体控制系统,代替人工去执行海量的、并行的实验。
研究人员可以首先通过高通量计算系统性地设计上千种不同的催化剂配方,再让自动化平台快速筛选,从而发现传统“试错法”需要花费大量人力才能得到的规律和性能更优的材料。通过这样的工作模式,他们成功开发出一种纳米片状分子筛,解决了利用炼厂废气生产高价值化学品的难题,并已在全国多套工业装置上成功应用 。
在产业科研中,科研人员已经对目标反应规律和物质属性有大量的数据和明确的优化要求,这些成为自动化和高通量计算的基础。而对于前沿学术科研来说,相关数据非常缺乏,实验方向有待探索。在这些“无人区”中,新工具的使用似乎呈现另外一幅景象。
去年,在麻生明团队的指导下,晶泰科技为其实验室定制开发了能进行ATA反应研究的智能合成工作站。这个工作站能够同时做48个实验,大大提升了实验试错速度,加速催化剂的合成筛选研究,也高效提供标准化数据,是晶泰科技自主研发的智能自主实验平台在科研具体场景的应用。
晶泰科技的智能合成工作站。图片由主办方提供
他表示,用智能合成工作站这一自动化平台做实验的效率确实远远高于原来的研究模式,但这些实验结果的解读还无法依赖机器。“通过自动化,我们观察到了一些有意思的结果。但AI扮演的角色还很有限,有极大的发展空间。”
他强调,AI在化学领域的价值,目前更多是成为化学家高效的“帮手”,而非替代者。“很多人觉得AI会替代人脑,我个人感觉这是不可能的,”麻生明告诉科技,“化学发现很多时候是基于一些偶然性的发现”,而通过已有知识训练出来的机器的解读常常泯灭这种偶然性的(de)发(fā)现(xiàn)。因(yīn)此(cǐ),最(zuì)终(zhōng)的(de)科(kē)学(xué)洞(dòng)察(chá)仍(réng)需(xū)人(rén)脑(nǎo)来(lái)完(wán)成(chéng)。
未(wèi)来(lái)的(de)化(huà)学(xué):智(zhì)能(néng)模(mó)型(xíng)与(yǔ)自(zì)主化(huà)
谷(gǔ)歌(gē)公(gōng)司(sī)开(kāi)发(fā)的(de)AI“AlphaFold”以(yǐ)超(chāo)高(gāo)的(de)预(yù)测(cè)准(zhǔn)确(què)率(lǜ)解(jiě)决(jué)了(le)蛋(dàn)白(bái)质(zhì)结(jié)构(gòu)预(yù)测(cè)问(wèn)题(tí),获(huò)得(de)了(le)2024年(nián)的(de)诺(nuò)贝(bèi)尔(ěr)化(huà)学(xué)奖(jiǎng)。麻(má)生(shēng)明(míng)认(rèn)为(wèi),在(zài)蛋(dàn)白(bái)质(zhì)结(jié)构(gòu)领(lǐng)域,科(kē)学(xué)家(jiā)多(duō)年(nián)来(lái)的(de)探(tàn)索(suǒ)已(yǐ)经(jīng)积(jī)累(lèi)了(le)大(dà)量(liàng)数(shù)据(jù),如(rú)已(yǐ)知(zhī)蛋(dàn)白(bái)质(zhì)的(de)晶(jīng)体(tǐ)结(jié)构(gòu)和(hé)功(gōng)能(néng)等(děng),为(wèi)训(xun)练AI创造了很好的条件。而(ér)在(zài)很(hěn)多(duō)其(qí)它(tā)前(qián)沿(yán)领(lǐng)域,AI依(yī)然(rán)面(miàn)临(lín)数(shù)据(jù)稀(xī)缺(quē)的(de)问(wèn)题(tí)。
洪(hóng)鑫(xīn)的(de)探(tàn)索(suǒ)为(wèi)此(cǐ)提(tí)供(gōng)了(le)一(yī)条(tiáo)可(kě)能(néng)的(de)路径。他指出,当探索一个全新的化学物质构效关系(分子结构与活性之间的关系)时,往往可能只有非常有限的实验数据,直接用这些“小样本”数据训练AI模型,模型难以泛化,无法获得具有化学意义的预测设计。
为此,他们设计了一种“层级学习”框架,让AI能够逐步逼近目标的构效空间,从而更好地进行建模预测。在开发一种新型的镍催化剂时,他们首先利用了大量机制上相关的钯催化剂文献数据,训练出“基础模型”,让AI学习到关于这类反应的整体选择性规律。然后,再用少量、珍贵的镍催化剂数据对这个模型进行“微调”和“校正”,使其适应新的目标体系。通过这种方式,他们成功地预测并合成出一种全新高效、高选择性的催化剂配体,展示了AI在“小数据”场景下实现创新发现的潜力。
除了使用“知识迁移”的方式训练更准确的AI知识模型,使用AI让自动化变得更加“聪明”也是未来提升合成化学效率的一条路径。晶泰科技联合创始人、首席执行官马健将其描述为自动化(automation)与自主化(self driving)之间的区别。
“自动化就好比大家出行的时候坐地铁、坐火车,”他解释说,“两点之间的路径非常的明确……大家一起上车,然后直接到目的地。”在化学领域,自动化平台擅长执行大规模、重复性的标准化流程,例如高通量的筛选,一次性测试上百种预设好的配方。这种模式效率极高,但缺乏灵活性。
而自主化,则更像是“自动驾驶汽车”。它不仅能执行任务,还能在过程中感知环境、分析数据、并作出下一步决策。马健将其称为“自动驾驶实验室”(Lab Auto-Driving)。这样的实验室在完成一次实验后,能立即分析结果,并自主设计和启动下一次、更优化的实验,形成一个快速迭代的“设计-执行-学习”闭环。
构建这样的“AI+机器人”自主实验室是包括晶泰科技在内的很多公司和科研机构的共同愿景。晶泰科技智能自主实验平台正在与科学家、产业从业者们深度合作,整合自动化实验执行和AI实验预测与设计,实现了高效的“干湿实验”(计算模拟与真实实验(yàn))迭(dié)代(dài),已(yǐ)成(chéng)功(gōng)应(yīng)用(yòng)于(yú)生(shēng)物(wù)医(yī)药(yào)、新(xīn)材(cái)料(liào)、新(xīn)能(néng)源(yuán)等(děng)多(duō)个(gè)领(lǐng)域。