机器学习模型加快对脱碳技术的催化剂评估,从几个月到毫秒 - IT思维
公众号/ ScienceAI(ID:Philosophyai)
编辑 | 绿萝
当你开车在路上经过乡村的农场或草原和池塘时,环顾四周。可以看到玉米、大豆、甘蔗、柳树、藻类和其他等植物。它们是生物质的丰富来源。这些富含碳的材料可以转化为液体燃料和化学品,具有许多可能的应用。
目前的一个主要障碍是缺乏将生物质转化为生物燃料或其他有用产品所需的有效、低成本的催化剂。
通过脱氧反应将生物质转化为高附加值化学品,碳化钼 (Mo2C) 被认为是最活跃和经济上可行的催化剂之一。不幸的是,MO2C 催化剂存在的一个关键挑战是表面氧化的敏感性,这需要过量的氢才能再生催化剂。
近日,来自美国能源部 (DOE) 阿贡国家实验室的研究人员开发了一个消息传递神经网络 (MPNN) 机器学习模型,以加快设计基于 Mo2C 的低成本催化剂的过程。研究结果强调了 MPNN 作为一种准确且广泛适用的机器学习方法,来加速基于描述符的催化剂发现。
该研究以「Accelerating the evaluation of crucial descriptors for catalyst screening via message passing neural network」为题,发布在《Digital Discovery》上。
「生物质是一种有机材料,这意味着它充满了碳,」阿贡材料科学部 (MSD) 的组长 Rajeev Assary 说。「最终目标是廉价地将碳转化为对社会有用的产品,避免了对化石燃料的需求。」
目前,科学家们可以通过高温处理生物质来生产一种叫做热解油的类石油产品。但所得产品的含氧量非常高。这种氧是不需要的,因此通过使用碳化钼催化剂进行的反应将其除去。但一个主要问题是这种催化剂的表面吸收了氧原子,这些氧原子积聚在表面,降低了催化剂的性能。
一种建议的解决方案是向碳化钼中添加少量新元素,例如镍或锌。这种掺杂元素削弱了催化剂表面氧原子的键合,防止催化剂中毒。
「问题在于找到掺杂剂和表面结构的正确组合,」MSD 的助理科学家 Hieu Doan 说。「碳化钼具有非常复杂的结构。因此,我们呼吁超级计算与理论计算相结合,不仅可以模拟表面原子与氧结合的行为,还可以模拟附近原子的行为。」
通过在阿贡的 Theta 超级计算机上进行的模拟,该团队创建了一个包含 20,000 个结构的数据库,用于氧与掺杂碳化钼的结合能。他们的模拟考虑了几十种掺杂元素和催化剂表面每种掺杂元素的一百多个可能位置。Theta 是阿贡领导计算设施、美国能源部科学用户设施办公室的一部分。
然后,他们使用这个数据库来训练深度学习模型。深度学习是机器学习的一种形式,计算机通过首先分析大量样本数据来学习解决问题。「不再局限于使用传统计算方法在数月内评估几千个催化剂结构,通过我们的深度学习模型,我们现在可以在几毫秒内对数万个结构进行准确且廉价的计算,」Doan 说。「这是对类固醇的材料筛选。」
图 1:原始和掺杂的 Mo2C 催化剂表面氧吸附的高通量结构枚举和数据生成。在这些结构中,O、C、Mo 和掺杂原子分别显示为红色、灰色、绿色和紫色/黄色球体。(来源:论文)
具体而言,研究人员首先使用周期密度泛函理论在各种原始和掺杂的 Mo2C 表面上进行 20 000 次氧结合能 (BEO) 的高通量 VASP 模拟。计算并开发了一个包含 20 000 个氧吸附结构的结合能数据库,利用这个数据集,开发了一个消息传递神经网络 (MPNN) 机器学习模型,用于仅使用未优化的局部吸附几何形状作为输入进行极快的 BEO 预测。最佳模型产生的 BEO 相对于 DFT 计算值的平均绝对误差为 0.176 eV。
图示:LCG-MPNN 预测的氧结合能的奇偶校验图。(来源:论文)
该团队将他们的原子级模拟和 深度学习 模型的结果发送给了生物能源化学催化联盟(Chemical Catalysis for Bioenergy Consortium)。他们将进行实验以评估一小组候选催化剂。
「在不久的将来,我们希望能够处理超过一百万种结构和不同的结合原子,例如氢,」Assary 指出。「我们还希望将同样的计算方法应用于其他脱碳技术的催化剂,例如将水转化为清洁的氢燃料。」
论文链接:https://pubs.rsc.org/en/content/articlelanding/2023/DD/D2DD00088A
参考内容:https://phys.org/news/2023-02-machine-catalysts-decarbonization-technology-months.html