公众号/
编辑 | 萝卜皮
材料科学的一个基本挑战是阐明化学计量、稳定性、结构和性质之间的关系。最近的进展表明,机器学习可用于学习这种关系,从而可以准确预测材料的稳定性和功能特性。然而,这些方法中的大多数使用原子坐标作为输入,因此在研究以前未识别的材料时会受到晶体结构识别的限制。
剑桥大学的研究人员提出了新方法,通过将原子坐标的无限搜索空间粗化到组合可枚举的搜索空间中来解决这个瓶颈。关键思想是使用 Wyckoff 表示,晶体中对称相关位置的无坐标集,作为机器学习模型的输入。
该模型证明了在寻找未知的理论上稳定的材料方面具有极高的精度,仅从 5675 次从头算计算中识别出位于先前计算材料的已知凸包之下的 1569 种材料。
该研究以「Rapid discovery of stable materials by coordinate-free coarse graining」为题,于 2022 年 7 月 27 日发布在《Science Advances》。
大海捞针通常被用作材料发现的类比。只有一小部分可行的材料组合物[被认为是 O(10^10) 数量级] 将具有热力学稳定的多晶型物,可通过实验获得。应对这一挑战的大多数方法都集中在材料属性的预测模型上,即过滤掉 hay 的隐喻筛子。
在这里,剑桥大学的研究人员寻求另一种方法:能否通过改变表示材料的方式来缩小材料空间的大小——让大部分 hay 消失?
该方法受到科学中普遍存在的概念的推动:粗粒度。以分子化学为例,化学家通常使用分子图来建立关于化学性质的直觉。分子图是分子的粗粒度表示,每个图对应于一个独特的原子坐标系。在分子图的可枚举空间中进行搜索,而不是在可能的原子坐标的无数空间中进行搜索,使得能够开发强大的计算工具和努力穷举枚举化学空间成为可能。
然而,在材料科学中,晶体结构的类似粗粒度表示缺失。研究人员面临着无数的搜索空间问题。基于成分的方法可以在一定程度上克服这一挑战,但这样做的代价是丢弃有关所考虑材料的晶体结构的所有信息。因此,需要广泛的计算晶体结构搜索或基于实验室的实验来验证预测。
应对这一挑战的一个途径是,使用新颖的描述符探索受限类别的结构原型。指定原型避免了晶体结构搜索的需要,随着验证的计算成本大大降低,可以进行更广泛的筛选活动。
图示:使用 Wyckoff 表示的粗粒度材料空间可实现高效的数据驱动材料发现。(来源:论文)
在这里,研究人员介绍了一种通过考虑 Wyckoff 表示、晶体中对称相关位置的无坐标集来概括这些原型限制模型的方法。该框架使研究人员能够为材料发现任务开发准确的机器学习模型,其中松弛的晶体结构是先验未知的。
研究人员测试了模型在各种化学物质中识别以前未识别的稳定材料的能力,表明它的精度比基于元素替代的最先进的无坐标方法的精度高 3 倍。
同时,评估了该模型在识别具有不同结构的相图中的稳定结构方面的性能,结构表明,该模型在相图中找到了低能结构,而计算量降低了约 5 倍。
图示:Wren 可以对以前未知的稳定材料进行自动计算勘探。(来源:论文)
该团队还开发了一个材料探索管道,从已知材料的初始核心开始,筛选附近的材料空间,并允许有效地发现新的稳定材料。他们仅从 5675 次从头算计算中识别出 1569 种迄今未知的材料,它们位于先前计算的材料的已知凸包之下。
这些结果表明,利用 Wren 可以更有效、更广泛地扩展计算材料科学数据库。这些努力对于加快寻找向低碳经济过渡所需的各种工业所需材料至关重要,例如热电、压电、快离子导体、高压多价阴极材料和热材料。
「这种材料结构预测挑战类似于生物学中的蛋白质折叠问题。」领导这项研究的剑桥卡文迪什实验室的 Alpha Lee 博士说,「一种材料可以『折叠』成许多可能的结构。除了材料科学问题可能比生物学更具挑战性,因为它考虑了更广泛的元素。」
「可能的材料数量比我们自古代以来制造的材料总数大四到五个数量级。」同样来自卡文迪什实验室的 Rhys Goodall 博士说,「我们的方法提供了一种有效的计算方法,可以『挖掘』以前从未制造过的新的稳定材料。然后可以对这些假设材料的功能特性进行计算筛选。」
研究人员现在正在使用他们的机器学习平台来寻找新的功能材料,例如介电材料。他们还将实验约束的其他方面整合到他们的材料发现方法中。
论文链接:https://www.science.org/doi/10.1126/sciadv.abn4117
相关报道:https://phys.org/news/2022-07-ai-tackles-materials.html