新计算化学技术加速分子和材料预测
摘要
MIT研究团队开发了一种名为MEHnet的神经网络方法,基于量子化学"黄金标准"耦合簇理论CCSD(T)训练,能够以高于密度泛函理论DFT的精度预测分子和材料的多种电子属性。该技术采用E(3)等变图神经网络架构,可同时评估偶极矩、四极矩、电子极化率和光学激发带隙等多种属性,适用于基态和激发态分析,有望实现高通量分子筛选并推动新型聚合物、半导体及电池材料的开发。
内容框架与概述
本文从材料科学的历史演变切入,回顾了从古代炼金术到19世纪元素周期表的出现,再到过去十年机器学习在材料科学领域的应用历程。尽管这些进步极大地推动了材料设计发展,但现有基于密度泛函理论DFT的机器学习模型仍存在精度不均匀和只能提供最低总能量等局限性。
为解决这些问题,MIT核科学与工程系Ju Li教授领导的团队转向耦合簇理论CCSD(T),这种被公认为量子化学"黄金标准"的方法虽然计算精度可与实验媲美,但计算成本极高。研究团队开发的MEHnet神经网络通过定制算法,能够直接从量子力学原理中提取分子属性,在保持CCSD(T)级别精度的同时大幅降低计算成本。
该技术的核心创新在于采用E(3)等变图神经网络架构,其中节点代表原子,边代表原子间的化学键。更关键的是,MEHnet采用多任务学习方法,能够同时评估分子的多种电子属性,不仅适用于基态分析,还适用于激发态研究,甚至可以预测分子的红外吸收光谱。在对已知烃类分子的测试中,MEHnet的表现优于DFT方法,并与文献中的实验结果高度一致。
这项技术的应用前景广阔,有望实现高通量分子筛选,这对识别具有特定属性的新分子和材料至关重要。研究团队表示,该技术可用于设计新型聚合物或半导体材料,甚至可能推动电池材料的开发。目前模型能够处理多达数千个原子的分子,未来有望扩展到数万个原子的分子系统。团队的长期目标是覆盖整个元素周期表,并以低于DFT的计算成本实现CCSD(T)级别的精度。
核心概念及解读
耦合簇理论CCSD(T):量子化学领域的"黄金标准"方法,其计算结果的准确性可与实验结果媲美。传统CCSD(T)方法的计算成本极高,限制了其应用范围。MIT团队通过神经网络技术,使这一高精度方法得以在更大规模分子系统中应用。
E(3)等变图神经网络:一种专门处理三维空间数据的神经网络架构。在MEHnet中,图神经网络的节点代表分子中的原子,边代表原子之间的化学键。这种架构能够保持三维空间中的旋转和平移不变性,非常适合处理分子结构数据。
多任务学习:MEHnet能够同时学习分子的多种电子属性,包括偶极矩、四极矩、电子极化率和光学激发带隙等。与单一任务学习相比,多任务学习能够利用不同属性之间的相关性,提高模型的泛化能力和预测精度,同时也使得模型适用于基态和激发态分析。
高通量分子筛选:指在短时间内对大量分子候选进行计算评估,从中筛选出具有目标特性的分子。传统高精度量子化学方法计算成本过高,无法实现高通量筛选。MEHnet在保持CCSD(T)级别精度的同时大幅降低计算成本,使得高通量分子筛选成为可能。
激发态与红外光谱预测:与大多数只能处理基态的量子化学方法不同,MEHnet能够处理分子的激发态,这使其能够预测分子的光学吸收性质。此外,模型还可以预测分子的红外吸收光谱,这对于实验化学家进行分子结构确认和性质研究具有重要意义。
原文信息
| 字段 | 内容 |
|---|---|
| 原文 | New computational chemistry techniques accelerate the prediction of molecules and materials |
| 作者 | MIT News |
| 发表日期 | 2025-01-14 |
此文档由 AI 自动整理