【
儀表網 研發快訊】近日,南京大學物理學院孫建教授、王慧田教授、邢定鈺院士等人,發布了他們自主開發的機器學習力場:高階張量消息傳遞原子間勢函數(HotPP),這是一種E(n)等變的消息傳遞神經網絡,能夠將節點嵌入和消息中的笛卡爾張量擴展到任意階。對多個數據集的測試顯示,HotPP力場不僅在預測目標性質如能量和力等方面表現優異,精度比肩世界最高水平,還提供了與ASE和Lammps等常用軟件的接口,可以用于計算聲子譜、紅外譜和拉曼譜等,展示了其在未來科學研究中的巨大潛力。
機器學習勢函數(MLP)結合了基于量子力學的第一性原理計算和經驗力場的優點,旨在準確描述凝聚態體系的勢能面。經過合理訓練的機器學習力場不僅能達到接近甚至超越第一性原理計算的精度,還能執行大規模、長時間的分子模擬,在研究復雜動力學問題等方面有重要應用前景。其中,等變的消息傳遞網絡架構由于其極高的精度,是近年來研究的熱點。例如基于高階球諧張量的NequIP、BotNet和MACE等,達到了Sota的精度,但其復雜的耦合操作成為了效率的瓶頸。基于笛卡爾坐標的方法如PaiNN、TensorNet等雖然具有較高的效率,然而它們可使用的階數仍然局限于1或2,任意階笛卡爾張量消息傳遞模型尚未被提出。
由于等變操作的復合仍然是等變的,因此可以通過將一系列基礎的等變操作的耦合,搭建出復雜的神經網絡。注意到張量間的縮并正是一個可以將不同階張量耦合的操作,為此孫建課題組使用節點上的已有的高階張量與邊所對應的原子間相對位移的直積構成的高階張量進行縮并,成功將消息傳遞中允許的張量階數提升到了任意維。
圖1:HotPP的網絡結構示意圖。
他們在一系列數據集中測試了該神經網絡的精度。首先是碳的數據集,該數據集包含了一系列復雜結構的豐富原子環境,包含第一性原理分子動力學模擬中提取的結構、使用GAP驅動的動力學模擬中迭代擴展的結構、以及晶體同素異形體(如金剛石和石墨)的隨機畸變晶胞等。在該數據集中,他們使用150k參數取得了與NequIP接近的精度,并在參數數量擴展到600k時取得了比NequIP更高的精度。他們使用HotPP直接獲得金剛石結構的力常數矩陣并計算了其聲子譜,并與第一性原理計算的結果進行了比較,證明了HotPP能夠很好地學習結構的振動行為。
表1:碳數據集中HotPP與常見機器學習力場精度比較。
其次,由于HotPP可以直接學習高階張量,他們在水的數據集中學習了電偶極矩與電極化率,并使用動力學模擬計算了水的紅外吸收譜與拉曼光譜。他們通過額外訓練了一個機器學習力場來學習液態水的能量、力和應力,在常溫常壓(300K,1 bar)下進行了100 ps的經典分子動力學模擬,隨后對它們的電偶極矩與電極化張量的自相關函數進行傅里葉變換來計算紅外光譜和拉曼光譜,計算結果與實驗測量數據一致。
另外,HotPP還可與孫建教授課題組自主開發的機器學習與圖論輔助的晶體結構搜索軟件MAGUS聯用,提高結構搜索的效率。
圖2:HotPP與其他力場計算的紅外與拉曼光譜跟實驗數據的比較。
相關研究成果以“E(n)-Equivariant cartesian tensor message passing interatomic potential”為題,于近日發表在Nature Communications上[Nat. Commun. 15, 7607 (2024) https://doi.org/10.1038/s41467-024-51886-6]。南京大學物理學院孫建教授課題組博士后王俊杰與普林斯頓大學化學系Roberto Car課題組博士后王勇(孫建教授課題組博士畢業)為該論文的共同第一作者,孫建教授為通訊作者,南京大學物理學院邢定鈺院士和王慧田教授提供了重要指導,合作者還包括孫建教授課題組的學生張皓庭(2024年6月本科畢業)、楊子洋、梁智新、施九洋。該項研究得到了南京微結構科學與技術協同創新中心、固體微結構物理國家重點實驗室和江蘇省物理科學研究中心的支持,得到了國家自然科學基金委杰出青年基金、江蘇省基礎研究項目、江蘇省卓越博士后計劃、中央高校基本業務費、南京大學卓越研究計劃、南京大學AIQ津貼項目等經費的資助。相關計算工作主要在南京微結構協同創新中心高性能計算中心和南京大學高性能計算中心的超級計算機上進行。
所有評論僅代表網友意見,與本站立場無關。