在材料科學(xué)與計(jì)算化學(xué)的交叉領(lǐng)域,科學(xué)家們長(zhǎng)期面臨一個(gè)核心矛盾:高精度算法受限于計(jì)算規(guī)模,而真實(shí)材料體系又迫切需要更精確的模擬手段。近期,一項(xiàng)突破性成果打破了這一僵局——字節(jié)跳動(dòng)Seed AI for Science團(tuán)隊(duì)聯(lián)合北京大學(xué)、倫敦大學(xué)國(guó)王學(xué)院的研究者,開發(fā)出名為SIE+CCSD(T)的量子嵌入框架,首次將量子化學(xué)的“金標(biāo)準(zhǔn)”方法拓展至包含數(shù)百原子、上萬(wàn)軌道的真實(shí)材料體系,相關(guān)論文發(fā)表于《自然·通訊》。
傳統(tǒng)量子化學(xué)方法中,CCSD(T)算法因其能精確描述電子關(guān)聯(lián)效應(yīng),被視為理論計(jì)算的“金標(biāo)準(zhǔn)”。然而,其計(jì)算復(fù)雜度隨體系規(guī)模呈指數(shù)級(jí)增長(zhǎng),導(dǎo)致該方法僅能處理極小分子體系。例如,在研究催化反應(yīng)或電池界面時(shí),真實(shí)材料往往包含數(shù)百個(gè)原子,傳統(tǒng)方法在此類體系中幾乎無(wú)法運(yùn)行。而密度泛函理論(DFT)雖計(jì)算效率較高,但其結(jié)果依賴泛函選擇,難以系統(tǒng)提升精度。這種“精度與速度不可兼得”的困境,長(zhǎng)期制約著材料設(shè)計(jì)的理論預(yù)測(cè)能力。
研究團(tuán)隊(duì)提出的SIE+CCSD(T)框架,通過“分而治之”的多分辨率策略解決了這一難題。該框架首先利用低精度方法對(duì)全體系進(jìn)行初步計(jì)算,識(shí)別出關(guān)鍵區(qū)域;隨后將系統(tǒng)分割為多個(gè)子區(qū)域,對(duì)核心區(qū)域采用CCSD(T)進(jìn)行高精度計(jì)算,最終將結(jié)果整合至整體模型。這種設(shè)計(jì)不僅保留了“金標(biāo)準(zhǔn)”的精度優(yōu)勢(shì),還通過動(dòng)態(tài)篩選關(guān)鍵軌道與電子,大幅降低了計(jì)算量。實(shí)驗(yàn)表明,在包含392個(gè)碳原子、約1.1萬(wàn)個(gè)軌道的石墨烯體系中,SIE+CCSD(T)的計(jì)算效率接近線性擴(kuò)展,體系規(guī)模翻倍時(shí)計(jì)算時(shí)間僅增加約一倍。
為驗(yàn)證方法的普適性,研究團(tuán)隊(duì)在多種真實(shí)材料體系中進(jìn)行了測(cè)試。從固體氧化鎂表面到多孔金屬有機(jī)框架,再到二維石墨烯材料,SIE+CCSD(T)的計(jì)算結(jié)果與實(shí)驗(yàn)數(shù)據(jù)誤差均控制在±1 kcal/mol以內(nèi),達(dá)到化學(xué)精度標(biāo)準(zhǔn)。更關(guān)鍵的是,該方法無(wú)需針對(duì)不同體系調(diào)整參數(shù),而是通過統(tǒng)一策略實(shí)現(xiàn)了跨材料類型的穩(wěn)定精度。例如,在氧化鎂表面吸附一氧化碳的體系中,計(jì)算結(jié)果與實(shí)驗(yàn)值高度吻合;在金屬有機(jī)框架材料中,該方法成功區(qū)分了不同吸附位點(diǎn)的能量差異,為催化劑設(shè)計(jì)提供了理論依據(jù)。
一個(gè)典型案例是水分子在石墨烯表面的吸附行為研究。此前,不同研究因模型規(guī)模限制得出矛盾結(jié)論:部分工作認(rèn)為水分子“平躺”吸附更穩(wěn)定,另一些則支持“垂直”取向。借助SIE+CCSD(T)的高效性,團(tuán)隊(duì)將體系擴(kuò)展至數(shù)百原子級(jí)別,發(fā)現(xiàn)開放邊界與周期性邊界條件下的計(jì)算結(jié)果逐漸趨同,吸附能差異縮小至幾meV量級(jí)。最終結(jié)果顯示,不同取向下的吸附能幾乎相同(約100 meV),表明水分子在石墨烯上不存在優(yōu)先吸附構(gòu)型。這一結(jié)論修正了此前小體系模擬的偏差,為石墨烯在海水淡化、藍(lán)色能源等領(lǐng)域的應(yīng)用提供了關(guān)鍵理論支撐。
技術(shù)實(shí)現(xiàn)層面,SIE+CCSD(T)的突破得益于全流程GPU優(yōu)化。研究團(tuán)隊(duì)設(shè)計(jì)了針對(duì)量子化學(xué)計(jì)算的專用GPU內(nèi)核,將電子積分、張量收縮等關(guān)鍵步驟映射至并行架構(gòu)。例如,在1.1萬(wàn)個(gè)軌道的石墨烯體系中,單張A100 GPU即可在數(shù)小時(shí)內(nèi)完成計(jì)算,而傳統(tǒng)CPU集群需要數(shù)周時(shí)間。框架支持動(dòng)態(tài)負(fù)載均衡,可根據(jù)子區(qū)域計(jì)算復(fù)雜度自動(dòng)分配GPU資源,進(jìn)一步提升了大規(guī)模體系的計(jì)算效率。
目前,研究團(tuán)隊(duì)已開源SIE+CCSD(T)的代碼庫(kù),供全球科研人員使用。該方法不僅為催化設(shè)計(jì)、清潔能源材料開發(fā)提供了可信的理論工具,還為高精度計(jì)算與機(jī)器學(xué)習(xí)的結(jié)合開辟了新路徑。例如,通過將SIE+CCSD(T)的計(jì)算結(jié)果作為訓(xùn)練數(shù)據(jù),可構(gòu)建更準(zhǔn)確的機(jī)器學(xué)習(xí)勢(shì)函數(shù),從而在更大尺度上模擬材料行為。隨著計(jì)算資源的不斷升級(jí),這一框架有望推動(dòng)材料科學(xué)從“試錯(cuò)法”向“理論驅(qū)動(dòng)設(shè)計(jì)”的范式轉(zhuǎn)變。






