您當前的位置:首頁 > 研究成果 > 研究進展

中國科大在“神威?太湖之光”上首次實現千萬核心并行第一性原理計算模擬

時間:2020-07-08 10:56:04 來源:中國科大新聞網

  近日,中國科學技術大學針對大尺度數萬原子分子固體體系的第一性原理計算模擬,以低標度平面波高精度計算軟件DGDFT為基礎,在國產神威?太湖之光超級計算機上實現了千萬核超大規模并行計算,研究成果以“High performance computing of DGDFT for tens of thousands of atoms using millions of cores on Sunway TaihuLight”為題在線發表于《Science Bulletin》上。這項成果由合肥微尺度物質科學國家研究中心、化學與材料科學學院的楊金龍教授課題組,與計算機科學與技術學院安虹教授課題組聯合攻關,在國家超級計算無錫中心和中國科學院軟件研究所研究人員的緊密配合下完成。


/uploads/image/2020/07/08/c60ba3c4e9369e8f463d6992f974e305.png


圖1 《Science Bulletin》期刊論文頁面


  神威·太湖之光超級計算機系統是我國也是世界第一臺理論浮點計算能力達到?億億次量級的超級計算機系統。與國際 TOP500 超級計算機列表中排名靠前的幾臺采用 “CPU + 加速器” 結構的超算系統不同的是,神威·太湖之光強大的理論浮點計算性能來自于40,960 個我國自主設計的第二代申威26010眾核處理器。相比于同時代的商用多核處理器,申威眾核處理器擅長處理計算密集型任務,具有更大規模的多級并行計算單元和獨特的片上存儲結構,其上的并行算法設計和性能優化面臨許多挑戰,迫切需要在重大應用問題的驅動下,發展其上的算法設計和優化實現方法。


  DGDFT(Discontinuous Galerkin Density Functional Theory)方法是利用自洽場(Self-Consistent Field, SCF)迭代過程中動態生成的自適應局域基函數(Adaptive Local Basis, ALB)來求解KS (Kohn-Sham)方程,具有可媲美平面波基組的高精度計算結果。算法實現采用了兩級并行化策略,用于處理并行計算中各種類型的數據分布、任務調度和數據通信方案等;同時結合申威SW26010眾核處理器特點實現了主從核多線程異構并行和高性能計算函數庫,在神威?太湖之光上完成了超大規模高性能DFT計算模擬。計算結果表明,DGDFT方法可以在神威?太湖之光超級計算機上并行擴展到8,519,680個計算處理核(131,072個核組),用于研究含有數萬碳原子(11520碳原子)的二維金屬石墨烯體系的電子結構性質。


/uploads/image/2020/07/08/4bf2c926ab2b0c1635968ae35d59200e.jpg


圖2  DGDFT的ALB基組,塊狀三對角Hamiltonian矩陣,流程圖,神威主從核并行加速。


  超級計算機和高性能計算技術的快速發展,使得基于KS方程密度泛函理論(KS-DFT)的第一性原理計算模擬在凝聚態物理、材料科學、化學和生物等研究領域變得越來越重要。自2010來以來,中國擁有了3臺世界上計算速度最快的超級計算機,其中神威?太湖之光曾4次占據世界超級計算機TOP500排行榜第一。但是,國內第一性原理高性能計算軟件卻遠遠落后于超算硬件的發展。因此,隨著國產超級計算機的快速發展,很有必要發展相應的理論算法和超大規模并行計算軟件,從而充分發揮出這些超級計算機強大的計算能力,模擬研究更大尺度的物理化學問題。


  這次通過超算應用團隊、軟件移植和性能優化團隊,與基礎算法庫開發團隊以及國家超算中心硬件技術支持團隊的緊密合作,把我校理論與計算化學的低標度理論算法與國產高性能并行計算軟硬件的優勢結合起來,充分發揮了國產神威?太湖之光超級計算機的強大計算能力;開發了低標度、低通訊,低內存、低訪存的并行計算方法;實現了具有平面波精度的千萬核超大規模高性能并行計算。同時,模擬體系的大?。〝等f原子)比國際同等平面波精度的計算模擬軟件提高了數百倍。這一成果說明,借助當代最先進的計算方法和世界頂級高性能計算平臺,大體系、長時間的高精度第一性原理材料模擬已成為現實。


  論文鏈接:https://www.sciencedirect.com/science/article/pii/S2095927320304230#!


相關文章

502w彩票