作者此前工作表明,在耦合簇CCSD (Coupled-Cluster approaches within the singles and doubles approximation)与CCSD(T)(CCSD approaches augmented by a perturbative treatment of triple excitations)计算中结合单精度数与消费型...作者此前工作表明,在耦合簇CCSD (Coupled-Cluster approaches within the singles and doubles approximation)与CCSD(T)(CCSD approaches augmented by a perturbative treatment of triple excitations)计算中结合单精度数与消费型图形处理单元(GPU),可以显著提高计算速度.然而由于CCSD(T)计算对内存的巨大需求以及消费型GPU的内存限制,在利用消费型GPU进行加速时,不考虑利用空间对称性的情况下,此前开发的CCSD(T)程序仅能用于计算300~400个基函数的体系.利用密度拟合(Density-Fitting,DF)处理双电子积分可以显著降低CCSD(T)计算过程中的内存需求,本工作发展了基于密度拟合近似并结合单精度数进行运算的DF-CCSD(T)程序,该程序可用于包含700个基函数的无对称性体系的单点能计算,以及包含1700个基函数的有对称性体系.本工作所使用的计算节点配置了型号为Intel I9-10900k的CPU和型号为RTX3090的GPU,与用双精度数在CPU上的计算相比,利用单精度数结合GPU进行运算可以将CCSD的计算速度提升16倍,(T)部分可提升40倍左右,而使用单精度数引入的误差可忽略不计.在程序开发过程中,作者发展了一套可利用GPU或CPU结合单精度数或双精度数进行含空间对称性的矩阵操作代码库.基于该套代码库,可以显著降低开发含空间对称性的耦合簇代码的难度.展开更多
文摘作者此前工作表明,在耦合簇CCSD (Coupled-Cluster approaches within the singles and doubles approximation)与CCSD(T)(CCSD approaches augmented by a perturbative treatment of triple excitations)计算中结合单精度数与消费型图形处理单元(GPU),可以显著提高计算速度.然而由于CCSD(T)计算对内存的巨大需求以及消费型GPU的内存限制,在利用消费型GPU进行加速时,不考虑利用空间对称性的情况下,此前开发的CCSD(T)程序仅能用于计算300~400个基函数的体系.利用密度拟合(Density-Fitting,DF)处理双电子积分可以显著降低CCSD(T)计算过程中的内存需求,本工作发展了基于密度拟合近似并结合单精度数进行运算的DF-CCSD(T)程序,该程序可用于包含700个基函数的无对称性体系的单点能计算,以及包含1700个基函数的有对称性体系.本工作所使用的计算节点配置了型号为Intel I9-10900k的CPU和型号为RTX3090的GPU,与用双精度数在CPU上的计算相比,利用单精度数结合GPU进行运算可以将CCSD的计算速度提升16倍,(T)部分可提升40倍左右,而使用单精度数引入的误差可忽略不计.在程序开发过程中,作者发展了一套可利用GPU或CPU结合单精度数或双精度数进行含空间对称性的矩阵操作代码库.基于该套代码库,可以显著降低开发含空间对称性的耦合簇代码的难度.