高通量计算筛选的材料设计接口应用软件①
冯岳璐1,2, 王 浩3, 杨小渝1,2, 靳 凯3, 万 萌1
1(中国科学院 计算机网络信息中心, 北京 100190)
2
(中国科学院大学 计算机科学与技术学院, 北京 100049)3
陈兴洲
(南京航空航天大学 材料科学与技术学院, 南京 210016)通讯作者: 杨小渝摘 要: 复合材料是由至少两种不同性质的材料组成. 基于此特点, 高通量计算和多尺度模拟方法和理念, 尤其适合于复合材料配方的理论设计. 为此, 我们研发了一个基于Materials Studio 的支持复合材料配方设计的高通量计算和筛选的接口应用软件. 目前该软件主要支持Materials Studio 中的Amorphous Cell 和Forcite Plus 两个计算模块,通过模块接口的调用实现了高通量生成复合材料各种配方, 以及基于分子动力学的高通量自动流程计算和筛选. 与直接使用Materials Studio 软件相比, 该软件具有“一键式、自动流程、高通量筛选” 等特点. 目前该软件已经实现了微观尺度的基于分子动力学模块Forcite Plus 的自动流程筛选. 下一步我们将在此基础上, 开发出介观尺度上使用耗散粒子动力学方法的Mesocite 模块接口, 实现跨尺度计算模拟和高通量自动流程筛选, 开展环氧树脂基复合材料的配方设计. 使用该软件的用户必须要有Materials Studio 版权.
关键词: 复合材料; 配方设计; 高通量材料计算; 高通量计算筛选; 材料基因工程; 接口应用
引用格式: 冯岳璐,王浩,杨小渝,靳凯,万萌.高通量计算筛选的材料设计接口应用软件.计算机系统应用,2020,29(11):104–113. www.c-s-a/1003-3254/7630.html
Interface Application Software Bad on High Throughput Calculation and Screening for Materials Simulation
FENG Yue-Lu 1,2, WANG Hao 3, YANG Xiao-Yu 1,2, JIN Kai 3, WAN Meng 1
1(Computer Network Information Center, Chine Academy of Sciences, Beijing 100190, China)
2
(School of Computer Science and Technology, University of Chine Academy of Sciences, Beijing 100049, China)3
虾油(College of Materials Science and Technology, Nanjing University of Aeronautics and Astronautics, Nanjing 210016, China)
Abstract : Composite materials are compod of at least two materials with different properties. Bad on this feature,high-throughput material calculation and multi-scale simulation methods and concepts are particularly suitable for the theoretical design of composite material formulations. To this end, we have developed a high-throughput calculation and screening interface application software bad on Materials Studio that supports composite material formulation design.At prent, the software mainly supports two calculation modules, Amorphous Cell and Force Plus in Materials Studio.Through the call of the module interface, various formulas of high-throughput composite mate
rials are realized, and high-throughput automatic process calculation and screening bad on molecular dynamics. Compared with directly using Materials Studio software, this software has the characteristics of “one-click, automatic process, high-throughput screening” and so on. At prent, the software has realized micro-scale automatic process screening bad on the molecular dynamics module Forceite Plus. In the next step, we will develop a Mesocite module interface using dissipative particle dynamics method on the mesoscopic scale, realize cross-scale calculation simulation and high-throughput莫高窟介绍
计算机系统应用 ISSN 1003-3254, CODEN CSAOBN
E-mail: Computer Systems & Applications,2020,29(11):104−113 [doi: 10.15888/jki.csa.007630]www.c-s-a ©中国科学院软件研究所版权所有.
Tel: +86-10-62661041
① 基金项目: 国家重点研发计划(2016YFB0700501, 2017YFB0701700, 2017YFB0703301); 国家自然科学基金(11534012)
Foundation item: National Key Rearch and Development Program of China (2016YFB0700501, 2017YFB0701700, 2017YFB0703301); National Natural Science Foundation of China (11534012)
收稿时间: 2020-03-01; 修改时间: 2020-03-27; 采用时间: 2020-04-14; csa 在线出版时间: 2020-10-29
104
automatic process screening, and carry out formula design of epoxy resin matrix composite. Urs must have Material Studio copyright to u this software.
Key words: composite materials; formulation design; high-throughput material calculation; high-throughput computational screening; material genetic engineering; interface application
复合材料是由两种或两种以上不同性质的材料,通过物理或化学的方法, 在宏观上组成具有新性能的材料. 高分子基复合材料由基体、增强体和界面3部分组成, 相比于传统材料, 由于其具有独特优异的性能,例如: 轻质、高强度、高模量, 被广泛用于航空航天等领域. 研制高分子基复合材料时, 基体扮演着重要角色,组成基体的不同性质材料的配比如何确定, 及不同配方的基体对复合材料的宏观性能又有哪些影响, 一直是一个十分具有挑战性的难题[1–5]. 基于传统实验“试错法”, 成本高, 周期长, 而计算模拟、大数据和人工智能的方法, 可以帮助更快地进行材料的配方设计并预测材料的性质.
材料计算的主流软件如Material Studio[6,7]虽然提供了不同尺度的计算模块(CASTEP、Forcite Plus、Mesocite等), 并且该软件也支持同一尺度下多种计算任务(如Forcite Plus模块支持结构优化、模拟退火
、动力学平衡等). 然而使用起来非常不方便, 不同尺度及不同任务间的计算需要每步单独开展. 尤其是, 计算结果数据得不到有效保存和管理, 极易丢失, 非常不便于人工智能时代的材料设计和材料数据挖掘.
高通量计算和筛选方法可以生成大量参考的配方,自动计算, 自动保存计算结果, 根据筛选条件选择出符合要求的配方. 可以快速排除许多不合理的配方, 减少了材料研发周期和材料开发中的代价. 通过计算模拟进行复合材料的配方设计和性质预测, 往往涉及多个尺度的计算(如微观-介观-宏观)[8]. 即便在同一尺度下,还涉及不同的计算任务(如结构优化-模拟退火-动力学平衡等). 因此, 使用高通量计算和筛选方法进行复合材料的配方设计, 应该是这样的一种思路: 顺着“结构-分子运动-物理性质” 研究路线, 如何高通量的产生大量不同的复合材料配方, 并在这些配方的结构中通过一系列动力学模拟后, 计算每一种配方下材料的结构性质和力学性质, 并按照一定的筛选条件选择出合理的配方. 通过筛选出的结构, 分析其结构性质与物理性质的联系, 得出哪些结构性质是决定其物理性质的关键因素. 一般考虑运动单元(链节运动、链段运动、侧基运动、支链运动、晶区运动以及整个分子链运动等) 的变化以及运动方式(键长、键角的变化, 侧基、直链、链节的旋转和摇摆运动) 的变化等因素. 采用这种方法和模式进行材料配方设计和性质预测, 涉及大规模计算, 大量的数据处理, 以及同一尺度下的不同计算任务之间的计算结果如何传递, 和不同尺度之间的计算结果转换和传递方法.
因此, 我们需要开发这样一种基于材料计算软件Materials Studio的支持高通量自动流程计算和筛选的材料设计接口应用软件, 它能自动生成大量的复合材料配方, 根据用户需要添加计算模块、设置计算参
数,计算作业以及参数设置完成之后提交作业; 计算环境包含计算作业的调度和材料计算软件, 并能根据用户此次的筛选需求自动存储相应的计算结果, 利用统计学方法以及机器学习的方法对数据进行二次处理, 从而得到相应的用于结构筛选所需的筛选因子数据, 并根据筛选因子筛选出符合条件的配方.
1 需求分析和软件架构设计
1.1 软件需求分析
本着“一键式、自动流程、高通量筛选” 等特点,该软件使用了客户端/服务器模式的架构. 客户端可以设置计算作业、设置计算参数、监控作业状态等; 服务器端负责在用户提交计算作业并开始计算之后, 负责作业间的调度与计算结果的保存于分析, 并将其存入数据库中. 提供计算资源的Materials Studio及其计算模块可以是任意计算节点, 小到PC机, 大到计算中心. 该软件的主要特点如下:
(1)自行设计每次计算机作业流程、添加计算模块.
(2)高通量的生成材料配方.
(3)按需设置各个计算模块中的参数.
经典语录社会现实句子(4)自动进行作业的调度.
(5)自动提取计算结果, 使用统计学和机器学习方法分析数据.
2020 年 第 29 卷 第 11 期www.c-s-a计算机系统应用
105
(6)可下载所有的计算结果文件或下载经过筛选的符合条件的配方文件.
1.2 软件架构设计
该软件主要分为流程设计、流程监控、作业调度、计算结果分析、结构筛选5个部分. 流程设计、作业调度及结构筛选3部分是整个系统的核心, 主要包含了高通量生成计算任务, 高通量自动流程的实现,以及高通量结构筛选, 如图1所示.
流程设计以及流程监控 (Web)
Workflow
1. Amorphous Cell
2. UploadModel
3. Forcite Plus
4. Mesocite
5. Crosslink
6. PickOut
1. Amorphous Cell
2. UploadModel
3. Forcite Plus
18年属什么
4. Mesocite
5. Crosslink
Calculation status
Data 1. Forcite Plus
2. Mesocite
Pickout
作业调度
计算结果分析
结构筛选
贵阳辣子鸡
图1 软件架构图
流程设计及流程监控部分中, 可自行添加和删除计算作业、在每个作业中可根据用户需要添加计算模块、在每个计算模块中也可根据计算需求进行参数设置、用户添加完计算模块及设置完计算参数后可以提交作业. 之后, 用户可对计算作业的运行状态进行监控.
作业调度部分包含作业的自动调度及计算节点.作业的自动调度中, 软件服务器根据用户设置的计算参数和计算模块, 将每个计算模块中的计算任务发送至计算节点, 计算节点计算完成之后, 将计算结果发送至提交计算任务的服务器.
计算结果分析部分从计算节点计算完成并发送至提交计算任务服务器的计算结果中, 提取本次计算所需的数据, 直接存储或者进行处理后存储, 生成筛选因子.
结构筛选部分中, 用户可以根据添加的筛选因子进行结构筛选, 对满足筛选条件的结构, 用户可以根据需要选择其中的某些配方, 并下载这个配方下的所有计算结果文件, 或者直接下载所有配方的计算结果文件.
1.3 流程设计
本节主要介绍使用本软件进行高通量微观建模以及微观尺度的分子动力学模拟两部分的计算流程, 具体的流程介绍如图2所示.
在微观尺度的模拟中, 首先需要产生大量的候选配方并建立模型, 系统提供两种产生候选模型的方法,分别是用户上传和高通量生成大量候选配方. 模型上传或高通量建模完成之后需要对每个配方进行分子动力学模拟、结构交联、结构分析、力学性质计算和结构筛选, 用户可以自行选择本次作业中需要添加的计算模块.
在进行流程设计时, 用户首先需要选择使用高通量建模或上传已经建立好的模型, 有了微观尺度的计算模型, 就需要对结构进行初步优化. 优化完成之后可以选择是否进行交联反应建立交联模型, 如果选择
了交联反应模块, 则在交联模型建立完成之后对结构再次进行动力学模拟, 最后进行结构分析、力学性质计算和筛选. 不选择交联反应模块则直接进行结构分析、力学性质计算和筛选.
2 接口应用软件设计
软件基于客户端-服务器架构, 主要基于Materials Studio的核心模块进行开发. 不同尺度的材料计算模块(如Amorphous cell、Forcite Plus、Mesocite、CASTEP
计算机系统应用www.c-s-a2020 年 第 29 卷 第 11 期106
等) 运行于计算节点. 服务器可以高通量生成作业, 进行参数设置, 以及作业提交等. 将每次计算任务发送至
计算节点, 一旦计算结束, 计算节点会将计算结果返回至服务器端进行分析、筛选以及可视化呈现.
开始
是否建模
是是
是
是
是
是
是
否否
否
否
否
否
否
儿媳与公公乱伦
建模
结构是否上传完成
微观模拟方法 Forcite Plue 是否进行微观模拟
是否进行微观模拟
是否进行结构筛选
结构筛选 (PickOut)
是否下载筛选结果
筛选结果 (PickOut)
结束
上传建模
Geometry optimization Anneal Dynamics
微观模拟方法 Forcite Plue Geometry optimization Anneal Dynamics
微观模拟方法 Forcite Plue Geometry optimization Anneal Dynamics
是否进行交联反应
交联反应
厉害拼音图2 微观尺度模拟计算流程图
目前该软件主要支持Materials Studio 的Amor-phous Cell 模块和Forcite Plus 模块, 通过Amorphous Cell 模块生成微观尺度的复合材料分子模型, 使用Forcite Plus 模块中的不同计算任务对模型进行分子动力学模拟. 自动流程是整个软件的核心, 自动流程的核心算法实现参照了MatCloud [9–13].2.1 Materials Studio 核心模块简介
进行性质预测首先需要建立高分子模型, Amorphous Cell 就是一个高分子建模模块, 能够进行塑料、玻璃、树脂等无定型聚合物的建模. Forcite Plus 是Materials Studio 提供的一个分子动力学计算模块, 它包含各种通用力场和支持5种任务, 每个任务可以是一个单独的模块.
实际应用中, 用户可以根据自己的需求选择不同的任务组合. 可以选择上传建立好的模型或上传单分子
模型, 根据环境参数进行无定形建模. 在分子动力学模拟中可以选择多种任务, 比如几何优化-模拟退火-动
力学平衡、几何优化-动力学平衡等多种流程.
在进行上述操作时, 每个计算任务均需要单独地完成, 并将计算结果存储下来. 当前一个任务(如几何优化) 完成后, 需要将其计算结果读取, 再开始下一个任务的计算(如模拟退火), 非常不便捷.2.2 软件核心功能
为了解决Material Studio 多个计算任务不够便捷的问题, 我们开发了一个基于Material Studio 多个计算模块的高通量材料计算接口应用软件[14–25], 它能够高通量生成作业, 能够进行不同任务间的协调和自动流程, 并将作业发送至计算节点开展计算, 基于计算结果进行筛选. 我们以环氧树脂基复合材料的配方设计, 进行该软件的应用验证.
目前该软件的1.0版, 主要支持微观尺度的计算,支持Material Studio 的Amorphous Cell 和Forcite Plus 模块. 软件主要有以下的核心模块: (1) 无定形建模模块(Amorphous Cell); (2) 上传模型模块(Upload-2020 年 第 29 卷 第 11 期
www.c-s-a
计算机系统应用
107
Model); (3) 动力学平衡模块(Forcite Plus Dynamic);
(4) 几何优化模块(Forcite Plus Geometry Optimization);
(5) 模拟退火模块(Forcite Plus Anneal); (6) 结构分析模块(Forcite Plus Analysis); (7) 力学性质计算模块(Forcite Plus Mechanical Properties);(8) 结构交联模块(XLink); (9) 结构筛选模块(Pickout).
2.2.1 按不同配比, 高通量方式生成大量的分子结构
无定形建模模块: 支持用户上传单分子模型, 可以根据用户选择的配比, 通过接口调用服务器端的Amor-phous Cell模块, 生成大量的复合材料分子模型. 这些输出的高分子模型, 就是Forcite Plus各个计算模块的输入文件.
高分子基复合材料的配方设计, 涉及组成基体的组分种类及其配比. 例如, 以环氧树脂基复合材料的基体为例, 包含3种组分, 分别是: 环氧树脂、固化剂、增韧剂. 而环氧树脂组分可以有两种分子结构, 分别是E54环氧树脂分子, AG80环氧树脂分子, 固化剂又可以有双氰氨, 二氨基二苯酚等. 究竟在哪个配方下, 才能使这种复合材料有着更优的性能, 就是配方设计问题.
确定基体中不同组分的分子结构数之比, 如表1.
表1 基体中不同组分的分子结构数比例基体中组分种类不同组分的分子结构数比例环氧树脂2
固化剂1
增韧剂1
确定环氧树脂组分中不同的分子的分子结构数,如表2所示(此例中选择两种环氧树脂分子结构).
表2 环氧树脂组分中不同分子的分子结构数(单位: 个)环氧树脂分子类别环氧树脂组分的分子结构数
E54100050
AG80010050
总和100100100
从表2中任意选取一个组合作为环氧树脂组分的配方. 比如, 本例中选择50个E54分子、50个AG80分子, 组成100个环氧树脂组分配方. 选择双氰胺、二氨基二苯酚、甲基硫氢苯酐3种固化剂分子, 选择PES、PEI、PSF这3种增韧剂分子. 则按表1的基体中不同组分的分子结构比例计算, 则会产生1326种固化剂
配方, 1326种增韧剂配方, 则本例中共有1758 276 (1326×1326) 个基体配方. 如表3和表4所示为固化剂和增韧剂组分的配方.
表3 生成的固化剂组分配方(单位: 个)
固化剂固化剂配方
双氰胺00...11 (494950)
二氨基二苯酚01...4849 (010)
甲基硫氢苯酐10 (100)
总和5050 (505050)
表4 生成的增韧剂组分配方(单位: 个)增韧剂增韧剂配方
<11 (494950)
<4849 (010)
<10 (100)
总和5050 (505050)
无定形建模模块的主要功能, 就是完成搭建具有多种组分, 如上面的例子中包含两种环氧树脂分子, 3种固化剂分子, 3种增韧剂分子, 在不同配方下的高分子共混模型. 每一个分子模型的构建都是Materials Studio的Amorphous Cell模块采用的蒙特卡洛方法进行无定形模块搭建, 每个分子模型都是随机产生的, 所以在本项目中的无定形建模模块对每一个配方只生成一个分子模型, 每个配方的后续计算都是在这个分子模型的基础上进行的.
2.2.2 上传搭建好的模型
上传模型模块: 在微观尺度的模拟中本软件支持用户上传两种类型的文件, 一种是无定形建模模块搭建好的模型, 一种是单分子模型, 两种结构类型支持的是两种流程, 本模块支持用户上传无定形建模模块搭建好的模型, 可以直接作为Forcite Plus的各个计算模块的输入文件, 直接开展分子动力学模拟.
2.2.3 微观尺度的分子动力学模拟
分子动力学模拟的目标是对高分子结构中的每一个小分子进行优化, 优化之后找出体系在变化过程中总能量最低的构型, 再对其进行特定条件下的模拟运动, 并分析其各种性质. 包含以下几种计算任务.
几何优化模块: 优化原子坐标和晶胞参数, 支持原子笛卡尔坐标和晶胞参数的限定, 可添加外应力. 输入
文件是原子或分子结构, 输出是几何优化后的结构.
模拟退火模块: 基于不同温度点的动力学模拟, 实现体系的反复升降温过程, 辅助扫描势能面, 寻找最优的分子构象, 吸附构象等. 该模块的输入文件是分子结构, 输出是从不同温度条件下的分子结构中找出的5个能量最低的构象.
动力学平衡模块: 基于牛顿运动方程, 研究原子核
计算机系统应用www.c-s-a2020 年 第 29 卷 第 11 期108