RONTIER DISCUSSION
前沿探讨
38
FEBRUARY 2021
基于知识图谱的
金属材料环境适应性可视化系统构建研究
装备环境适应性是指武器装备对环境的适应能力,是武器系统在实际应用或服役环境下的性能和可靠性达到理想环境下的程度。随着金属材料在武器装备设计制造中广泛使用,新型合金材料和处理工艺不断出现,材料使用或服役的环境条件复杂多变,采集和积累的金属材料效应数据日渐繁杂冗余,这与科研设计人员面对多数据源如何快速获取所需金属材料相关性能、对金属材料的环境适应性数据进行可视化对比以帮助选材优材的需求逐渐出现矛盾,而知识图谱技术的发展为此类“数据丰富,知识贫乏,可视化效果差”的问题提供了新的技术解决思路,且在互联网上的开放知识图谱(比如Wikipedia、Freeba、DBpedia、Microsoft Concept Graph )中存在大量不同领域的结构化数据,为金属材料环境适应性可视化系统的构建与实现提供了高质量数据源,系统的实现将促进金属材料领域知识的共享和交换,提口才与交际
高其利用价值。
金属材料已广泛应用于武器装备的设计制造中,但由于金属材料牌号分类多,应用或服役的自然环境差异大,不同牌号金属材料在不同自然环境下有着千差万别的性能表现,体现出各自的环境适应性。本文通过知识图谱技术,设计和实现金属材料环境适应性可视化系统,辅助科研试制人员在产品设计过程中快速选择满足性能指标的优选金属材料。
◎◎西南技术工程研究所◎◎刘青林◎◎光文军◎◎罗杰
一、总体思路
知识图谱是由相互链接的知识点组成的关系网络数据库,是解决知识表达和存储管理的一种数据组织模式,由谷歌公司于2012年率先提出这一概念,获得了前所未有的关注。本文利用从开放知识图谱DBpedia 中抽取的金属材料领域数据构建了一个领域本体作为可视化图谱的数据源,再通过SQL Server 数据库存储及处理此数据源,最后利用D3.js 构建了金属材料知识图谱的可视化系统,总体思路框架见图1。
二、金属材料领域知识图谱构建方法
(一)数据获取
legal
DBpedia 是世界上最大的多领域开放知识图谱之一,它从维基百科(Wikipedia )的词条里撷取出结构化的数据,以强化维基百科的搜索功能。本文利用网络爬虫采集获取常用
CIVIL-MILITARY INTEGRATION
ON CYBERSPACE
网信军民融合
2021年02月
39
现在进行时讲解金属材料的科技文献报告与DBpedia 中抽取的金属材料领域数据构建了一个领域本体作为可视化系统的数据源,在该本体有4300多个三元组,其中包含763个类,1541个实例以及113个属性。将源数据
按照材料牌号、处理工艺、服役环境、性能表现等方式进行数据预处理,构建金属材料环境适应性信息,具体如表1所示。
(二)可视化知识图谱构建
本文通过Python + SQL Server + D3.js 的技术框架实现了面向常用金属材料领域的知识图谱,其主要构建流程如图2。
金属材料知识图谱的构建过程主要分为数据源的采集与存储、结构化数据的构建以及可视化系统的开发等三个步骤,对DBpedia 获取数据通过Redis、Neo4j、SQL Server 等数据处理工具的清洗形成金属材料知识图,主要流程如下:
overcome1、源数据的采集与存储:本文采用Python 语言的
Scrapy 爬虫框架实现了互联网文本数据的分布式爬取,将爬取得到的金属材料文献数据存入Redis 数据库中。
2、结构化数据的构建:通过自动化脚本对Redis 中的数据进行进一步的数据清洗后保存至格式文件中,再将格
式文件导入至Neo4j 图形数据库和SQL Server 关系型数据库中。
3、可视化系统的构建:使用Python 3.7版本的编程语言完成了爬虫、数据清洗的处理,使用D3.js 实现数据的可视化。
(三)数据库结构
本文通过SQL Server 关系型数据库实现了金属材料环境适应性数据的存储及管理。数据库包括四张表,其中MetallicMaterial、TreatmentProc 及EnvTest 三张实体表分别
存储了材料牌号和处理工艺、环境因素与试验的相关信息,
图
fasco1 总体思路框架
图2 金属材料知识图谱构建流程
RONTIER DISCUSSION
前沿探讨
F会计员
ancort
40
FEBRUARY 2021
参考文献:
[1] 刘宝波,李勤真,米斌斌.数据挖掘技术在军用车辆装备失效分析中的应用研究[J].装备环境工程,2008(02):28-31.[2] 陈伟雄,杨华健,周泽东,张明.地质矿物的地球化学数据可视化分析与构造背景预测[J].世界有色金属,2019(14):132-134.[3] 马云飞,张佳意.气象多要数数据可视化研究实现[J].吉林水利,2019(11):33-34+48.
成人高考高升本[4] 张运良,张兆锋,张晓丹,许德山.使用D3.js的知识组织系统Web动态交互可视化功能实现[J].现代图书情报技术,2013(Z1):127-131.
EnvSuitability 表则存储了金属材料知识图谱中的事实三元组信息。其中MetallicMaterial 表、TreatmentProc 表与EnvTest 表是多对多的关系,通过MetalBrand 和TreatmentProcID 两个字段进行了表间关系的映射,EnvSuitability 表则存储了知识图谱中的三元组。
具体地说,在数据库中EnvTest 和EnvSuitability 两张表都表示了金属材料环境适应性的试验结果信息,EnvTest 存储了原始的数据,而EnvSuitability 则把关系映射为了三
元组,即EnvSuitability 中的数据来自于EnvTest。在知识图谱中的关系有两种:一种称作属性(property ),而另一种称为关系(relation)。表EnvSuitability 只存储实体间的关系,属性由实体表检索得到,在EnvSuitability 表中的字段 type,就是用来区分三元组中的关系是实体间的关系还是实体的属性,便于之后可视化系统的构建。
(四)可视化系统的设计与实现
本文的可视化系统以Django 框架搭建了Web Server,Web 前端则通过D3.js 实现了基于知识图谱的金属材料环境适应性数据可视化。该系统可以检索不同牌号的金属材料获取相应的图谱信息,并会根据数据的更新来调整有向图版本。本文选取了常用的6种金属材料和其对应试验环境下的效应数据进行可视化的演示,演示结果如图4所示,其中蓝色的代表知识图谱中的实体,红色代表属性,绿色的是实体和属性之间的关系。
三、 总结与展望
本文通过属性值融合的方法研究构建了异构多数据源的常用金属材料环境适应性知识图谱,以Python 编程语言中的Scrapy 爬虫和Django Web 两种框架搭建了“数据爬取-数据存储-数据清洗-数据应用”的整套处理流程,并以
D3.js
学习方法总结为基础实现了金属材料环境适应性数据的可视化。
随着大数据技术的发展,对装备环境适应性数据进行深度挖掘和可视化展示的研究成为一项全新的课题,通过对金属材料环境适应性数据的分类和知识图谱技术的运用,可以更为深入的了解和研究装备提供数据支持,为科研试制人员在型号设计时进行材料选择、优化材料性能提供科学决策参累了的英文
考依据。
图3 数据库结构
图4 常用金属材料的可视化图谱