xxx16

更新时间:2023-03-08 17:57:16 阅读: 评论:0

本司-怎么学英语

xxx16
2023年3月8日发(作者:拓展训练心得)

科技与创新┃ScienceandTechnology&Innovation

·74·

2020年第02期

文章编号:2095

6835

2020

02

0074

02

基于文本数据挖掘的复式交分道岔设备故障事件分析

田世润

(兰州交通大学,甘肃兰州730070)

摘要:

分析复式交分道岔设备记录的大量文本数据,需要消耗大量的人力资源,可采用

NLPIR

软件进行特征词

提取并结合现场专家意见对特征词进行筛选和分类,生成复式交分道岔的故障特征词。通过对特征词的出现频率

和性质分析,梳理得到可能导致复式交分道岔发生故障的部位。

关键词:

文本数据挖掘;复式交分道岔;

TF-IDF

模型;文本特征词库

中图分类号:D923.41文献标识码:ADOI

10.15913/.2020.02.024

复式交分道岔是道岔系统中记录文本故障数据最多、结

构最为复杂的道岔类型。

目前中国铁路故障数据分为实时监控数据和施工现场

记录的文本数据,实时监控数据多数可以直接被计算机识别

和运算,文本数据由于较多为人工记录的故障数据,因此被

计算机识别起来较为困难。对文本数据中记录的故障类型和

故障致因进行梳理,在系统故障诊断和可靠性分析过程中能

够起到不可忽视的作用。人工对文本数据处理常常会消耗大

量的时间和精力,并且存在较大的误差。

文献[1]对高铁车载设备故障追踪表用主题模型进行了

特征提取和分析,同时结合专家知识和动车组设备特点对车

载设备进行故障诊断。文献[2]分别采用卡方检验和朴素贝叶

斯作为提取文本降维和分类方法,对铁路安全管理信息报告

进行文本挖掘。文献[3]对铁路信号设备不平衡故障文本数据

基于TF-IDF模型进行了文本故障特征提取,并转换为向量,

通过Voting方式进行多分类器集成学习。文献[4]对文本挖

掘技术方法和发展历史进行了详细介绍。现阶段对道岔文本

数据的挖掘研究尚不成熟,尤其是对道岔文本数据中文本特

征词库的建立极其匮乏,难以对文本数据快速处理分析。

本文提出一种通过NLPIR软件对复式交分道岔的文本

数据进行提取的方法。

1道岔维护记录分析

目前中国道岔记录方法方式主要是依据《行车设备(施

工、检查)登记簿》进行故障登销,人工对故障进行登记过

程中存在以下几个问题。

1.1一词多义和多词多义现象

由于现场有大量的值班人员,每次故障记录时的值班人

员可能都不一样,不同的工作人员在记录过程中对术语的表

达存在不同程度的差异。因此,在文本数据中存在大量的简

写和缩写,例如道岔“卡缺口”常记为“卡口”,“道岔”常

缩写为“岔”。

1.2现场所记录的道岔故障篇幅存在很大的差异

不同的值班人员对道岔故障的严重程度和道岔故障诊

断程度存在着很大的差异,有些工作人员对道岔记录得非常

详细,如“室内值班员xxx16:44接车务通知,调看微机发

现6034/6038#道岔(ZD6复式交分道岔)反位向定位转换

6036#道岔定位无表示,16:45通知现场工区值班员xxx,

及车间值班调度xx,现场工区值班员xx、防护员xx16:55

到达现场,对设备进行检查发现6036#道岔因定位尖端杆销

子旷动尖轨翘头(04-05已通知单通知工务)造成定位卡口,

调整后17:06分处理完毕扳动试验良好。室内值班员xx17:

45分接车务通知,调看微机发现6034/6038#道岔(ZD6复

式交分道岔)反位向定位转换6036#道岔定位无表示,

17:46分通知现场工区值班员xxx及车间值班调度xx,现

场工区值班员xx、防护员xx17:55分到达现场,对设备进

行检查发现6036#道岔因定位尖端杆销子旷动尖轨翘头

(04-05已通知单通知工务)造成定位卡口,调整后18:20

分处理完毕扳动试验良好。”

有些值班员对道岔故障记录非常简单,如“4022/4026

#定位向反位转换,4026#反位空转,车务扳动后,反位表示

正常。下一天窗点检查处理。”文本篇幅的差异导致人工提

取道岔的故障致因变得十分复杂。

1.3文本数据中存在很多与道岔无关信息

文本数据中存在很多与道岔无关信息,如“车务板一个

来回后恢复,下一个天窗整治。值班员xxx9:24接车务通

知,调看微机发现218/224#(ZD6复式交分)道岔反位向定

位转换222#定位无表示,9:26通知现场xxx及车间调度

xx,现场值班员xx、防护员xx9:32到达现场对设备进行

检查发现,尖轨爬行造成222#定位卡口,调整后9:55处

理完毕,扳动试验良好。02-04已下发通知书。9:35车间

干部xxx到现场落实处理情况。”有用信息只有“尖轨爬行

导致卡缺口表示”这部分有用。

.htsRerved.

ScienceandTechnology&Innovation┃科技与创新

2020年第02期

·75·

2主要技术路线

文本挖掘技术是一门涉及统计学、自然语言学、机器学

习等多个领域的知识。

利用NLPIR软件对文本数据进行处理的主要步骤为:

①对所有需要研究的文本进行预处理,除去文本中一些没有

意义的词例如“道岔型号”“记录员信息”“数据”和一些没

有意义的虚词,这样就可以将文本数据转化成由简单词语组

成的文本数据。②提取文本中的特征词可能会出现维数过大

的现象,应对特征词进行降维处理。提取出只显示复式交分

道岔故障致因相关的特征词。③计算每个文本中的特征词的

含量并对其进行分析和处理。④计算出各个特征词出现的频

率和次数,结合专家意见对特征词所对应的故障类别进行

分析。

3文本故障数据处理

3.1软件介绍

NLPIR-ICTCLAS是一款大数据语义智能分析平台,针

对大数据内容处理的需要,融合了网络精准采集、自然语言

理解、文本挖掘等技术。开发平台由多个中间组件组成,各

个中间件API可以无缝地融合到客户的各类复杂应用系统

中,可以实现信息精准采集、文档转换、新词发现、批量分

词等功能。

3.2文本数据处理

对预处理的文本故障数据进行预处理,将“道岔型号”

“值班员信息”等干扰信息消除,只留下可以描述道岔故障

的关键性词语,如表1所示。

表1复式交分道岔空转故障部分文本数据预处理结果

空转表示杆连接销子错位

空转表示杆连接销子错位

空转表示杆连接部受到冲击

空转表示杆受杂物干扰

空转表示杆错位

空转表示杆蹭枕木

空转表示杆碰水泥枕尖轨爬行

空转表示杆销子碰轨底

空转表示杆移动受阻夹杂物

空转表示杆移动受阻碰枕木

空转岔根根部螺丝太紧

空转齿条块削尖齿缺油

空转道岔根部夹杂物

然后用NLPIR软件进行分词处理,以复式交分道岔空

转部分处理结果为例,分词结果如表2所示。

表2部分文本数据分词结果

复式交分道岔空转故障部分文本数据分词结果

滑床板n缺油n尖轨n翘头n滑床板n磨损严重n尖轨和基本

轨n夹杂物n尖轨和基本轨n夹杂物n尖轨和基本轨n夹杂物n尖

轨和基本轨n夹杂物n尖轨和基本轨n夹杂物n尖轨和基本轨n夹

杂物n基本轨n夹杂物n尖轨与滑床板n夹杂物n基本轨n肥变大

n基本轨

3.2.1特征词提取

在NLPIR软件中进行特征词的提取,对其中“数字”

进行删减,同时对特征词中表达相同意思的特征词进行合

并,最后得到56个特征值,其结果如表3所示。

表3特征词提取结果

1234567

1工务操作螺丝原因螺栓故障电流改道

2基本轨移动生锈运动移位水平爬行

3滑床板作业搬动压力打磨摩擦电流尖轨

4缺油动作枕木天气折断尖端杆杂物

5轨距固定垫板启动结冰磨耗改轨距

6连接杆受阻接点

螺丝

松动

木头根部卡阻

7窜动摩擦空转肥边绝缘螺栓脱落磨损

8表示杆断裂销子轨撑道岔错位角钢

3.2.2特征词在文本数据中的分析结果

以筛选得到的特征词,作为一个特征矩阵,生成的文件

在NLPIR中被引用,对处理过的复式交分道岔的文本故障

数据进行分析,得到特征词,通过NLPIR软件进行分析处

理,在文本数据中所出现的频率和权重结果如图1所示。

图1频率和权重结果

3.2.3对特征词出现频率进行分析

可以看出,可能引起复式交分道岔空转的故障类型有滑

床板故障、基本轨故障、连接杆故障、表示杆故障、尖端杆

故障等。

空转的故障原因有工务原因、结冰、天气、缺油、移动

受阻等。在所有导致空转故障中,尖轨和基本轨所占比例较

大,故障致因中杂物所导致故障发生的概率最高。

(下转第

77

页)

.htsRerved.

ScienceandTechnology&Innovation┃科技与创新

2020年第02期

·77·

顺利进入吸球管,可将一块伸出板放置在吸球管的首端处,

配合吸球管拾取网球。设计伸出板时,需要考虑其与地面的

垂直高度:如果伸出板离地面过近,碰到地面不平等状况会

使其与地面发生碰撞,阻碍吸球装置顺畅工作;如果伸出板

离地面过远,改变了网球运动轨迹,会影响捡球效率。因此,

在设计伸出板时,其最前端离地面的距离设置为3mm。管

道结构如图2所示。

图2管道结构

3真空泵的选择

根据本设计所选用真空泵的流量范围,并考虑存在漏气

以及网球表面磨损的情况,取安全系数k=1.4,m=58g,D=

66mm,α=37°,Smax=150×80mm2。m=58g,g=9.8N/kg,

可计算出真空泵流量的合适范围约为20.16~29.53m3/min。

本设计选择无刷真空泵的具体参数如表1所示。

表1无刷真空泵技术参数表

电压/V负载电流/A功率/W流量/(m3/min)

24<1.4<33.628

4捡球小车的整体设计

自动拾取网球小车由以下几部分构成:车体装置、吸球

装置、图像采集装置、存储球装置、电机及其减速箱装置、

系统电路装置和发电装置等。

网球小车利用真空泵与吸球管的连接来实现网球自动

拾取球。当真空泵工作时,网球由于管内外压强差被吸入到

吸球管内,经过球出口时,在网球自身重量作用下,网球会

自动掉进储球腔。电机及其减速箱装置带动网球小车后轮,

通过系统的控制和前轮万向轮的配合,可实现机器人的前

进、左转和右转。自动捡网球小车等轴测视图如图3所示。

图3小车等轴测视图

5结论

设计了一款通过真空泵产生的吸力来实现捡球的机械

小车,该小车由视觉系统、电机装置、吸球装置和控制板组

成。捡球小车能够快速高效地独立完成寻找网球、移动和捡

球。这不仅提高了拾取网球的效率,同时也节省了不必要的

人力、物力,符合当下各领域产品智能化和自动化的需求。

参考文献:

1

]吕腾飞,陆丽,何炳林,等

.

智能网球捡球机的研制[

J

.

电子世界,

2013

12

):

68-69.

[2]安丹阳.新型自主式网球检球机器人的构形及关键技术

研究[

D

.

沈阳:东北大学,

2008.

3

]令宝

.

基于嵌入式技术自动捡乒乓球系统的开发设计[

J

.

自动化与仪器仪表,2016(5):118-119.

————————

作者简介:

贾远鹏(

1998

—),男,临沂大学本科生,研究

方向为智能汽车。

〔编辑:张思楠〕

(上接第75页)

4结论

本文以复式交分道岔空转故障为例,通过对文本数据进

行预处理,采用NLPIR软件对处理后的文本进行分词处理

并提取特征词,运用NLPIR软件对文本数据进行特征词分

析,得出特征词在文本数据中出现的频率和权重。虽然不能

对所有导致故障发生的原因和导致故障发生的部位进行预

测,但是可以为后续故障诊断和可靠性分析等后续研究方案

提供现实依据。

参考文献:

[1]张磊,王喆.基于铁路安全管理信息报告的文本挖掘技

术研究[J].铁路计算机应用,2018,27(8):9-12.

2

]杨连报,李平,薛蕊,等

.

基于不平衡文本数据挖掘的

铁路信号设备故障智能分类[J].铁道学报,2018,40

(2):59-66.

3

]赵阳,徐田华

.

基于文本挖掘的高铁信号系统车载设备

故障诊断[J].铁道学报,2015,37(8):53-59.

[4]梅馨,邢桂芬.文本挖掘技术综述[J].江苏大学学报(自

然科学版),

2003

5

):

72-76.

〔编辑:张思楠〕

.htsRerved.

本文发布于:2023-03-08 17:57:15,感谢您对本站的认可!

本文链接:https://www.wtabcd.cn/fanwen/zuowen/1678269436186030.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

本文word下载地址:xxx16.doc

本文 PDF 下载地址:xxx16.pdf

上一篇:每日晨语
下一篇:返回列表
标签:xxx16
相关文章
留言与评论(共有 0 条评论)
   
验证码:
推荐文章
排行榜
Copyright ©2019-2022 Comsenz Inc.Powered by © 站长QQ:55-9-10-26 专利检索|