微博的高校舆情监控系统设计
文展;庞建;刘捷;张力
【摘要】随着自媒体快速发展,网络舆论的负面影响日益凸显.文章以网络舆论敏感
词为切入点,以高校学生为目标研究人群,针对其微博数据,提出高校舆情监控系统设
计方案,通过自动爬取目标人群的原创微博内容,存储到本地数据库,并采用敏感词匹
配的方式对微博内容进行判断.若出现敏感词则触发告警,通知高校网警等工作人员,
从而实现高校网络舆情监控.
【期刊名称】《无线互联科技》
【年(卷),期】2018(015)001
【总页数】2页(P65-66)
【关键词】网络舆情;微博;爬虫;监控
【作者】文展;庞建;刘捷;张力
【作者单位】成都信息工程大学通信工程学院,四川成都610225;成都信息工程大
学通信工程学院,四川成都610225;中国民航西南空管局,四川成都610202;成都
信息工程大学通信工程学院,四川成都610225
【正文语种】中文
校园网络舆论是当前影响大学生思想和行为的新兴力量,相比其他舆情监控,校园
舆情监控有其特殊性,它的主体是参与意识强、好奇心理重的在校学生,导致网络
舆论的聚焦和传播迅速[1-2]。个别学生因为学业压力和心理原因,对社会事件的
看法趋于偏激,产生不当行为。因此,学校有责任对倾向性、突发性、群发性的网
络舆论及时进行疏导,有效化解偏激舆论,引导正确舆论。微博相比微信更加开放,
成为网络舆论的主要集散地,也成为校园情绪宣泄的重要平台。虽然微博对于敏感
言论可以实行举报,但长期以来发现,由于微博用户数量巨大,举报审核需人工进
行,此项功能常常不管用。这就需要自动化网络舆情监控,对于敏感言论进行管理,
达到净化网络空间的目的[3]。
1系统设计思路
针对校园舆情监控,首先获取1000名成都某大学学生志愿者的微博账号,使用
Python编写微博爬虫程序,并通过关键词(ID,用户名)模拟搜索,爬取相应的
用户信息和微博内容,存入MySQL数据库,然后对数据进行处理,将含敏感词的
微博内容过滤出来,列出其对应的微博账号,触发告警程序,以邮件形式通知高校
网警等工作人员,从而实现对校园网络的舆情监控。
1.1敏感词库创建
系统敏感词库是专门针对高校舆情本身的特征所建立的,大学生作为高校的主体,
校园内与学习生活息息相关的一切事务都是其关注的焦点。另一方面,大学生作为
思想觉悟较高和爱国热情强烈的社会群体,对社会各种焦点热点问题和国内外的重
大事件也有极大的兴趣和关注度,对信息的关注自然会引发情绪、意愿、态度和意
见的产生,进而会产生相关舆情的主题。通过查阅相关的文献资料和对近年来各大
高校产生的重大事件进行梳理,并结合其相关的网络舆情信息,来建立敏感词库。
文献把高校舆论产生的主题类归结为时事政治类、高校内部管理类、高校安全类、
大学生权益类、高校声誉类和大学生心理健康类。系统的敏感词也是围绕着这些主
题类筛选的,具体明细如表1所示,并且系统提供对敏感词的管理模块,可以根
据当前形势实时地更新敏感词库[4]。
表1网络舆情监控的敏感词列表主题敏感词时事政治类钓鱼岛、西藏问题、新疆
问题、中印边境、恐袭高校内部管理类收费、课改、裸考、潜规则、补课、重修
高校安全类中毒、疾病、着火、爆炸、枪击、投毒大学生权益类后勤、网络故障、
宿管、留级、伙食、医疗高校声誉类学术不端、贪污腐败、贿赂、抄袭、作弊、
替考大学生心理健康类抑郁、自杀、报复、跳楼、出走、猥亵、上吊、割腕
1.2网络舆情监控流程
网络舆情监控是指整合互联网信息采集技术及信息智能处理技术,通过对互联网海
量信息自动抓取、自动分类聚类、主题检测、专题聚焦,实现用户的网络舆情监控
和新闻专题追踪等信息需求,形成简报、报告、图表等分析结果,为客户全面掌握
群众思想动态,做出正确舆论引导,提供分析依据。
本文提出了一个简单易行的网络舆情监控方案,首先获取监控对象的数据,存入数
据库,然后通过敏感词判断,找出包含敏感词的内容和相应帐号,进行报警,其流
程如图1所示。
其中,获取目标网站数据,指确定所要监控的目标网站,本文以微博作为监控对象,
使用爬虫程序不间断获取前面所选取的1000名大学生志愿者的微博内容;数据
存储,指将爬虫获取的微博数据存入MySQL数据库,供分析使用;敏感词判断,
指根据前面所选择的敏感词,对获取的微博数据进行分析对比,一旦发现敏感词,
触发告警程序,将相应的微博账号和敏感微博内容通过邮件通知高校网警,网警将
重点关注该报警名单上的微博账号,实现对高校网络舆情的监控。
2测试结果
舆情监控测试表明,基于该方案编程的程序能实现目标帐号的微博内容获取,并存
入数据库,通过对网络舆情敏感词汇表的判断,实现敏感内容和帐号的报警,并形
成舆情监控报告,发送至高校网警邮箱,网警对其进行密切关注。其中舆情监控报
告包含ID、用户名、微博内容等多个微博账号数据,如表2所示(为保护隐私,
省略了部分ID和用户名信息)。
图1网络舆情监控方案
表2网络舆情监控报告编号微博ID用户名微博内容13198XXX394拒绝挂科的
XXX初二的时候自杀过,当时数学考了70多,没办法回去面对家长,用文具盒里
的小刀割腕……现在过去9年了,觉得挺搞笑的,不该如此脆弱……但是半个月前
我大学刚补考完打电话给老师,被老师挂电话了,然后挺绝望的,觉得对不住爸妈,
要推迟一年毕业了21001XXX103眼睛XXX说谎有些东西答应要明天交,,,
因为技术太烂,你会选择作弊吗(作弊都弄了那么久,我想选择!你天生就
是熬夜的料)32951XXX462郭XX子不要再抑郁下去了,你要像一个神经病一
样活泼开朗
因为篇幅原因,只取了测试结果的前3条。从微博内容可以看出,均含有敏感词
汇。通过对微博帐号的关注,可以及时发现高校学生存在的问题,从而避免一些极
端事件的发生。
3结语
据中国互联网络信息中心(CNNIC)统计显示,截至2016年12月,中国网民规
模达7.31亿,其中大学生群体占到很大的比例。这部分人群通过互联网的社交网
络、微博、即时通信,对各个热点问题表达自己的思想和态度,形成高校网络舆情
信息。但由于校园网络没有时间、空间的限制,是一个比较自由开放的公共平台,
校园发生的一些热点问题、突发事件都会以最快的速度在校园网传播。而大学生由
于自身年龄、知识、价值观的限制,言论上会有一定的从众、倾向性,若是形成负
面的网络舆论信息,会给高校的校园安全造成损害。
本文提出的高校网络舆情监控方案,可适用于微博、微信、博客、论坛等各种社交
网络,通过舆情监控报告,为掌握高校大学生的思想动态提供依据,并进行积极引
导和干预。
[参考文献]
[1]蒋研川,肖铁岩,凌晓明.新媒体环境下高校校园网络舆论的现状及引导策略研
究[J].重庆大学学报(社会科学版),2012(1):136-142.
[2]凌日飞,代武社,曾丽萍.新媒体时代大学生网络舆情监控与引导机制研究[J].广
西教育学院学报,2014(4):143-146.
[3]宋思梅,左慧慧.微博中的“权威”与“人气”:以社会网络分析为方法[J].图书
情报知识,2012(3):43-46.
[4]邓焕根.网络爬虫在舆情监控中的应用研究[J].广东科技,2014(6):155-156.
本文发布于:2022-11-27 05:40:39,感谢您对本站的认可!
本文链接:http://www.wtabcd.cn/fanwen/fan/90/29084.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |