李美香,等:网络爬虫恶意爬取行为的法律分析科教论坛
网络爬虫恶意爬取行为的法律分析
李美香,王德亮
(山东理工大学,山东 淄博 255049)
[摘要]近年来发生的多起运用网络爬虫技术恶意爬取网络数据的案件,这些案件涉及公民个人信息保护、网络数据
权属界定等诸多法律问题,引发了网络从业人员和法律人士的广泛关注。善意爬虫会促进网络数据的有效流通和运用,
进而促进互联网产业的健康快速发展。恶意爬虫则会影响被爬取方网站的正常运行,攫取被爬取网站的重要数据,甚至
构成刑事犯罪。网络从业人员必须遵守相关法律规定、按照机器人协议的要求合法合理地进行公开数据爬取,防范爬虫
行为可能带来的法律风险。
[关键词]网络爬虫;数据爬取;恶意爬虫;机器人协议;法律风险
[中图分类号]F626.5 [文献标识码]A
大数据时代,数据是最有价值的财富。谁能掌握海量数据,
谁就能在激烈的互联网竞争中取得先机。而获取数据主要有两
种方式,一是通过吸引用户注册,原始取得注册用户的个人数
据。这需要企业投入大量前期费用,甚至是用烧钱的方式吸引
用户。二是运用网络爬虫技术对他人已有的数据进行爬取,完
成数据的积累和分析应用。然而,采用第二种方式获取数据却
可能面临诸多法律风险,轻则侵犯公民个人信息和企业核心数
据,构成民事侵权,重则构成刑事犯罪。对网络爬虫恶意爬取
行为进行法律分析,指出其存在的法律风险,并有针对性提出
防范措施,确属必要。
见报端。以中国铁路客户服务中心的12306网站为例。自2011
年上线运营以来,12306网站不断遭受爬虫(主要是抢票软件)
攻击,在春运期间多次出现无法访问情况。为阻止网络爬虫的
攻击,2015年,12306网站一度设置复杂的图片验证码,被用
户吐槽为“史上最坑图片验证码”。据统计,2018年春运期间,
12306网站“最高峰时1天内页面浏览量达813.4亿次,1小时
最高点击量59.3亿次,平均每秒164.8万次。”。这813.4亿
次浏览量超过90%是网络爬虫所为。
2018年腾讯云云鼎实验室发布针对互联网恶意爬虫的调查
报告,对互联网恶意爬虫的目标行业分布进行了分析。其中,
出行类恶意爬虫流量居首位,社交、电商位列第二和第三。前
三名占恶意爬虫流量的52.65%。对上述恶意爬虫目标行业进
行分析可知,恶意爬虫主要爬取与用户出行、生活、商业活动
等密切相关的网站和手机APP。
网络爬虫恶意攻击网络系统的行为,会大量占用网络带宽,
造成网络拥堵,使服务器无法处理用户正常访问请求,甚至导
致死机。随着大数据产业的发展,网络爬虫尤其是恶意网络爬
虫愈加猖狂。《2019年上半年我国互联网网络安全态势》显示,
2019年上半年,计算机恶意程序传播次数日均达约998万次。
MongoDB和Elasticsearch数据库相继暴露严重安全漏洞,均可
以在无须验证的情况下通过默认端口本地或远程访问数据库并
进行任意的增、删、改、等操作。针对我国重要网站的CC攻
击事件高发,来自的DDos攻击也日渐频繁。
网络爬虫的恶意攻击行为也对我国的法律体系提出了挑
战。《网络安全法》第21条第1、2、3项要求网络运营者采
取技术措施防范网络攻击行为和网络侵入行为,第25条规定
网络运营者应当制定应急预案,及时处理网络安全风险。第59
条规定了相应的法律责任。但该法并没有对网络爬虫爬取行为
的方式、频率、法律责任作出规定,这可以说是立法上的一大
缺憾。2019年5月28日,《数据安全管理办法(征求意见稿)》
发布,首次对网络爬虫爬取行为作出了限定。第16条规定,
1 问题的提出
网络爬虫(webcrawler),也称网络机器人或网络蜘蛛,
是通过模拟人(网络用户)的行为自动、高效地浏览互联网并
抓取所需数据的计算机程序。技术中立,但使用技术的人的行
为却有善与恶、合法与违法之分。根据爬取行为的道德与法律
评价的不同,网络爬虫也有善恶之分。善意爬虫也称合法爬虫,
指在遵守网站的机器人协议()前提下,对网页或网
络公开接口进行爬取,其爬取行为不会影响网站的正常运行,
对网站数据的爬取也不会侵犯网站用户的个人信息和网站的重
要数据资源。善意爬虫对相关网站的爬取不仅不会招致反对,
反而因为增加了相关网站的流量而备受欢迎。例如百度、谷歌
等大型搜索引擎运用的通用网络爬虫,会定时对全网进行搜索,
向用户提供相应网页信息。恶意爬虫会突破网站机器人协议的
禁止爬取要求(规定在文件的Disallow部分),爬取
网站的核心数据资源,并可能极大地损耗被爬取网站服务器的
性能。本文针对恶意爬虫恶意爬取行为涉及到的法律问题,从
恶意攻击网络系统和恶意爬取数据两方面展开论述。
2网络爬虫恶意攻击行为的法律分析
近年来,关于网络爬虫恶意攻击网络系统的事件和案件屡
[收稿日期]2020-01-17
[作者简介]李美香(1977—),女,山东青岛人,山东理工大学法学院讲师,硕士,研究方向:网络法;王德亮(1979—),男,山东泰安人,山东理工大学计
算机科学与技术学院讲师,硕士,研究方向:大数据。
-391-
本文发布于:2022-08-10 06:55:04,感谢您对本站的认可!
本文链接:http://www.wtabcd.cn/falv/fa/78/67221.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |