网络爬虫恶意爬取行为的法律分析

更新时间:2024-11-08 15:24:37 阅读: 评论:0


2022年8月10日发
(作者:商标申请代理)

李美香,等:网络爬虫恶意爬取行为的法律分析科教论坛

网络爬虫恶意爬取行为的法律分析

李美香,王德亮

(山东理工大学,山东 淄博 255049)

[摘要]近年来发生的多起运用网络爬虫技术恶意爬取网络数据的案件,这些案件涉及公民个人信息保护、网络数据

权属界定等诸多法律问题,引发了网络从业人员和法律人士的广泛关注。善意爬虫会促进网络数据的有效流通和运用,

进而促进互联网产业的健康快速发展。恶意爬虫则会影响被爬取方网站的正常运行,攫取被爬取网站的重要数据,甚至

构成刑事犯罪。网络从业人员必须遵守相关法律规定、按照机器人协议的要求合法合理地进行公开数据爬取,防范爬虫

行为可能带来的法律风险。

[关键词]网络爬虫;数据爬取;恶意爬虫;机器人协议;法律风险

[中图分类号]F626.5    [文献标识码]A

大数据时代,数据是最有价值的财富。谁能掌握海量数据,

谁就能在激烈的互联网竞争中取得先机。而获取数据主要有两

种方式,一是通过吸引用户注册,原始取得注册用户的个人数

据。这需要企业投入大量前期费用,甚至是用烧钱的方式吸引

用户。二是运用网络爬虫技术对他人已有的数据进行爬取,完

成数据的积累和分析应用。然而,采用第二种方式获取数据却

可能面临诸多法律风险,轻则侵犯公民个人信息和企业核心数

据,构成民事侵权,重则构成刑事犯罪。对网络爬虫恶意爬取

行为进行法律分析,指出其存在的法律风险,并有针对性提出

防范措施,确属必要。

见报端。以中国铁路客户服务中心的12306网站为例。自2011

年上线运营以来,12306网站不断遭受爬虫(主要是抢票软件)

攻击,在春运期间多次出现无法访问情况。为阻止网络爬虫的

攻击,2015年,12306网站一度设置复杂的图片验证码,被用

户吐槽为“史上最坑图片验证码”。据统计,2018年春运期间,

12306网站“最高峰时1天内页面浏览量达813.4亿次,1小时

最高点击量59.3亿次,平均每秒164.8万次。”。这813.4亿

次浏览量超过90%是网络爬虫所为。

2018年腾讯云云鼎实验室发布针对互联网恶意爬虫的调查

报告,对互联网恶意爬虫的目标行业分布进行了分析。其中,

出行类恶意爬虫流量居首位,社交、电商位列第二和第三。前

三名占恶意爬虫流量的52.65%。对上述恶意爬虫目标行业进

行分析可知,恶意爬虫主要爬取与用户出行、生活、商业活动

等密切相关的网站和手机APP。

网络爬虫恶意攻击网络系统的行为,会大量占用网络带宽,

造成网络拥堵,使服务器无法处理用户正常访问请求,甚至导

致死机。随着大数据产业的发展,网络爬虫尤其是恶意网络爬

虫愈加猖狂。《2019年上半年我国互联网网络安全态势》显示,

2019年上半年,计算机恶意程序传播次数日均达约998万次。

MongoDB和Elasticsearch数据库相继暴露严重安全漏洞,均可

以在无须验证的情况下通过默认端口本地或远程访问数据库并

进行任意的增、删、改、等操作。针对我国重要网站的CC攻

击事件高发,来自的DDos攻击也日渐频繁。

网络爬虫的恶意攻击行为也对我国的法律体系提出了挑

战。《网络安全法》第21条第1、2、3项要求网络运营者采

取技术措施防范网络攻击行为和网络侵入行为,第25条规定

网络运营者应当制定应急预案,及时处理网络安全风险。第59

条规定了相应的法律责任。但该法并没有对网络爬虫爬取行为

的方式、频率、法律责任作出规定,这可以说是立法上的一大

缺憾。2019年5月28日,《数据安全管理办法(征求意见稿)》

发布,首次对网络爬虫爬取行为作出了限定。第16条规定,

1 问题的提出

网络爬虫(webcrawler),也称网络机器人或网络蜘蛛,

是通过模拟人(网络用户)的行为自动、高效地浏览互联网并

抓取所需数据的计算机程序。技术中立,但使用技术的人的行

为却有善与恶、合法与违法之分。根据爬取行为的道德与法律

评价的不同,网络爬虫也有善恶之分。善意爬虫也称合法爬虫,

指在遵守网站的机器人协议()前提下,对网页或网

络公开接口进行爬取,其爬取行为不会影响网站的正常运行,

对网站数据的爬取也不会侵犯网站用户的个人信息和网站的重

要数据资源。善意爬虫对相关网站的爬取不仅不会招致反对,

反而因为增加了相关网站的流量而备受欢迎。例如百度、谷歌

等大型搜索引擎运用的通用网络爬虫,会定时对全网进行搜索,

向用户提供相应网页信息。恶意爬虫会突破网站机器人协议的

禁止爬取要求(规定在文件的Disallow部分),爬取

网站的核心数据资源,并可能极大地损耗被爬取网站服务器的

性能。本文针对恶意爬虫恶意爬取行为涉及到的法律问题,从

恶意攻击网络系统和恶意爬取数据两方面展开论述。

2网络爬虫恶意攻击行为的法律分析

近年来,关于网络爬虫恶意攻击网络系统的事件和案件屡

[收稿日期]2020-01-17

[作者简介]李美香(1977—),女,山东青岛人,山东理工大学法学院讲师,硕士,研究方向:网络法;王德亮(1979—),男,山东泰安人,山东理工大学计

      算机科学与技术学院讲师,硕士,研究方向:大数据。

-391-


本文发布于:2022-08-10 06:55:04,感谢您对本站的认可!

本文链接:http://www.wtabcd.cn/falv/fa/78/67221.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:法律论坛
留言与评论(共有 0 条评论)
   
验证码:
推荐文章
排行榜
Copyright ©2019-2022 Comsenz Inc.Powered by © 站长QQ:55-9-10-26