肖飒:爬虫哭吧不是罪

2019年10月21日13:40    作者:肖飒  

  文/新浪财经意见领袖专栏作家 肖飒

  鉴别爬虫获取数据的行为是否合法,关键看robot协议等。

  昨日查看文献,发现一篇某直辖市法官撰写的关于“使用网络爬虫获取数据行为”的刑事认定问题,结合近期身边法律人常常探讨爬虫与刑法规制之间的种种实务问题。飒姐有不同的观点,与诸位同行老友商榷。

  文章脉络:

  1. 问题提出:鉴别爬虫获取数据的行为是否合法,关键看robot协议等;

  2. 具体分析:网页不等于数据;编排著作权不等于著作权本身;

  3. 价值选择:法律体系的统一性与刑法的谦抑性。

  1 

  判断行为合法性,robot协议不可或缺

  我们以某直辖市某区判决的“晟品公司”与“字节XX公司”之间的一场刑事官司为例,被告人张某、宋某、侯某共谋用技术手段(爬虫)在“字节XX公司”网站抓取视频,放入自己所在公司网站上,造成被害公司人民币2万元的经济损失。2017年9月提起公诉,后三人被判非法获取计算机信息系统数据罪,各自领刑。

  这让我想起,大数据行业如今噤若寒蝉,一位从业人员说:公民个人信息我们不敢爬了;但大家公开在网上的信息都不能收集吗?动辄抓人判刑,好怕怕。

  我们先来看一下,某区的案例,被告人都干了啥?三名被告人利用爬虫技术到被害公司的网站抓取视频信息,请注意这些视频多为著作权人向社会自愿公开的视听资料,被告人将这些视频从被害单位网站爬取到了自己公司的服务器。

  这里涉及一个万维网的通识(共识),那就是网络参与者(编程人员)、经营者为了共同维护互联网的信息流通等,会达成一个robot协议,这个协议是1994年6月30日通过长期磋商和妥协,互联网搜索引擎与网页持有者之间达成的“行业规范”(可理解为行规、习惯),在该协议中即告知社会自己网站的“访问政策”“访问权限”,如果设置了robot协议,缩小了访问权限,行为人突破访问权限,违背被害公司的意志,那么,其主观恶性明显。

  可惜,本案恰恰不同,根据该法官披露的案情,公安机关、检察院并未收集到被害公司设置“爬取权限”的robot协议及其权限范围,这有悖常识。

  互联网行业里谷歌、百度、搜狗、ebay等,均设有该协议,而且robot协议已经25年了,在二十多年的互联网发展历程中,这几乎是每一个互联网人都知道的常识,如果你不想被爬取信息,只需要很轻松地安放robot协议表明:我不愿意被爬取和收录,就可以了。

  而本案,深谙互联网之道的字节XX公司竟然没有设置或者没有提供相应证据给公安机关,疑点重重。(我们不愿意揣测某些互联网企业为了迅速扩大影响力,有意争取被搜索和被爬取的机会,以便在浩如烟海的互联网世界博取机会)

  2 

  网页不等于数据;编排著作权不等于著作权本身

  我们注意到,爬虫爬取的是网页,网页是否等于数据,飒姐询问了IT博士,其回答是:爬取了网页可能知道一些计算机信息,但很有限。

  本案中,爬取的是网页,其背后计算机编程、如何嵌入网站等数据信息,被告人似乎并不在意也不必非法获取,因为他们想要的是“树上的桃子”而不是桃子与树枝连接处的支撑杆与技术。

  从现有案情分析,三位被告人是技术人员出身,他们具有将桃子嫁接到自家网站的能力和技术,网页背后的数据不是他们的犯罪对象,他们只想要网页上的视频。

  同时,我们要清醒地知悉,写一本书和组织编排一套书的书目,不可同日而语

  视频是作者的视频,不是被收集网站的视频。网站确实可以按照自己的规划,以搞笑、知识、故事、伦理等标签对视频进行组织编排(放在某一频道之下),但组织编排的“创造性”显然低于视频创作本身。

  我们承认网站在频道设计和视频编排上花了心思,但这种心思我们用《反不正当竞争法》《著作权法》《侵权法》足以保护,不必非要为了2万块钱,送了三位年轻人的人生前程。

  3 

  法律体系与刑法谦抑性

  我们先补一点内容,本案中支持犯罪成立的观点是:被害单位设置了用户身份认证机制,即是一种“反对爬取的”安全保护措施。

  我反对这一点。这是两个层面的问题,不在一个话语体系内,本案关键是被害网站到底有没有明示自己不愿意被爬取的意愿,跟它是不是个会员制的网站关联性不大(况且不是会员也能看到很多免费视频,只不过付费后看到的视频更多,画面品质更高)。

  法律体系是一个复杂精巧的系统,部门法之间的作用分工明确。刑法作为保障法,应当在社会生活(尤其时市场化竞争的领域)保持谦抑。

  本案完全可以通过其他法律进行救济,而且完全可以“回复”被害公司的经济损失(更何况本案核心证据缺失,关键事实无法查明,疑点优势应当归于被告人,这是个可以判无罪的案子啊),现实结果却是三位被告人均被判非法获取计算机信息系统数据罪成立,扼腕痛惜。

  反观《刑法》第二百八十五条非法获取计算机信息系统数据、非法控制计算机信息系统罪,这个罪名保护的法益是“社会公共秩序”,而不是某家市场主体的商业利益。

  从体系解释的角度,我们查看该罪名的前后数个罪名,如第二百八十四条组织考试作弊罪、第二百八十六条破坏计算机信息系统罪,其保护的法益都具有“社会法益”(保护公共利益)的性质,所以,我们认为对于非法获取计算机信息系统数据罪的法律适用,同样要本着保护“社会法益”的态度去解释和适用,不宜插手市场主体之间的竞争甚至不正当竞争等问题。

  如果凡事都由刑法出面,还要民商法和行政法作甚?!置监管部门于何地位?我们不反对近年来的思潮,刑法有独立的价值,可以与其他部门法对同一行为进行评价,但是,我们必须反对“法律工具化”,反对刑法重锤成为解决民事纠纷、行政监管缺位的首位选择。

  (本文作者介绍:北京大成律师事务所执业律师,兼任北京市网贷协会法律顾问,主要从事互联网金融法律工作。)

责任编辑:陈鑫

  新浪财经意见领袖专栏文章均为作者个人观点,不代表新浪财经的立场和观点。

  欢迎关注官方微信“意见领袖”,阅读更多精彩文章。点击微信界面右上角的+号,选择“添加朋友”,输入意见领袖的微信号“kopleader”即可,也可以扫描下方二维码添加关注。意见领袖将为您提供财经专业领域的专业分析。

意见领袖官方微信
文章关键词: 爬虫 数据 robot
分享到:
保存  |  打印  |  关闭
网络文学盗版一年损失近60亿 侵权模式“花样百出” 香港诊所被曝给内地客人打水货疫苗 给香港人用正品 铁路部门下发买短补长临时办法:执意越站加收50%票款 优速快递董事长夫妻双双身亡 生前疑似曾发生争执 澳大利亚房价暴跌:比金融危机时还惨 炒房团遭赶走 五一旅游前10大客源城市:上海北京成都广州重庆靠前 五一假期国内旅游接待1.95亿人次 旅游收入1176.7亿 华为正与高通谈判专利和解 或将每年付5亿美元专利费 游客在同程艺龙订酒店因客满无法入住 平台:承担全责 花650万美元进斯坦福当事人母亲发声:被录取后捐的款