Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >有组织的捅马蜂窝违法了吗

有组织的捅马蜂窝违法了吗

作者头像
猫哥学前班
发布于 2018-11-06 06:49:39
发布于 2018-11-06 06:49:39
1.2K00
代码可运行
举报
文章被收录于专栏:猫哥学前班猫哥学前班
运行总次数:0
代码可运行

今天的朋友圈被《我承认,我们是有组织攻击马蜂窝的》刷屏了。自媒体「小声比比」作者梓泉和「乎睿数据」的三名技术人员组成的「四人豪华犯罪团伙」,通过爬虫技术结合大数据分析,披露马蜂窝 2100 万条用户评论数据中的 1800 万条为造假数据,被马蜂窝以名誉权纠纷为由状告法院。

在我看来,以下几个要点可能会影响案件判罚结果:

  • 案件管辖权分配
  • 证据保全公证
  • 爬虫获取数据是否违法

一、案件管辖权

今年上半年今日头条和腾讯因为抖音被微信屏蔽事件,双方大战了 300 个来回,最终都向法院提起了诉讼。有意思的是,如果腾讯是原告,通常会向深圳市南山区人民法院起诉,而今日头条则会优先选择北京市海淀区人民法院。

这是为什么呢?(提示:可以从纳税人的角度思考)

当然是为了判罚的公正性嘛。

所以这个案子,很多人会建议深圳的「乎睿数据」团队向法院提请「管辖异议」,案件的管辖权应当由「北京市朝阳区人民法院」转给「深圳市南山区人民法院」。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
第十五条 侵害信息网络传播权民事纠纷案件由侵权行为地或者被告住所地人民法院管辖。侵权行为地包括实施被诉侵权行为的网络服务器、计算机终端等设备所在地。侵权行为地和被告住所地均难以确定或者在境外的,原告发现侵权内容的计算机终端等设备所在地可以视为侵权行为地。

——《最高人民法院关于审理侵害信息网络传播权民事纠纷案件适用法律若干问题的规定》,https://www.chinacourt.org/law/detail/2012/12/id/146033.shtml

二、证据保全公证

文章还提到,马蜂窝清理脏数据的效率十分迅猛,涉嫌造假的 1000 多万条数据分分钟就清完了(给马蜂窝未雨绸缪的技术架构点个赞)。

事实上,在互联网 big brother watching big data 时代,信息残留无处不在。以网站数据为例,不但云服务器上会留下各种 backup,各大搜索引擎也会 cache 数据,Web Archive 上甚至还能查到许多站点 10 年前的版本(例如 2005 年的支付宝首页)。

诉前证据保全公证工作(以及各种作品和数据的原创保护)甚至都不用去线下找公证处,通过在线的第三方服务就能完成,因为网上的数据流是有时间属性的。例如,你可以给自己的 QQ 邮箱发送一封带附件的邮件,用来证明这个附件里的内容你是全网首发,从而来保障自己的著作权。

中国科学院国家授时中心提供了一个在线的「联合信任时间戳服务」(http://www.tsa.cn),只需要 10 块钱,任意大小的数据包上传打个时间戳,就能完成法院认可的证据保全公证程序。

三、爬虫获取数据是否违法

前几年猫哥在外创业,团队里有个从快播来的技术大牛,那爬虫技术是相当优秀。

公司让他们用爬虫抓了不少 1024 小电影和未经授权的影视作品,后来在一次突击检查中,服务器被查获了,领导们也进了局子。

技术人员写爬虫程序,抓取第三方站点数据,是一项很常见的操作,但同时也是一个高危操作。

1. 不遵守 robots.txt 违反《反不正当竞争法》

robots.txt 爬虫协议是国际通用的商业惯例,任何站点可以通过 robots.txt 来引导爬虫,站点上哪些内容是开放的,哪些是禁止抓取的。

2012 年百度诉 360 违反 robots 协议案,以 360 败诉告终。

马蜂窝估计也考虑到这个问题了,今天下午 5 点 38 分 42 秒(Last-Modified: Tue, 23 Oct 2018 09:38:42 GMT)更新了站点的 robots.txt 协议,将原来未做限制的爬虫 UA 和目录进行了限制。

2. 抓取涉及用户隐私与商业机密的数据违反《网络安全法》

根据《网络安全法》与相关司法解释,爬虫如果抓到了涉及用户隐私与商业机密的内容必须予以删除,情节严重的要负刑事责任。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
(三)非法获取、出售或者提供行踪轨迹信息、通信内容、征信信息、财产信息五十条以上的;
(四)非法获取、出售或者提供住宿信息、通信记录、健康生理信息、交易信息等其他可能影响人身、财产安全的公民个人信息五百条以上的;
(五)非法获取、出售或者提供第三项、第四项规定以外的公民个人信息五千条以上的;

—— 《关于办理侵犯公民个人信息刑事案件适用法律若干问题的解释》第五条, http://www.spp.gov.cn/xwfbh/wsfbt/201705/t20170509_190088.shtml

3. 非法获取计算机信息系统数据罪

爬虫如果采用类似黑客暴力破解手段获取数据,或因此导致对方站点服务不可用,可能触犯「非法获取计算机信息系统数据罪」。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
第二百八十五条 违反国家规定,侵入国家事务、国防建设、尖端科学技术领域的计算机信息系统的,处三年以下有期徒刑或者拘役。
违反国家规定,侵入前款规定以外的计算机信息系统或者采用其他技术手段,获取该计算机信息系统中存储、处理或者传输的数据,或者对该计算机信息系统实施非法控制,情节严重的,处三年以下有期徒刑或者拘役,并处或者单处罚金;情节特别严重的,处三年以上七年以下有期徒刑,并处罚金。
提供专门用于侵入、非法控制计算机信息系统的程序、工具,或者明知他人实施侵入、非法控制计算机信息系统的违法犯罪行为而为其提供程序、工具,情节严重的,依照前款的规定处罚。{刑法修正案(七)增加第二款、第三款}

—— 中华人民共和国刑法(修订),http://www.spp.gov.cn/spp/fl/201802/t20180206_364975.shtml

所幸的是,以上三条爬虫红线,梓泉和乎睿团队都没有违反。不知马蜂窝大佬接下来将如何应对?

我相信,借助技术和法律的力量,小个体总有扳倒大集团的那一天。


身为技术人,我们一直以来关注的都是技术和能力,这既是我们安身立命的本钱,也是自身价值的体现。但专业技能不是生活的全部,真遇到一个与法律有关的烦心事,或许会让你无心上班甚至失去工作。

而事实上,法律是人人都要面对的话题。比如,访问外国网站有风险吗?期权被坑怎么办?用盗版图有什么后果?突然被 HR 叫进办公室说要辞退你,该怎么应对?办公室性骚扰,怎么对抗?发生交通事故,怎么处理?

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2018-10-23,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 猫哥学前班 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
网络爬虫法律条文或出台:你的程序合法吗?
2018年10月20日,一篇《独家|估值175亿的旅游独角兽,是一座僵尸和水军构成的鬼城?》的文章一出世便走红网络。文中称百亿体量的马蜂窝,其中2100万条“真实点评”中有1800万条是通过机器人从大众点评和携程等竞争对手抄袭而来。通过语义分析、数据挖掘,发现了7454个抄袭账号,平均每个账号抄袭搬运了数千条点评,合计抄袭572万条餐饮点评和1221万条酒店点评,占官网声称点评数85%。
IT阅读排行榜
2019/07/09
8.2K0
网络爬虫法律条文或出台:你的程序合法吗?
中国爬虫违法违规案例汇总!
最近在 GitHub 发现了一个爬虫库,这个库整理了所有中国大陆爬虫开发者涉诉与违规相关的新闻、资料与法律法规。
龙哥
2019/11/27
1.6K0
中国爬虫生存指南:违法违规案例汇总!
最近在 GitHub 发现了一个爬虫库,这个库整理了所有中国大陆爬虫开发者涉诉与违规相关的新闻、资料与法律法规。
良月柒
2019/12/02
2.3K0
《爬虫写得好,铁窗关到老》教你把握爬虫的法律边界!㊫
最近的IT公司违法案件越来越多,看了很多因为爬虫,数字货币,博彩网站外包等被抓的事情,给大家提个醒,打工注意不能违法,写代码背后也有法律风险。
不吃西红柿
2022/09/19
7180
【k哥爬虫普法】爬取数据是否一定构成不正当竞争?
谷米公司为开发和运营“酷米客”APP(提供实时公交查询服务),与公交公司达成合作,在公交车上安装定位器,以获取实时公交位置数据。谷米公司所收集的实时数据不仅被用于酷米客APP运营,还被提供给深圳市交委。深圳市交委基于信息化建设工作将该实时数据提供给深圳北斗应用技术研究院开展研究工作。经深圳市交委同意,深圳北斗应用技术研究院将深圳公交电子站牌数据测试接口开放给元光公司“车来了”(提供实时公交查询服务)APP应用。深圳公交电子站牌数据测试接口数据包含谷米公司所收集的公交车实时数据。但相比谷米直接从定位器上获取的实时数据,谷米提供给深圳市交委的数据存在一定的延迟。
K哥爬虫
2023/01/12
5590
【k哥爬虫普法】爬取数据是否一定构成不正当竞争?
爬虫入门到放弃04:爬虫=犯罪?对不起,我对钱没有兴趣!
我们身处大数据时代,数据趋于透明化、公开化,我们是否就可以拿着数据为所欲为?几年前很多人向往着"车厘子自由",同样在也有很多人也追求着技术自由。时至今日,我们可以在合法的范围内自由应用技术,那么对于爬虫的合法化,到底有哪些的法律可以来界定?
叫我阿柒啊
2021/06/10
7000
【K哥爬虫普法】淘宝一亿快递信息泄漏,有人正在盯着你的网购!
2014 年 5 月初,被告人翁秀豪发现淘宝店铺源码存在漏洞,利用该漏洞可以在店铺源码中植入一个 url,执行该 url 指向的 javascript,以获取访问被植入 url 的淘宝店铺的所有淘宝用户的 cookie(淘宝用户登录时产生的一组认证信息,利用 cookie 可以执行对应帐号权限内的所有操作,无需帐号、密码),并利用其中的卖家 cookie 将 url 再次植入卖家淘宝店铺源码,实现自动循环,获取更多的淘宝用户 cookie。
K哥爬虫
2023/07/21
4840
【K哥爬虫普法】淘宝一亿快递信息泄漏,有人正在盯着你的网购!
微软向华创证券索赔 842 万元,因后者使用其盗版软件:法院判赔 200 万元
上诉人(原审原告):微软公司 上诉人(原审被告):华创证券有限责任公司 微软公司上诉请求: 请求变更一审判决赔偿数额部分,支持上诉人的上诉请求;一、二审诉讼费由被上诉人承担。 事实和理由:一审判决确定的赔偿数额与判决已经认定的基本事实相矛盾,数额的确定缺乏事实及法律依据,且赔偿数额畸低,严重损害上诉人合法权益。 华创公司上诉请求: 请求撤销一审判决,改判驳回被上诉人诉讼请求,一、二审诉讼费由被上诉人承担。 事实和理由:1、上诉人有正当理由拒绝保全;2、上诉人购买的正版软件足以满足需要,无需过多使用微软公
云头条
2022/03/18
1.9K0
你的爬虫会送你进监狱吗?
随着大数据的火热,数据相关行业竞争不仅“蒸蒸日上”,爬虫之间的战争也越发地激烈。一篇《你的爬虫会送老板进监狱吗?》在程序猿圈子里被大量转载,甚至有的程序员因为非法获取数据的新闻从而放弃了这一行当。那么,爬虫是什么,它会是悬在程序员头上的达摩克利斯之剑吗?
崔庆才
2019/05/06
3.5K0
你的爬虫会送你进监狱吗?
网络爬虫的注意事项
我今天要说的是关于爬虫的合法性,我希望通过一些案例来探讨:怎样做一个不触碰红线的爬虫开发者。
IT阅读排行榜
2019/09/25
2.6K0
网络爬虫的注意事项
又一家数据公司被查,爬虫到底做错了什么?
以上是昨天技术圈传播的一则新闻,又一家数据公司被调查,很多数据从业者、爬虫开发者发出了“感叹” —— 「爬虫用得好,XX进得早;数据玩得溜,XX吃个够」。
Python数据科学
2019/09/10
1.2K1
又一家数据公司被查,爬虫到底做错了什么?
中国互联网不正当竞争案件发展实证分析(二)
张钦坤      腾讯互联网与社会研究院副秘书长 三、互联网不正当竞争案件的特征    纵观126件互联网不正当竞争案件,从侵权行为本身到侵权结果,再到案件审理都反映出一些典型特征,主要包括以
腾讯研究院
2018/03/09
1.6K0
中国互联网不正当竞争案件发展实证分析(二)
马蜂窝被捅之后
知名旅行社区马蜂窝周末被“小声比比”揭露存在点评数据造假行为后,在周一进行了回应。第一轮回应不可谓不强势,其称“言论歪曲事实,为有组织攻击行为”。马蜂窝起诉乎睿数据和“小声比比”负责人丁子奎名誉侵权,也已被立案。
罗超频道
2018/11/23
5820
互联网行业法律动态报告(2015年2月)
腾讯研究院法律研究中心 重点内容: 【网络治理】民诉法司法解释出台,明确聊天记录等可作为民事案件证据,电子证据的合法性得以确定;“快播案”历时一年多,CEO王欣等4人因涉嫌传播淫秽物品牟利罪被海淀区人民检察院提起公诉;争议多年的“网络中立”问题迎来历史性投票,宽带互联网被重新分类,付费优先、减慢特定内容网速、ISP自行屏蔽等被明确拒绝。 【知识产权】最高院就审查知识产权与竞争行为保全案件司法解释公开征求意见,针对已经具有一定司法经验的知识产权领域进行尝试,同时将司法解释扩展至竞争法领域;国家
腾讯研究院
2018/02/02
1K0
2014度互联网法律资讯年报
2014度互联网法律资讯年报 田小军 腾讯研究院研究员 一、网络治理   我国倡导“多边、民主、透明”的全球互联网治理共识   9月10日,2014年夏季达沃斯论坛中,国信办主任鲁炜提出“多边、民主、透明”的全球互联网治理共识。   10月15日,美国政府重申对互联网管理的立场,称现阶段多方共同管理是最佳的方式,不允许任何人控制互联网,交由全球利益相关方。10月22日,icann宣布,准备明年底脱离美国政府的监管,明年向美国商务部递交一份可以满足条件的提案,如果美国对方案不满,会临时短期延长合同,以
腾讯研究院
2018/03/09
1.3K0
【k哥爬虫普法】爬虫第一案,侵犯个人隐私,“入侵”短视频服务器!
江苏省无锡市梁溪区人民法院审结了一起提供侵入计算机信息系统程序罪案件,也就是网上传遍的“首例短视频平台领域网络爬虫案”,案情原文(源自最高人民法院):https://mp.weixin.qq.com/s/P8j_XEiqoEkcerV-tpiIVQ
K哥爬虫
2023/01/12
5630
国内知识产权保护的适应性调整与破冰
此部分节选《中国互联网法律政策报告(2014)》,由“腾讯研究院法律研究中心、中国信息通信研究院互联网法律研究中心“联合推出     执笔人:司晓、张钦坤、李海英、田小军、刘娜   1.《信息网络传播权保护条例》修改 加大侵权处罚力度       由于在著作权侵权判定中赔偿数额的确定一直是一个较大的难题。很多侵权诉讼中,权利人所获得的赔偿额小到根本不足以威慑侵权人以制止其再度侵权,例如在侵犯音乐作品的信息网络传播权中,单首歌曲的赔偿额一般只有几百元。这对于侵权人来说,违法成本很低。为了解决司法领域的这一困境
腾讯研究院
2018/03/07
8380
6 人被判:抢挂号、犯非法控制计算机信息系统罪
被告人:刘某某,男,1979年出生;孙某某,男,1993年出生;刘某2,男,1990年出生;刘某3,男,1981年出生;刘某4,男,1990年出生;于某某,男,1967年出生。 法院查明事实 2019 年至 2021年间,刘某某为提高挂号率,要求孙某某为其制作空军总医院APP、肿瘤医院挂号平台、“114”挂号平台等软件,后利用上述软件长期大量抢占中国医学科学院肿瘤医院等医院的挂号资源并有偿向他人提供,违法所得至少人民币 39万余元。 孙某某负责制作上述软件并对其进行不定期维护,违法所得 9万余元。 刘某4
云头条
2022/06/29
5530
6 人被判:抢挂号、犯非法控制计算机信息系统罪
最高人民法院:关于审理使用人脸识别技术处理个人信息相关民事案件适用法律若干问题的规定
最高人民法院 关于审理使用人脸识别技术处理个人信息 相关民事案件适用法律若干问题的规定 法释〔2021〕15号 (2021年6月8日最高人民法院审判委员会 第1841次会议通过,自2021年8月1日起施行) 为正确审理使用人脸识别技术处理个人信息相关民事案件,保护当事人合法权益,促进数字经济健康发展,根据《中华人民共和国民法典》《中华人民共和国网络安全法》《中华人民共和国消费者权益保护法》《中华人民共和国电子商务法》《中华人民共和国民事诉讼法》等法律的规定,结合审判实践,制定本规定。 第一条  因信息处理
云头条
2022/03/18
4480
编写“爬虫”软件抢票,可模拟用户下单、可识别和输入验证码、可绕过人机识别验证机制,获利 12 万元:陈某被判
2017年至2019年间,陈某为牟取非法利益,在广州市南沙区编写“爬虫”软件用于在浙江淘宝网络有限公司旗下的“大麦网”平台上抢票,并以人民币1888元到6888元不等的价格向他人出售该软件,非法获利人民币12万余元。2019年7月11日,陈某被公安机关抓获。 经鉴定,上述“爬虫”软件具有以非常规的方式构造和发送网络请求,模拟用户在大麦网平台手动下单和购买商品的功能;具有以非常规手段模拟用户识别和输入图形验证码的功能,该功能可绕过大麦网平台的人机识别验证机制,以非常规方式访问大麦网平台的资源。 陈某归案后如
云头条
2022/03/18
1.4K0
推荐阅读
相关推荐
网络爬虫法律条文或出台:你的程序合法吗?
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验