网上流传的一份银行发的函件显示,“通过我行技术监控发现,贵司通过爬虫程序对我行信息进行抓取,但我行未与贵司签署相关书面的授权书、同意书或默认贵司从我行系统及业务办理过程中获取用户个人的信息。”[详情]
最近被爬虫和大数据严打闹得人心惶惶的互金行业再遭棒击。[详情]
鉴别爬虫获取数据的行为是否合法,关键看robot协议等。[详情]
中国警察网11月22日消息,近日,河北省邯郸市公安局网安部门在“净网2019”专项行动中,多警种联合,成功破获一起部督特大侵犯公民个人信息案件[详情]
相关新闻: 拉卡拉征信被查处 非法提供身份证返照查询近亿次 拉卡拉旗下考拉征信被查:非法行为致公民信息泄露 原标题:拉卡拉旗下考拉征信涉嫌黑产被查,蓝色光标等多家上市公司均参股 据启信宝数据显示,考拉征信最大股东为A股上市公司拉卡拉支付股份有限公司,持股比例为32.40%。此外,A股上市公司拓尔思、旋极信息、蓝色光标均持股10.80%,A股上市公司广联达持股3.00%。而拉卡拉支付股份有限公司最大股东为联想控股股份有限公司,持股比例为28.24%。 11月20日,据央视网报道,近日江苏淮安警方依法打击了7家涉嫌侵犯公民个人信息犯罪的公司,涉嫌非法缓存公民个人信息1亿多条,其中,拉卡拉支付旗下的考拉征信涉嫌非法提供身份证返照查询9800多万次,获利3800万元。警方已将考拉征信服务有限公司及北京黑格公司的法定代表人、董事长、销售、技术等20余名涉案人员抓获。 本次行动中,据警方发现,广州诺涵信息科技有限公司(下称:诺涵科技)将公民个人信息被称为“流量”,公司自己开发有乐花管家等多个小贷平台,在自身购买公民个人信息用于推销贷款,软暴力催收的同时也和其他公司相互交换公民个人信息,还开发有爬虫云等软件,通过技术手段扒取其他小贷公司的公民个人信息,用于公司放贷和非法出售牟利。 据警方调查发现,诺涵科技的公民个人信息,主要来自湖南九象信息有限公司(下称:九象公司)。这家公司开发有一个黑爬虫网站,通过爬虫软件非法获取数10家小贷公司的公民贷款和逾期数据,然后公开提供收费查询,并提供“身份核验返照”业务,任何人只要在该网站输入公民姓名和身份证号码,就可以查询获取公民身份证相片。 锁定相关犯罪证据后,淮安警方在长沙、深圳分别将九象公司的法定代表人和技术主管抓获,审讯得知九象公司黑爬虫网站的“身份核验返照”业务端口来自北京黑格科技有限公司(下称:黑格科技),而黑格科技是从北京考拉征信服务有限公司(下称:考拉征信)等4家公司购买的查询接口。经查北京考拉征信服务有限公司从上游公司获取接口后,又违规将查询接口出卖,并非法缓存公民个人身份信息,供下游公司查询牟利,从而造成公民身份信息包括身份证照片的大量泄漏。 公开资料显示,北京考拉征信服务有限公司是一家第三方的信用评估及征信管理服务商,法定代表人为邹铁山。据其官网介绍,公司成立于2014年4月,是人民银行批准的八家个人征信批筹企业之一,是百行征信九家发起股东及董事单位之一。其业务包括:企业信用的征集、评定;企业管理咨询;技术开发、技术咨询、技术服务、技术转让;计算机系统服务;数据处理等。 据启信宝数据显示,考拉征信最大股东为A股上市公司拉卡拉支付股份有限公司,持股比例为32.40%。此外,A股上市公司拓尔思、旋极信息、蓝色光标均持股10.80%,A股上市公司广联达持股3.00%。而拉卡拉支付股份有限公司最大股东为联想控股股份有限公司,持股比例为28.24%。 据21世纪经济报道记者了解到,公民身份认证服务是直接服务于“互联网加+政务”来提升政府公共服务效能,防范欺诈和金融风险为目的。但之所以有以上等问题主要在于,涉案公司非法将公民身份认证端口出售,并非法缓存公民身份数据,层层加价后,这些数据被小贷公司利用,查询价格从源头的0.1元一条,到查询底层时可能两三块钱一条,身份证照片可以随意获取。据办案民警介绍,身份证照片可以随意获取,这为小贷公司实施“套路贷”犯罪、暴力催收敞开了罪恶之门。 截至目前,警方共立案侦查侵犯公民个人信息案件29起,抓获犯罪嫌疑人288人,缴获公民个人信息4.68亿多条,涉案金额9400多万元。 涉案公司非法缓存的公民身份认证数据现已全部收缴,同时堵塞漏洞,身份核验、“返照业务”接口全部封停,公安部门会同中国人民银行等部门加强对公民身份认证服务,个人征信服务的监管。 (部分图来源:央视网)[详情]
相关新闻: 拉卡拉旗下考拉征信被查:非法行为致公民信息泄露 大数据公司被查背后 网络爬虫侵犯隐私产业链整肃 最高法:七情形属帮助网络犯罪 泄露用户信息或担刑责 最近,江西淮安警方通报,在公安部的督办下,他们以打链条、打平台、打团伙为目标,依法打击了7家涉嫌侵犯公民个人信息犯罪的公司,涉嫌非法缓存公民个人信息1亿余条。公民个人身份信息、身份证照片等一旦被私下贩卖就有可能让人陷入“套路贷”犯罪、暴力催收以及电信诈骗等陷阱。如此海量的个人信息被泄露,幕后黑手是谁?又暴露出怎样的制度漏洞呢?[详情]
记者:刘陈希婷 网络“爬虫”行业刮起了强监管风暴。 继央行和北京金融局发文摸排“爬虫”业务后,近日中国互金协会也下发《关于增强个人信息保护意识依法开展业务的通知》(以下简称“《通知》”),再度指出,近期国家监管部门发现,社会上有一些互联网机构以“大数据”为名,通过“爬虫”业务涉嫌违法违规收集个人信息,或窃取、滥用、买卖、泄露个人信息,侵犯了消费者个人隐私,造成了不良的社会影响。 为此,中国互金协会引导会员机构增强个人信息保护意识,坚持合规、审慎经营,防范并纠正违反个人信息保护规定的行为。 强监管风暴来临 所谓“爬虫”是指按照一定规则,让计算机模拟人的行为来抓取网络数据,这是门很成熟的技术,在过去很长时间内,它都是作为搜索引擎的底层技术而存在。但在庞大市场需求的召唤下,越来越多有数据爬取能力的大数据公司涌入了互联网金融市场,同时由于数据的授权、来源、用途十分不透明,导致的隐私侵权、数据滥用等问题越来越严重。 今年5月28日,国家互联网信息办公室发布了《数据安全管理办法(征求意见稿)》,用部门立法的方式对互联网数据收集、数据处理使用,都做了明确的界定。 10月22日,北京金融局又窗口指导摸排区内所有大数据企业是否存在违规爬虫业务,如果没有则要求企业出承诺函,如果存在违规爬虫业务,要上报并尽快整改。 10月24日,有报道称,央行发文紧急调研银行与第三方数据公司合作情况。其中,银行需排查的内容主要涉及数据采集、信用欺诈、信用评分、风控建模等方面。同时,央行还要求各企业征信机构排查自身业务中是否存在违规爬虫行为。央行表示,如存在上述情况,请立即上报,对于存在违规“爬虫”业务的要立即整改。 然而,一系列法规并没能遏制“爬虫”技术在利益的诱惑下,继续沦为作恶工具。 11月6日,中国互金协会在《通知》再度指出,近期国家监管部门发现,社会上有一些互联网机构以“大数据”为名,通过“爬虫”业务涉嫌违法违规收集个人信息,或窃取、滥用、买卖、泄露个人信息,侵犯了消费者个人隐私,造成了不良的社会影响。 中国互金协会为引导会员机构增强个人信息保护意识,坚持合规、审慎经营,防范并纠正违反个人信息保护规定的行为,特此针对增强个人信息保护意识、依法开展业务的有关事项做出以下5点通知。 一、各会员机构应严守法律底线,依法合规开展个人信息的收集、处理、使用和对外提供等活动,不断加强个人信息保护工作力度。。 二、未经消费者授权同意,各会员机构不收集、处理、使用和对外提供消费者个人信息。各会员机构不以默认授权、概况授权、功能捆绑等误导、强迫消费者的方式收集个人信息,不与违规收集和使用个人信息的第三方开展数据合作,不滥用、非法买卖和泄露消费者个人信息。 三、各会员机构应建立健全收集、处理、使用、对外提供等全生命周期的个人信息保护制度,采取有效技术措施保障个人信息安全,加强对员工的教育和培训,对个人信息的收集、使用等活动加强监督管理。 四、各会员机构应及时就个人信息保护工作开展自查,并对数据合作方进行排查,对于存在的问题应立即整改,并及时将有关情况报告协会。 五、各会员机构应履行消费者教育义务,加强对消费者的风险提示。 爬虫时代或将结束 随着强监管信号的不断释放,不少业内人士认为,野蛮生长的“爬虫”时代或将结束。 “从技术本身来讲,并无原罪”。某大数据公司内部人士告诉《华夏时报》记者,业内稍具规模的公司为了业务发展,比如更加精确的用户定位和风险控制,都会做“爬虫”。不过问题在于,“爬虫”技术往往与信息来源违法、滥用等问题交织在一起。 而随着公安部打击“套路贷”,也牵涉出了导流获客和暴力催收两个帮凶,“爬虫”为主要工具,为“套路贷”平台爬取通讯录等个人敏感信息,用于放贷以及暴力催收。一时间,打着大数据旗号的非法网络“爬虫”与它的从业者们站在了风口浪尖。 公开信息显示,自9月以来,摩羯科技、公信宝等公司先后被查,同盾科技、新颜科技等公司的高管也被警方带走调查。记者注意到,这些所谓的“大数据”风控公司,均提供“爬虫”类服务,客户以互联网金融机构居多。 值得关注的是,作为“套路贷”风控的关键一环,一些大数据公司在近几年可谓风生水起。有调查指出,它们为了获取海量数据,许多非授权隐私数据也会成为“爬虫”的目标,甚至用户手机里的通讯录、通话记录、电商交易数据、生活缴费等等,导致的用户隐私侵权、数据滥用等问题越来越严重,暴力催收血案频繁发生,也最终将矛头指向了这些非法爬取数据的“害虫”公司。 事实上,数据来源合法始终是网络“爬虫”活动合法的前提。如未依据《网络安全法》第四十一条取得被收集者同意即自动抓取个人信息,网络运营者不仅面临民事纠纷或行政处罚风险,亦涉嫌构成侵犯公民个人信息罪、非法侵入计算机信息系统罪或非法获取计算机信息系统数据罪等相关罪名。 深圳市大数据研究与应用协会法律专家吴丹君表示,在利用网络爬虫技术访问收集数据时,网络运营者应先考虑可能抓取的数据类型及占比,将个人信息、存在知识产权侵权风险的信息内容、商业秘密或国家秘密等违法性风险较高的数据列入数据爬取负面清单,审慎进行爬取行为。 在上述内部人士看来,本次行业整顿也是一个行业净化、洗牌的过程,有利于整个行业更加健康、规范发展。[详情]
中国警察网11月22日消息,近日,河北省邯郸市公安局网安部门在“净网2019”专项行动中,多警种联合,成功破获一起部督特大侵犯公民个人信息案件[详情]
来源:雷锋网 本文作者:刘琳 就像一个龙卷风旋涡,整个数据征信行业都将被裹挟。 最近,江苏淮安警方端掉了7家涉嫌侵犯公民个人信息犯罪的公司,涉嫌非法缓存公民个人信息1亿多条。 其中,拉卡拉支付旗下的考拉征信涉嫌非法提供身份证返照查询9800多万次,获利3800万元。警方已将考拉征信服务有限公司及北京黑格公司的法定代表人、董事长、销售、技术等20余名涉案人员抓获。 “地下征信”黑色产业链曝光 据央视新闻报道,警方发现这起“地下征信”黑色产业链最初源于一起主动投案。 2018年4月,江苏淮安警方在网上巡查时发现,有人非法购买公民个人信息,后嫌疑人高某主动到警方投案。高某交代,他花500块钱从网名叫“过去、将来”的人手里购买了317条公民个人信息,这些信息包括手机号、姓名、身份证号和家庭地址。他买这些信息的目的是给网络小贷公司拉客户,警方通过对QQ、微信等资料的综合研判,锁定贩卖个人信息的“过去、将来”位置在河南焦作,随即出动警力,将犯罪嫌疑人申某在家中抓获。 在申某的电脑里,警方查获公民个人信息7万多条,这些信息包括公民姓名、身份证号、地址、电话以及芝麻信用分等,很多信息显示推广来源为“花钱无忧”“借点钱”等小贷平台。 申某自己不做贷款,而是通过个人信息买卖赚差价,加个几毛钱或者一块钱一条,再出售给其他人。 随后,申某的一名主要上线谢某在广州家中被警方抓获。另一个通过向申某贩卖公民个人信息的是广东一个网名叫“叮咚叮咚”的人,警方发现,“叮咚叮咚”在微信群中大肆贩卖公民个人信息。 不过,有迹象表明,“叮咚叮咚”是广州诺涵科技公司的员工,他贩卖公民信息并非个体行为。 淮安警方发现,广州诺涵科技公司不只贩卖公民个人信息,更主要的是在进行小额贷款并进行软暴力催收,这是一个组织严密、分工明确、涉案人数众多的犯罪团伙。 2018年6月6日,在广东警方配合下,淮安警方将该公司45名涉案人员全部抓捕。 除此之外,警方还发现,在广州诺涵科技公司,公民个人信息被称为“流量”,公司自己开发有“乐花管家”等多个小贷平台,在自身购买公民个人信息用于推销贷款、软暴力催收的同时,也和其他公司相互交换公民个人信息,还开发有爬虫云等软件,通过技术手段爬取其他小贷公司的公民个人信息,用于公司放贷和非法出售牟利。 涉案的广州诺涵公司虽然披着科技公司的外衣,其实从事的是网络放贷、软暴力催收、贩卖公民个人信息等违法犯罪行为。在他们贩卖的公民个人信息里,甚至还出现了公民身份证照片信息。 警方测试后发现,返回的是带网纹的二代身份证彩色照片,这样极度隐私的个人信息他们从哪儿获取的呢? 锁定相关犯罪证据后,淮安警方在长沙、深圳分别将湖南九象公司的法定代表人和技术主管抓获。 警方审讯得知,九象公司黑爬虫网站的“身份核验返照”业务端口来自北京黑格科技有限公司,而黑格公司是从北京考拉征信服务有限公司等四家公司购买的查询接口。 随即,警方将北京黑格公司和考拉征信服务有限公司的法定代表人、董事长、销售、技术等20余名涉案人员抓获,并于今年4月在北京将他们上游公司的5名涉案人员抓获。 经查,北京考拉征信服务有限公司从上游公司获取接口后又违规将查询接口出卖,并非法缓存公民个人身份信息,供下游公司查询牟利,从而造成公民身份信息包括身份证照片的大量泄露。 淮安公安分局网络大队中队长顾明表示:“违规缓存相当于把公民个人信息复制了一份,下游公司再向它通过数据接口调取数据的时候,它就不需要再向上游调取,也是节省了开支,这个是违法的。” 2015年3月以来,北京考拉公司非法提供查询返照9800余万次,获利3800余万元,在公司服务器中查获并收缴被非法获取、存储的公民姓名、身份证号、相片近1亿条。个人信息这些及其隐私的数据被一些公司包装成为个人数据产品进行贩卖,严重侵害了个人隐私,部分涉案人员因侵犯公民个人信息罪已经被法院判处了相应的刑罚。 与此同时,买卖公民个人隐私数据为小贷公司的“套路贷”犯罪、暴力催收敞开了罪恶之门。 淮安市公安局称,有人把这些非法获取的公民身份证照片PS成灵堂照片或者淫秽色情照片,发给贷款人本人进行威胁,甚至发给亲友同事,毁坏贷款人声誉,另外还用于电信诈骗中的通缉令诈骗,把带有身份证照片的通缉令发给受害人。 例如,湖南九象信息服务有限公司还利用爬虫软件,大量爬取其他小贷公司的公民个人贷款数据,包括姓名、身份证号、住址、电话、芝麻信用分、银行卡号、是否逾期,甚至通话记录等,形成所谓的地下征信,然后以数据形式打包出售,其他小贷公司购买后,成为是否放贷、放贷多少的风险控制依据。 公安部已经对此案暴露出的行业乱象开展了全面的打击整治工作,截至目前,警方共立案侦查29起,涉案个人信息4.68亿余条,抓获犯罪嫌疑人288人,涉案金额9400余万元,涉案公司非法缓存的公民身份认证数据已经全部收缴、身份核验返照业务接口全部关停,公安部将会同央行加强对公民身份认证服务、个人征信服务的监管。 数据隐私泄露背后 事实上,类似的数据隐私泄露事件并不在少数。 去年3月曝光的Facebook数据泄露事件中,有5000万用户的个人资料,被用来作为向其精准投放政治广告的重要参考,而这些人占据着美国选民人数的四分之一;同年,万豪发布公告称旗下酒店喜达屋5亿房客信息被泄露;社交平台陌陌的3000万用户数据在暗网被销售;问答网站鼻祖Quora的1亿用户数据被窃等等,而类似的数据隐私泄露事件还在继续。 目前,数据隐私问题的集中爆发,根源究竟在哪里呢? 北京光之树科技CEO张佳辰认为,根源在于数据的规范化流通逐渐进入正轨,国家加大力度对数据的获取(来龙)和利用(去脉)的乱象进行整治,一系列被“隐藏”的数据隐私问题才会被公众所知,这反而是一件好事。 对于征信公司和第三方数据公司来说,合法合规获取数据将成为行业大势。以征信公司为例,整个征信行业的监管需要加强规范化运营,以应对越来越强的监管。 第一,注意数据来源,不能全盘接收第三方大数据公司给到的数据,因为这个数据可能是被过度攫取的; 第二,要注意数据的使用,需要用更为先进的技术手段去合法合规使用数据,确保数据不被滥用,可回溯追责。 第三,利用技术确保公民个人信息不被泄露,且数据不会被缓存,结合区块链和数据标识技术,还可以确保数据确权、流转过程的可追溯可审计,充分发挥数字经济时代”谁贡献谁受益“的优势。 作为一名普通的吃瓜群众,我们还能做点什么保护自己呢? 在提供任何电子化或书面授权时,需仔细阅读并理解相关授权范围以及自愿退出的方式,对于超出必要性范围的数据授权应予以明确拒绝,并在发现自身权利受到侵害时,立刻终止使用,并向当地政府和监管部门投诉。 可以预见的是,随着数据保护的监管趋严,数据保护立法成为全民共识时,我们的数据也会得到更加强有力的保障。[详情]
相关新闻: 拉卡拉旗下考拉征信被查:非法行为致公民信息泄露 考拉征信涉黑产被查 蓝色光标等多家上市公司均参股 新浪财经讯 11月20日消息,江苏淮安警方依法打击了拉卡拉支付旗下的考拉征信等7家涉嫌侵犯公民个人信息犯罪的公司。对此,拉卡拉相关人士回应称,“目前只是取证阶段,考拉征信是配合调查。拉卡拉只是考拉征信众多股东之一,拉卡拉与考拉征信之间的财务、业务、经营等都是各自独立的。”[详情]
相关新闻: 拉卡拉征信被查处 非法提供身份证返照查询近亿次 拉卡拉旗下考拉征信被查:非法行为致公民信息泄露 原标题:拉卡拉旗下考拉征信涉嫌黑产被查,蓝色光标等多家上市公司均参股 据启信宝数据显示,考拉征信最大股东为A股上市公司拉卡拉支付股份有限公司,持股比例为32.40%。此外,A股上市公司拓尔思、旋极信息、蓝色光标均持股10.80%,A股上市公司广联达持股3.00%。而拉卡拉支付股份有限公司最大股东为联想控股股份有限公司,持股比例为28.24%。 11月20日,据央视网报道,近日江苏淮安警方依法打击了7家涉嫌侵犯公民个人信息犯罪的公司,涉嫌非法缓存公民个人信息1亿多条,其中,拉卡拉支付旗下的考拉征信涉嫌非法提供身份证返照查询9800多万次,获利3800万元。警方已将考拉征信服务有限公司及北京黑格公司的法定代表人、董事长、销售、技术等20余名涉案人员抓获。 本次行动中,据警方发现,广州诺涵信息科技有限公司(下称:诺涵科技)将公民个人信息被称为“流量”,公司自己开发有乐花管家等多个小贷平台,在自身购买公民个人信息用于推销贷款,软暴力催收的同时也和其他公司相互交换公民个人信息,还开发有爬虫云等软件,通过技术手段扒取其他小贷公司的公民个人信息,用于公司放贷和非法出售牟利。 据警方调查发现,诺涵科技的公民个人信息,主要来自湖南九象信息有限公司(下称:九象公司)。这家公司开发有一个黑爬虫网站,通过爬虫软件非法获取数10家小贷公司的公民贷款和逾期数据,然后公开提供收费查询,并提供“身份核验返照”业务,任何人只要在该网站输入公民姓名和身份证号码,就可以查询获取公民身份证相片。 锁定相关犯罪证据后,淮安警方在长沙、深圳分别将九象公司的法定代表人和技术主管抓获,审讯得知九象公司黑爬虫网站的“身份核验返照”业务端口来自北京黑格科技有限公司(下称:黑格科技),而黑格科技是从北京考拉征信服务有限公司(下称:考拉征信)等4家公司购买的查询接口。经查北京考拉征信服务有限公司从上游公司获取接口后,又违规将查询接口出卖,并非法缓存公民个人身份信息,供下游公司查询牟利,从而造成公民身份信息包括身份证照片的大量泄漏。 公开资料显示,北京考拉征信服务有限公司是一家第三方的信用评估及征信管理服务商,法定代表人为邹铁山。据其官网介绍,公司成立于2014年4月,是人民银行批准的八家个人征信批筹企业之一,是百行征信九家发起股东及董事单位之一。其业务包括:企业信用的征集、评定;企业管理咨询;技术开发、技术咨询、技术服务、技术转让;计算机系统服务;数据处理等。 据启信宝数据显示,考拉征信最大股东为A股上市公司拉卡拉支付股份有限公司,持股比例为32.40%。此外,A股上市公司拓尔思、旋极信息、蓝色光标均持股10.80%,A股上市公司广联达持股3.00%。而拉卡拉支付股份有限公司最大股东为联想控股股份有限公司,持股比例为28.24%。 据21世纪经济报道记者了解到,公民身份认证服务是直接服务于“互联网加+政务”来提升政府公共服务效能,防范欺诈和金融风险为目的。但之所以有以上等问题主要在于,涉案公司非法将公民身份认证端口出售,并非法缓存公民身份数据,层层加价后,这些数据被小贷公司利用,查询价格从源头的0.1元一条,到查询底层时可能两三块钱一条,身份证照片可以随意获取。据办案民警介绍,身份证照片可以随意获取,这为小贷公司实施“套路贷”犯罪、暴力催收敞开了罪恶之门。 截至目前,警方共立案侦查侵犯公民个人信息案件29起,抓获犯罪嫌疑人288人,缴获公民个人信息4.68亿多条,涉案金额9400多万元。 涉案公司非法缓存的公民身份认证数据现已全部收缴,同时堵塞漏洞,身份核验、“返照业务”接口全部封停,公安部门会同中国人民银行等部门加强对公民身份认证服务,个人征信服务的监管。 (部分图来源:央视网)[详情]
相关新闻: 拉卡拉旗下考拉征信被查:非法行为致公民信息泄露 4.68亿个人信息泄露 行业整顿剑指“套路贷”数据犯罪 新浪财经讯 11月20日消息,受利空消息影响,拉卡拉午后跳水大跌逾5%。据央视报道,拉卡拉旗下考拉征信被查,涉嫌非法缓存公民个人信息。[详情]
新浪财经讯 11月20日消息 据央视网报道,近日江苏淮安警方依法打击了7家涉嫌侵犯公民个人信息犯罪的公司,涉嫌非法缓存公民个人信息1亿多条,其中,拉卡拉支付旗下的考拉征信涉嫌非法提供身份证返照查询9800多万次,获利3800万元。警方已将考拉征信服务有限公司及北京黑格公司的法定代表人、董事长、销售、技术等20余名涉案人员抓获。[详情]
相关新闻: 拉卡拉旗下考拉征信被查:非法行为致公民信息泄露 大数据公司被查背后 网络爬虫侵犯隐私产业链整肃 最高法:七情形属帮助网络犯罪 泄露用户信息或担刑责 最近,江西淮安警方通报,在公安部的督办下,他们以打链条、打平台、打团伙为目标,依法打击了7家涉嫌侵犯公民个人信息犯罪的公司,涉嫌非法缓存公民个人信息1亿余条。公民个人身份信息、身份证照片等一旦被私下贩卖就有可能让人陷入“套路贷”犯罪、暴力催收以及电信诈骗等陷阱。如此海量的个人信息被泄露,幕后黑手是谁?又暴露出怎样的制度漏洞呢?[详情]
记者:朱丹丹 单美琪 今年下半年,对于某些大数据服务公司来说,注定是不平静的。 曾因“爬虫”事件而在一个月内两次被“点名”的杭州大数据公司同盾科技有限公司(下称“同盾科技”)没想到的是,两个月后又因“套路贷”引发了一小波关注。 日前,公安部通报了全国公安机关开展“净网2019”专项行动工作情况及典型案例。其中,据相关媒体报道,在涉案的大数据服务商里同盾科技赫然在列。 随后,同盾科技对此紧急发布声明,公司表示,旗下子公司杭州信川全部业务早已关停,并对被“套路贷”等不法分子利用而致歉。公司还承诺,已再次发起全面审查,制定并落实了严格的客户准入、审查与退出管理办法,确保业务合法合规。 注册地为北京的一家大数据服务商的工作人员向《华夏时报》记者表示,此次监管出手的源头是“套路贷”,这是大数据公司被查的一大原因。 被套路贷利用 11月14日,公安部召开新闻发布会,通报全国公安机关开展“净网2019”专项行动工作情况及典型案例。通报称,各地公安机关捣毁了一批为“套路贷”提供技术、数据服务的科技公司。值得注意的是,据财新网称,涉案的部分大数据服务商分别为新颜科技、聚信立、同盾科技、魔蝎科技。 对此,同盾科技于15日发布声明回应此事。其在声明中指出,为配合警方调查曾经服务的某第三方单位,同盾科技旗下杭州信川科技及有关人员正积极配合警方调查取证。 同盾科技表示,“客观上确实对原先已符合准入要求的客户违规使用服务情况存在监管难点,导致在业务快速增长过程中未能完全防范极个别‘套路贷’等不法分子利用信川产品和服务的情况。” 对此,该公司声明,“绝不回避责任,我们向受到伤害的朋友表示诚挚的道歉!我们对‘套路贷’等违法违规行为同样深恶痛绝!” 另外,该公司还表示,已经再次发起了全面审查,制定并落实了严格的客户准入、审查与退出管理办法。针对依法成立的合作客户所经营的业务要求符合国家政策、法律法规及监管要求,并在业务开展过程中根据监管要求的变化进行客户合规性筛查,并对不符合最新监管要求的客户予以坚决清退,以确保业务合法合规。 值得一提的是,“套路贷”是指以非法占有为目的,假借民间借贷之名,以低息、无抵押、快速放贷等为诱饵,诱使或者迫使被害人签订“借贷”或变相“借贷”等相关协议,通过收取“中介费”、“砍头息”等费用,虚增贷款金额、恶意制造违约等方式设置“套路”形成虚假债权债务的违法犯罪行为。 早在2017年,就曾有十余家大数据公司被查,如今大数据行业又迎来一次大清洗。今年9月份,一波针对爬虫业务的强监管也从打击“套路贷”入手。 “此次监管出手源头是现金贷和催收行业,尤其是令人深恶痛绝的‘套路贷’,”注册地为北京的一家大数据服务商的工作人员在接受《华夏时报》记者采访时说,“在这个过程中,大数据公司通过对外提供用户授权的运营商爬虫服务来抓取用户的敏感信息,这严重损害了用户的信息安全,这也是它们(大数据公司)被查的主要原因。” 上述工作人员还表示,“爬虫”是部分平台导流获客和暴力催收的主要工具,其主要为“套路贷”平台爬取通讯录、地址定位等用户的敏感信息,因为影响恶劣已经引起行业整顿。 而此次被卷入“套路贷”的杭州信川科技最早也正因“爬虫”一事而备受关注。 “爬虫”事件始末 早前,同盾科技因解散爬虫部门一事引发业内关注。 关于爬虫部门解散的消息,公司也在第一时间回应并表示,数聚魔盒为杭州信川科技有限公司独立运营的产品,该服务对适用条件与场景有严格的授权要求与限制,为更加严格地保护用户合法权益,信川科技自2018年开始已逐步调整业务,已全部停止相关服务,相关员工均已正常调整至其他岗位。 同月26日,有媒体报道称,“同盾科技爬虫类产品‘数据魔盒’负责人被查”,即与公司两位高管童保华和徐斐失联有关。 公开资料显示,杭州信川科技有限公司为同盾科技旗下一家独立运营的子公司,童保华曾任杭州信川科技业务总经理,目前已离职;徐斐为信川科技总经理。 9月27日,同盾科技曾通过微信公众号官方确认,为配合警方调查曾服务的某第三方单位,其子公司杭州信川科技的高管徐斐和董保华被黑龙江警方带走协助调查。 该公司曾声明,旗下从事爬虫业务的子公司数聚魔盒,在进入条件与适用场景上均有严格的授权要求与限制,且自2018年开始逐步调整业务,目前已全部终止相关服务。 其表示,作为涉金融服务的数据分析行业的头部企业,已严格遵照法律法规与监管要求开展个人信息保护及相关合规工作。针对合作客户,同盾科技也有着严格的准入筛选和退出机制,一旦发现客户存在违规违法行为,同盾科技即刻主动终止相关合作。 此外,同盾科技还在回应中强调,杭州信川科技有限公司作为同盾科技的子公司,独立运营,不涉及金融业务、不引流、不放贷。 “爬虫”指的是一种按照一定规则,自动抓取互联网信息的程序与技术。如果通过爬虫抓取网络公开信息,并不违法;但如果抓取的是未公开、未授权的个人敏感信息,就属于违法行为。[详情]
记者:刘陈希婷 网络“爬虫”行业刮起了强监管风暴。 继央行和北京金融局发文摸排“爬虫”业务后,近日中国互金协会也下发《关于增强个人信息保护意识依法开展业务的通知》(以下简称“《通知》”),再度指出,近期国家监管部门发现,社会上有一些互联网机构以“大数据”为名,通过“爬虫”业务涉嫌违法违规收集个人信息,或窃取、滥用、买卖、泄露个人信息,侵犯了消费者个人隐私,造成了不良的社会影响。 为此,中国互金协会引导会员机构增强个人信息保护意识,坚持合规、审慎经营,防范并纠正违反个人信息保护规定的行为。 强监管风暴来临 所谓“爬虫”是指按照一定规则,让计算机模拟人的行为来抓取网络数据,这是门很成熟的技术,在过去很长时间内,它都是作为搜索引擎的底层技术而存在。但在庞大市场需求的召唤下,越来越多有数据爬取能力的大数据公司涌入了互联网金融市场,同时由于数据的授权、来源、用途十分不透明,导致的隐私侵权、数据滥用等问题越来越严重。 今年5月28日,国家互联网信息办公室发布了《数据安全管理办法(征求意见稿)》,用部门立法的方式对互联网数据收集、数据处理使用,都做了明确的界定。 10月22日,北京金融局又窗口指导摸排区内所有大数据企业是否存在违规爬虫业务,如果没有则要求企业出承诺函,如果存在违规爬虫业务,要上报并尽快整改。 10月24日,有报道称,央行发文紧急调研银行与第三方数据公司合作情况。其中,银行需排查的内容主要涉及数据采集、信用欺诈、信用评分、风控建模等方面。同时,央行还要求各企业征信机构排查自身业务中是否存在违规爬虫行为。央行表示,如存在上述情况,请立即上报,对于存在违规“爬虫”业务的要立即整改。 然而,一系列法规并没能遏制“爬虫”技术在利益的诱惑下,继续沦为作恶工具。 11月6日,中国互金协会在《通知》再度指出,近期国家监管部门发现,社会上有一些互联网机构以“大数据”为名,通过“爬虫”业务涉嫌违法违规收集个人信息,或窃取、滥用、买卖、泄露个人信息,侵犯了消费者个人隐私,造成了不良的社会影响。 中国互金协会为引导会员机构增强个人信息保护意识,坚持合规、审慎经营,防范并纠正违反个人信息保护规定的行为,特此针对增强个人信息保护意识、依法开展业务的有关事项做出以下5点通知。 一、各会员机构应严守法律底线,依法合规开展个人信息的收集、处理、使用和对外提供等活动,不断加强个人信息保护工作力度。。 二、未经消费者授权同意,各会员机构不收集、处理、使用和对外提供消费者个人信息。各会员机构不以默认授权、概况授权、功能捆绑等误导、强迫消费者的方式收集个人信息,不与违规收集和使用个人信息的第三方开展数据合作,不滥用、非法买卖和泄露消费者个人信息。 三、各会员机构应建立健全收集、处理、使用、对外提供等全生命周期的个人信息保护制度,采取有效技术措施保障个人信息安全,加强对员工的教育和培训,对个人信息的收集、使用等活动加强监督管理。 四、各会员机构应及时就个人信息保护工作开展自查,并对数据合作方进行排查,对于存在的问题应立即整改,并及时将有关情况报告协会。 五、各会员机构应履行消费者教育义务,加强对消费者的风险提示。 爬虫时代或将结束 随着强监管信号的不断释放,不少业内人士认为,野蛮生长的“爬虫”时代或将结束。 “从技术本身来讲,并无原罪”。某大数据公司内部人士告诉《华夏时报》记者,业内稍具规模的公司为了业务发展,比如更加精确的用户定位和风险控制,都会做“爬虫”。不过问题在于,“爬虫”技术往往与信息来源违法、滥用等问题交织在一起。 而随着公安部打击“套路贷”,也牵涉出了导流获客和暴力催收两个帮凶,“爬虫”为主要工具,为“套路贷”平台爬取通讯录等个人敏感信息,用于放贷以及暴力催收。一时间,打着大数据旗号的非法网络“爬虫”与它的从业者们站在了风口浪尖。 公开信息显示,自9月以来,摩羯科技、公信宝等公司先后被查,同盾科技、新颜科技等公司的高管也被警方带走调查。记者注意到,这些所谓的“大数据”风控公司,均提供“爬虫”类服务,客户以互联网金融机构居多。 值得关注的是,作为“套路贷”风控的关键一环,一些大数据公司在近几年可谓风生水起。有调查指出,它们为了获取海量数据,许多非授权隐私数据也会成为“爬虫”的目标,甚至用户手机里的通讯录、通话记录、电商交易数据、生活缴费等等,导致的用户隐私侵权、数据滥用等问题越来越严重,暴力催收血案频繁发生,也最终将矛头指向了这些非法爬取数据的“害虫”公司。 事实上,数据来源合法始终是网络“爬虫”活动合法的前提。如未依据《网络安全法》第四十一条取得被收集者同意即自动抓取个人信息,网络运营者不仅面临民事纠纷或行政处罚风险,亦涉嫌构成侵犯公民个人信息罪、非法侵入计算机信息系统罪或非法获取计算机信息系统数据罪等相关罪名。 深圳市大数据研究与应用协会法律专家吴丹君表示,在利用网络爬虫技术访问收集数据时,网络运营者应先考虑可能抓取的数据类型及占比,将个人信息、存在知识产权侵权风险的信息内容、商业秘密或国家秘密等违法性风险较高的数据列入数据爬取负面清单,审慎进行爬取行为。 在上述内部人士看来,本次行业整顿也是一个行业净化、洗牌的过程,有利于整个行业更加健康、规范发展。[详情]
原标题:围剿网络“爬虫”: 监管发文规范 大数据公司切断非持牌合作 网络“爬虫”业务,正在被监管合力规范。 11月11日,21世纪经济报道记者获悉,中国互联网金融协会于11月6日向其会员单位下发《关于增强个人信息保护意识依法开展业务的通知》。 中国互联网金融协会指出,根据国家监管部门发现,社会上有一些互联网机构以“大数据”为名,通过“爬虫”业务涉嫌违法违规收集个人信息,或窃取、滥用、买卖、泄露个人信息,侵犯了消费者个人隐私,造成了不良的社会影响。 为此,中国互联网金融协会要求,不与违规收集和使用个人信息的第三方开展数据合作,不滥用、非法买卖和泄露消费者个人信息。 同日,北京地区部分互联网金融机构收到监管要求全面停止与“爬虫”有关的放贷业务,导致一些平台的基于“爬虫”的放贷业务全面暂停。 诞生于搜索引擎时代的网络爬虫,在个人信息保护意识增强的当下,正在受到监管和法律的关注。 切断非法网络爬虫 网络爬虫是一种自动采集数据的互联网技术,最早应用于搜索引擎,而今在新闻聚合、电子商务比价,甚至会计审计、政务等广泛应用。截至2016年,网络爬虫服务成本已经低至每小时20元。 但近年来,爬虫技术成为部分自称“大数据风控”平台越界采集个人信息,实质从事个人“类征信”业务的工具。近年来,由于P2P网贷、互联网小贷、甚至资金中介等互联网金融机构无法接入央行征信等系统,为从事线上放贷,这些机构转而通过与第三方“大数据”公司合作,由其采集个人或企业在互联网络上的留痕数据信息。 “估计整治爬虫还会持续一阵子。”一位征信业内人士表示,确实应该查一下,之前在和监管机构座谈会上,部分企业曾指出这一问题,一些“大数据”公司说不清楚数据来源,而一些放贷机构认为只要数据方提供“承诺”,就敢使用这些数据。 中国互联网金融协会在该通知中要求,各会员机构应严守法律底线,依法合规开展个人信息的收集、处理、使用和对外提供等活动,不断加强个人信息保护工作力度。 具体要求是,未经消费者授权同意,各会员机构不收集、处理、使用和对外提供消费者个人信息。各会员机构不以默认授权、概况授权、功能捆绑等误导、强迫消费者的方式收集个人信息,不与违规收集和使用个人信息的第三方开展数据合作,不滥用、非法买卖和泄露消费者个人信息。 另外,各会员机构应建立健全收集、处理、使用、对外提供等全生命周期的个人信息保护制度,采取有效技术措施保障个人信息安全,加强对员工的教育和培训,对个人信息的收集、使用等活动加强监督管理。各会员机构应及时就个人信息保护工作开展自查,并对数据合作方进行排查,对于存在的问题应立即整改,并及时将有关情况报告协会。各会员机构应履行消费者教育义务,加强对消费者的风险提示。 中国互联网金融协会成立于2015年7月。根据其公布的会员名单,目前有500多名机构会员,其中包括107家商业银行、16家保险、14家券商、4家信托公司,以及腾讯、蚂蚁金服、陆金所、拍拍贷等互联网金融机构。 此前10月12日,北京银保监局发布《关于规范银行与金融科技公司合作类业务及互联网保险业务的通知》,严禁与以“大数据”为名窃取、滥用、非法买卖或泄露客户信息的企业开展合作。 10月24日,21世纪经济报道独家报道,央行、银保监会已组成调查组,摸底大数据的使用边界和采集边界,将会涉及外包催收公司管理办法。首批排查和调研的机构包括一诺银华、万盛金融和平安普惠。 10月24日下午,央行调研部分银行填报是否与第三方数据公司开展合作,排查的合作内容主要涉及数据采集、信用欺诈、信用评分、风控建模等方面,有的要求银行上报第三方公司的名字、股东背景、是否涉及爬虫。 停止与非持牌机构合作 不仅大数据的使用方——金融机构自查“大数据”机构合作业务。 数位互金人士反馈,央行、银保监等机构此前已经陆续对大数据“爬虫”摸底调研。部分平台由于涉及大数据“爬虫”已经暂停业务。一位股份行人士表示,正在内部自查与大数据公司的合作情况。 大数据的源头——大数据公司,也迅速调整自身业务。 “我们正在规范产品,取消与非持牌金融机构的合作。”一位曾获得8家个人征信试点的大数据机构人士表示。 自2019年9月以来,多家知名“大数据”公司相关人员被抓或被调查,这些机构均涉及大数据风控业务和爬虫技术的应用。 包括,大数据平台魔蝎科技、新颜科技高管相继被警方带走;公信宝运营公司被杭州警方查封;上海大数据公司向商户下发通知,暂停对外提供用户授权的运营商爬虫服务。 究其原因,一位华南机构人士表示,监管和警方对大数据公司的清查“套路贷”整治,部分催收公司暴力催收,出现逼迫受害人自杀等极端事件,这使得警方反过来追查——大数据公司是如何把个人隐私数据倒卖出去。 实际上,以网络爬虫为主要代表的自动化数据收集技术,在提升数据收集效率的同时,如果被不当使用,可能影响网络运营者正常开展业务。 比如,“贷款中介这一‘助贷’模式,本意是为了提升资金方的获客能力和获客效率,但一些中介却利用大数据泄露的机会违法操作。”一位资深业内人士指出。 “警方正在从整个产业链铲除套路贷,包括大数据泄露。”此前,广东省小额贷款公司协会常务副秘书长徐北对21世纪经济报道记者表示。 网络爬虫正在被规范。 5月28日,国家互联网信息办公室就《数据安全管理办法(征求意见稿)》公开征求意见。该征求意见稿提出,自动化访问(即“网络爬虫”)收集流量不得超过网站日均流量三分之一,限制“大数据杀熟”等歧视性推送行为。 此外,记者获悉,央行10月已向部分银行下发了《个人金融信息(数据)保护试行办法》,将对金融机构与第三方之间征信业务活动等进一步作出明确规定,加大对违规采集、使用个人征信信息的惩处力度。 21世纪经济报道及其客户端所刊载内容的知识产权均属广东二十一世纪环球经济报社所有。未经书面授权,任何人不得以任何方式使用。详情或获取授权信息请点击此处。[详情]
财联社(北京,记者 姜樊)讯,一场针对金融类“爬虫”的围剿正在上演。多位北京地区互联网金融平台相关人士向财联社记者表示,此前已收到来自监管要求,平台全面停止与“爬虫”有关的放贷业务,这也导致一些平台的基于“爬虫”的放贷业务全面暂停。 实际上,针对“爬虫”业务的围剿,并非仅在北京地区。近日,中国互金协会也下发《关于增强个人信息保护意识依法开展业务的通知》,再度提及“爬虫”业务,并要求各会员机构应及时就个人信息保护工作开展自查,对数据合作方进行排查。 “这意味着平台如果没有自己数据基础,以后怕是无法再持续下去了。”一位互金行业资深人士表示,如今针对网贷行业的政策以退出为主,转型十分艰难。而针对“爬虫”业务的清理整顿,或将进一步加快行业的清退进程。 而此前,已有媒体报道称,北京地区正在摸查区内所有大数据企业是否存在违规“爬虫”业务。 但截至记者发稿时,相关监管方面暂未对此进行回复。 业务清淡 有平台已因爬虫全面停止放贷 “现在监管对‘爬虫’业务管的非常严格。”一家知名互金平台相关业务负责人李涵(化名)向财联社记者表示。 与此前监管要求的“三降”效果叠加,李涵所在的互金平台总体放贷量已经大幅下降三成到四成。“我们家还算好的,主要靠自身数据做放贷支撑,但众多过度依靠爬虫作为获客来源的平台,打击更大。” “爬虫”业务听起来高大上,也是在网贷等互金领域运用最广泛的技术之一,但其实在专业人士看来,这种“爬虫”业务是“最没有技术含量的技术”,而在这个名词背后,实际上隐藏的是个人信息的非法获取、个人信息非法买卖等行为。 正如中国互金协会下发的《关于增强个人信息保护意识依法开展业务的通知》中提及的一样,一些互联网机构以“大数据”为名,通过“爬虫”业务涉嫌违法违规收集个人信息,或窃取、滥用、买卖、泄露个人信息,侵犯了消费者个人隐私,造成了不良的社会影响。 “实际上,已有一些有平台已经因为‘爬虫’业务的问题,放贷业务已经被全面叫停了。”另一互金平台放贷业务相关负责人向财联社记者直言,因为该平台几乎全部依赖外部“爬虫”,在强监管之下,平台就不得不停止一切放贷业务。 财联社记者在上述人士提及的相关平台网站上看到,该平台几乎暂停了所有投资标的,但仍有一个3天期限、预期年化收益率为5.5%的标的可投资。财联社记者试图联系该平台官方进行求证,但截至记者发稿时,暂未收到该平台的相关回应。 源头已断 大数据公司称已不敢涉足爬虫业务 平台自查,只是针对“爬虫”业务的整顿方向之一:作为网贷平台经营中的标配,如果只是自查大数据“爬虫”业务,恐怕不少平台由于过度依赖这种数据开展业务,自查效果不会太好。 在财联社记者调查时发现,提供“爬虫”业务的源头实际上早已被切断。 “现在谁还敢给金融相关的平台及公司提供‘爬虫’业务?”中部地区的一家大数据公司相关负责人向婕(化名)向财联社记者直言。 据向婕透露,她所在的大数据此前确实有相关的“爬虫”业务,也曾因此陷入为“714高炮”提供数据的舆论旋涡中,但随后公司便着手切割“爬虫”类业务,停止一切与“爬虫”相关的业务。 实际上,针对大数据公司的排查风暴早已从今年9月份开始:多家大数据公司被查,相关涉案人员均被警方带走协助调查,整个行业的“大洗礼”已经上演。而各地监管指令也陆续被曝出:以北京为例,10月22日,有媒体报道称北京金融局窗口指导摸排区内所有大数据企业是否存在违规“爬虫”业务。 “此次对爬虫行业清理整顿对于风控外包的网贷平台影响比较大,这意味着这些平台将面临更高的数据成本和风控要求、风控模型需要重新搭建。”网贷之家研究员张叶霞认为,特别是对于中小平台来说,爬虫服务“断供”意味着其需自建数据体系或选择其他合规的第三方数据公司,而无论是自建数据体系或接入其他合规数据源,运营成本和风控要求均会大幅提高,这些平台或面临被淘汰的命运,也会进一步加快行业出清。 退出为主 艰难的转型之下多行业正受冲击 “爬虫”风波不仅仅让网贷行业受到影响,依赖各类助贷机构业务增长支撑的银行,尤其是自身数据能力、获客能力较为薄弱的中小银行,也同样受到波及。 在10月24日,央行也曾发文紧急调研银行与第三方数据公司合作情况,同时请各机构排查自身业务中是否存在违规“爬虫”行为,矛头直至助贷业务。 助贷业务,是当下网贷等平台转型的重要方向之一。所谓助贷,是一些助贷机构向银行等持牌的金融机构提供贷款客户资源的一种模式。一些银行,尤其是没有自身数据开发能力的中小银行,与助贷机构合作便可以轻而易举地拿到客户资源,有的还出现了实质性的风控外包状况。 张叶霞直言,与网贷行业一样,爬虫数据也是助贷业务风控的重要组成部分,监管对于爬虫的整顿,势必会对助贷业务产生影响,如在进行风控时,部分特征数据将会缺失,需重搭风控模型,这会直接导致助贷业务收缩,特别是对于过渡依赖于外部风控数据和爬虫数据的助贷平台在反欺诈、风控、贷后催收上都将面临非常大的考验。 “当下监管对于网贷平台转型助贷模式似乎也并不认可。”一位网贷行业资深研究人士向财联社记者表示,当下无论是对金融监管资质等要求,还是各地对于助贷的文件来看,助贷模式已经收到了诸多限制,但网贷平台转型成为小贷公司,甚至是消费金融公司等持牌金融机构,也并非易事。“由此来看,退出历史舞台将是这些网贷平台最终的宿命。”[详情]
原标题:中国互金协会下发通知提及“爬虫”问题 知情人士:已有平台因爬虫被叫停放贷业务 记者:姜樊 财联社11月8日讯,财联社记者获悉,中国互金协会向会员机构发布《关于增强个人信息保护意识依法开展业务的通知》称,社会上有一些互联网机构以“大数据”为名,通过“爬虫”业务涉嫌违法违规收集个人信息,或窃取、滥用、买卖、泄露个人信息,侵犯了消费者个人隐私,造成了不良的社会影响。有知情人士独家向财联社记者表示,当下监管对“爬虫”问题监管十分严格,已有平台因过度依赖“爬虫”而被叫停放贷业务。[详情]
原标题:银行与大数据公司合作引监管关注 违规“爬虫”遭围堵 华夏时报(chinatimes.net.cn)记者冉学东 徐晓梅 北京报道 回顾10月发生的大事,多家大数据公司被爆“违规爬虫”必须位列其中。北上广深杭地区的多家大数据公司、爬虫公司、放贷公司等被查。 目前监管层的监管已经进入银行层面。银行内部人士透露,银行已经收到了通知,称监管层要求银行填写是否与第三方数据公司开展合作。 有业内资深分析人士告诉《华夏时报》记者,大数据公司爬取明确禁止或未被授权的信息,都算是违规的,爬取数据时会有一个robots协议,明确了网站中哪些内容是不应被抓取的,哪些是可以抓取的。 大数据公司被查 根据百度百科介绍,网络爬虫(又称为网页蜘蛛),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。 “通俗点来讲,爬虫它的基本操作就是模拟人的行为去各个网站溜达,点点按钮,查查数据,或者把看到的信息背回来。就像一只虫子在一幢楼里不知疲倦地爬来爬去。” 一位从业者王哈鲁对本报记者表示。 事实上,爬虫技术是具有相关数据业务的公司常用的一种技术。上述业内人士对本报记者坦言,百度、谷歌搜索最基本的技术就是爬虫,自动抓取网页及相关信息,然后做整合输出。 至于会抓取到什么程度呢?“基本上能看到的都能被抓到。”该业内分析人士还对记者补充说,不显示并不代表不存在,用户曾经使用的有留存记录,即使删除可能还会保存在某数据库或服务器上,所以仍有被爬虫到的可能,不过对爬虫技术会有很高的要求。 大概是9月中旬前后开始,多家大数据公司出现大大小小的事情,起因大都是违规经营爬虫业务。多家大数据公司被警方调查,高管人员被带走,也停止了爬虫服务。 9月6日,杭州魔蝎科技的一位核心高管人员被警方带走调查。同一天,新颜科技CEO也被警方要求协助调查。之后,还有多家大数据公司被警方调查,包括公信宝、集奥聚合、同盾科技、立木征信等,相应的爬虫业务也被迫关停。 行业也嗅到了危险,纷纷主动停止爬虫服务。在魔蝎科技、新颜科技被查后,第三方数据服务公司聚信立做出反应,并于2019年9月6日停止对外提供用户授权的运营商爬虫服务。爬虫服务平台白骑士、天机数据也已经暂停爬虫服务。 值得一提的是,“爬虫”早在2017年下半年就已经陷入舆论的漩涡,源于一些大数据公司被曝出违规爬虫窃取现金贷放贷数据。 2017年现金贷发展迅猛,乱象丛生,暴露的问题也越来越多。现金贷成为众人口诛笔伐的对象。直到监管在2017年12月1日下发整顿现金贷的141号文,行业才有了改善。 现金贷行业出现的问题之一是部分现金贷公司开发了“同业爬虫”产品,可以直接将其他现金贷公司的包括放贷额度、风控等相关数据爬取过来。这样一来,现金贷公司大大的减少了放贷成本,通过同业爬虫就可以解决问题,大数据公司的“爬虫技术”却日渐式微。 为了增强自身的竞争力,不少大数据公司打“擦边球”甚至不惜违规爬虫。2017年11月,有文章爆出大数据公司聚立信、魔蝎科技有偿为现金贷公司爬取放贷数据等,被爬取的公司包括支付宝、微信、其他现金贷公司。 随后,魔蝎科技COO张俊九发布内部信表示,未来2个月,将逐渐关停爬虫业务,同时会启动向已签约客户的赔偿机制。这算是承认了公司存在的违规爬虫问题。 为防止个人信息泄露,行业内也出现了反爬虫技术。不过上述业内分析人士对本报记者坦言,爬虫、反爬虫、反反爬虫,永远是一个此消彼长的过程,只要爬数据产生的利益大于成本,就会有人去做。所以反爬虫的关键是加强技术升级,增加爬数据的成本,同时重点监控爬数据的对象,必要时诉诸法律。 可怕的是,很多时候,我们根本不知道是谁在爬取数据。 在移动互联网迅猛发展的时代,数据和流量对于互联网公司至关重要,为了两者甚至不惜一遍遍挑战监管的底线,最终将会遭到监管的重罚。 监管趋严 监管也许会迟到,但一定不会缺席。 据财新报道,10月22日,北京金融局窗口指导摸排区内所有大数据公司是否存在违规爬虫业务,如果没有则要求公司做出承诺函,如果存在违规爬虫业务,要上报并尽快整改。 另外21世纪经济报道称,中国人民银行、中国银保监会已组成调查组,摸底大数据的使用边界和采集边界,将会涉及外包催收公司管理办法。首批排查和调研的机构包括一诺银华、万盛金融和平安普惠。 其中,一诺银华是上海的一家资产处置公司,曾在2015年10月高调挂牌新三板,在取得挂牌同意函、全国建设分公司后,却因政策限制悄然退市。如今,另外一家催收公司湖南永雄又欲赴美上市,结果如何记者无从得知。 相关监管文件集中爆发。有银行内部人士透露,银行已经收到了通知,称央行发文紧急调研要求银行填写是否与第三方数据公司开展合作。排查内容涉及数据采集、信用欺诈、信用评分、风控建模方面,央行要求上报第三方数据公司的名字、股东背景、是否涉及爬虫。 总归一句话,大数据公司将面临严监管,用户的个人信息也会得到维护。 中国社会科学院金融研究所法与金融研究室副主任尹振涛曾接受本报记者采访时表示,催收不是一件小事情也不是新鲜事,现在出台了《网络安全法》,可能还会有《数据安全管理办法》、《个人金融信息(数据)保护试行办法》相继出台。 《网络安全法》于自2017年6月1日起正式实施,明确规定任何个人和组织不得从事非法侵入他人网络、干扰他人网络正常功能、窃取网络数据等危害网络安全的活动;不得提供专门用于从事侵入网络、干扰网络正常功能及防护措施、窃取网络数据等危害网络安全活动的程序、工具;明知他人从事危害网络安全的活动的,不得为其提供技术支持、广告推广、支付结算等帮助。网络数据,是指通过网络收集、存储、传输、处理和产生的各种电子数据。 2019年6月,网信办发布的《数据安全管理办法(征求意见稿)》是对《网络安全法》的细化,对网络运营者在数据收集、处理使用、安全监督管理等方面提出了要求,同时对公众关心的个人敏感信息收集方式、广告精准推送、账户注销难等问题做出了回应。 即将出台的《个人金融信息(数据)保护试行办法》则侧重于完善征信机制体制建设,将对金融机构与第三方之间征信业务活动等进一步做出明确规定,加大对违规采集、使用个人征信信息的惩处力度。 违规爬虫的成本提升,网络数据环境或许会有所改善。[详情]
原标题:金融数据爬虫到底能不能爬?行业专家这么说…… 作者:余继超 前有魔羯数据、新颜科技协助调查,后有公信宝被查封、天翼征信总经理被警察带走,“大数据”行业近日谈爬虫色变,金融数据爬虫到底能不能爬? 10月30日,上海交通大学数据法律研究中心执行主任、天册律师事务所资深顾问、数据法盟创始人何渊在2019数字信用与风控年会暨零壹财经新金融秋季峰会上表示,官方的态度实际上是很明确的,数据并不是不能爬,“说得很清楚,收集的时候不能采取妨碍网站的正常运行,甚至有一个尺度,流量不能超过别人网站的1/3”。 何渊认为,金融数据爬虫到底能不能爬?关键看三个点:爬的什么东西?怎么爬?爬的合法数据用来干什么?“这三点决定你是不是犯罪,是不是违法”。 在爬什么方面,何渊总结为“三全一稳定,两秘密一隐私”。所谓“三全”是指国家安全、公共安全、经济安全。“一稳定”指社会稳定。“两秘密一隐私”是指国家秘密、商业秘密和个人隐私。 何渊指出,机构通过侵入他人计算机信息安全系统去爬个人信息、国家秘密、商业秘密以及爬取数据导致影响市场竞争秩序的,都可能构成违法。 关于怎么爬方面,何渊表示,怎么爬很关键,你爬的东西是合法的,但是你爬的方式有问题,照样会构成刑罚。何渊认为这一方面存在危害计算机信息安全、非法获取公民个人信息、非法获取商业秘密、破坏版权系统保护措施四类风险。 何渊提醒各机构跟公共数据或者政府数据进行对接的时候,不能为了下一次省一个查询费用,留缓存。“这个风险是极大的,不能留缓存。千万不要为了一点点小利,会影响你后面的生存”。 如果抓取的数据本身没有问题,爬的过程也没有问题,那么合法爬取的数据该如何规范使用呢? 何渊表示,一方面需要授权使用,在买卖案当中提出了一个叫做“三授权”的原则;另一方面则需要避免构成不正当竞争,“如果存在不劳而获、搭便车以及造成实质性损害商业利益的,这都可能构成不正当竞争”。[详情]
来源:苏宁财富资讯 作者: 沈春泽、李加庆 “放下你手里的代码,小心被抓。” 最近程序员圈子不乏这样的戏谑调侃。 原因是最近发生的多起涉及爬虫技术的公司被司法部门调查。近日,51信用卡被查,更是将暴力催收背后非法使用爬虫技术爬取个人隐私数据的丑行,暴露在阳光之下。 一时间,“爬虫”成为众矢之的,一些公司紧急下架了爬虫相关的招聘信息,给大数据风控、人工智能从业者带来些许恐慌,头发又多落了几根。 实际上,大部分人都听说过爬虫,认为爬虫就是到人家网站上去爬东西、偷数据,有些人甚至认为只要有爬虫,什么数据都可以搞到。 今天,我们就打开爬虫这个“工具箱”,把涉及到的技术盲区放到灯光下,让大家可以清楚地看下。下面,本文就从这个角度来聊聊爬虫这个熟悉而又陌生的技术。 一、爬虫的技术原理 搜索引擎收集网上信息的主要手段就是网络爬虫(也叫网页蜘蛛、网络机器人)。它是一种“自动化浏览网络”的程序,按照一定的规则,自动抓取互联网信息,比如:网页、各类文档、图片、音频、视频等。搜索引擎通过索引技术组织这些信息,根据用户的查询,快速地提供搜索结果。 设想一下,我们平时浏览网页的时候会怎么做? 一般情况下,首先,会用浏览器打开一个网站的主页,在页面上寻找感兴趣的内容,然后点击本站或其它网站在该网页上的链接,跳转到新的网页,阅读内容,如此循环往复。如下图所示: 图中的虚线圆角矩形代表一个网站,每个实线矩形表示一个网页。可以看到,每个网站一般以首页为入口,该首页链接到几个、几万个、甚至上千万个的内部网页。同时,这些网页往往又链接了很多外部网站。例如,用户从苏宁金融的网页为起点,浏览发现了PP视频的链接,点击后跳转到了PP视频主页,作为体育爱好者,在体育频道中找到了相关的新浪微博的内容,再次点击后又来到微博的页面继续阅读,从而形成了一条路径。如果把所有的可能路径呈现出来,就会看到一个网络结构。 网络爬虫模拟了人们浏览网页的行为,只是用程序代替了人类的操作,在广度和深度上遍历网页。如果把互联网上的网页或网站理解为一个个节点,大量的网页或网站通过超链接形成网状结构。爬虫通过遍历网页上的链接,从一个节点跳转到下一个节点,就像是在一张巨大的网上爬行,但是比人类的速度更快,跳转的节点更全面,所以被形象地称为网络爬虫或网络蜘蛛。 二、爬虫的发展历史 网络爬虫最早的用途是服务于搜索引擎的数据收集,而现代意义上的搜索引擎的鼻祖是1990年由加拿大麦吉尔大学(University of McGill)学生Alan Emtage发明的的Archie。 人们使用FTP服务器共享交流资源,大量的文件散布在各个FTP主机上,查询起来非常不方便。因此,他开发了一个可以按照文件名查找文件的系统,能定期搜集并分析FTP服务器上的文件名信息,自动索引这些文件。工作原理与现在的搜索引擎已经非常接近,依靠脚本程序自动搜索分散在各处FTP主机中的文件,然后对有关信息进行索引,供使用者以一定的表达式查询。 世界上第一个网络爬虫“互联网漫游者”(“www wanderer”)是由麻省理工学院(MIT)的学生马休·格雷(Matthew Gray)在 1993 年写成。刚开始,它只用来统计互联网上的服务器数量,后来则发展为能够通过它检索网站域名。 随着互联网的迅速发展,使得检索所有新出现的网页变得越来越困难,因此,在“互联网漫游者”基础上,一些编程者将传统的“蜘蛛”程序工作原理作了些改进。其设想是,既然所有网页都可能有连向其他网站的链接,那么从跟踪一个网站的链接开始,就有可能检索整个互联网。 其后,无数的搜索引擎促使了爬虫越写越复杂,并逐渐向多策略、负载均衡及大规模增量抓取等方向发展。爬虫的工作成果是搜索引擎能够遍历链接的网页,甚至被删除的网页也可以通过“网页快照”的功能访问。 三、网络爬虫的礼仪 礼仪一:robots.txt文件 每个行业都有其Code of Conduct,成为行为准则或行为规范。比如,你是某个协会中的成员,那就必须遵守这个协会的行为准则,破坏了行为准则是要被踢出去的。 最简单的例子,你加入的很多微信群,一般群主都会要求不可以私自发广告,如果未经允许发了广告,会被立刻踢出群,但是发红包就没事,这就是行为准则。 爬虫也有行为准则。早在1994年,搜索引擎技术刚刚兴起。那时的初创搜索引擎公司,比如AltaVista和DogPile,通过爬虫技术来采集整个互联网的资源,与Yahoo这样的资源分类网站激烈竞争。随着互联网搜索规模的增长,爬虫收集信息的能力快速进化,网站开始考虑对于搜索引擎爬取信息做出限制,于是robots.txt应运而生,成为爬虫界的“君子协定”。 robots.txt文件是业内惯用做法,不是强制性的约束。robots.txt的形式如下: 在上面这个robots.txt例子中,所有的爬虫都被禁止访问网站的任意内容。但是Google的爬虫机器人,可以访问除了private位置的所有内容。如果一个网站上没有robots.txt,是被认为默许爬虫爬取所有信息。如果robots.txt做了访问的限制,但是爬虫却没有遵守,那就不是技术实现这么简单的事情了。 礼仪二:爬取吞吐量的控制 曾经出现假冒Google搜索引擎的爬虫去对网站进行DDoS攻击,让网站瘫痪的事情。近年来,恶意爬虫造成的DDoS攻击行为有增无减,给大数据行业蒙上了爬虫的阴影。因为其背后的恶意攻击者,往往具备更为复杂和专业的技术,能绕过各种防御机制,让防范这样攻击行为难上加难。 礼仪三:做一个优雅的爬虫 优雅的爬虫背后,一定站着一个文明人或者一个文明团队。他们会考虑自己写的爬虫程序是否符合robots.txt协议,是否会对被爬网站的性能造成影响,如何才能不侵害知识产权所有者的权益以及非常重要的个人隐私数据等问题。 出于能力的差别,并不是每个爬虫团队都能考虑到这些问题。2018年,欧盟出台的《General Data Protection Regulation》(通用数据保护条例)中对数据的保护做出了严格的说明。2019年5月28日,国家互联网信息办公室发布的《数据安全管理办法》(征求意见稿)对爬虫和个人信息安全做出了非常严格的规定。比如: (1)第十六条 网络运营者采取自动化手段访问收集网站数据,不得妨碍网站正常运行;此类行为严重影响网站运行,如自动化访问收集流量超过网站日均流量三分之一,网站要求停止自动化访问收集时,应当停止。 (2)第二十七条 网络运营者向他人提供个人信息前,应当评估可能带来的安全风险,并征得个人信息主体同意。 其实,我国2017年6月1日施行的《中华人民共和国网络安全法》第四章第四十一条和四十四条就已经对个人隐私信息数据的收集和使用做出明文规定,这也与爬虫直接相关。 法律制度的出台,给技术的边界做出了明确的限定,技术无罪并不能作为技术实施者为自己开脱的理由。爬虫在实现自己需求的同时,必须做到严格遵守行为准则和法律条例。 四、各类反爬虫技术介绍 为了保护自己合法权益不被恶意侵害,不少网站和应用APP应用了大量的反爬技术。这使得爬虫技术中又衍生出反反爬虫技术,比如各类滑动拼图、文字点选、图标点选等验证码的破解,它们相互促进、相互发展、相互伤害着。 反爬虫的关键在于阻止被爬虫批量爬取网站内容,反爬虫技术的核心在于不断变更规则,变换各类验证手段。 这类技术的发展甚至让人痴迷,比DOTA对战还让人热血沸腾。从那晃动如波浪的文字验证码图形的伪装色里彷佛都能看得见程序员的头发。 1、图片/Flash 这是比较常见的反爬手段,将关键数据转为图片,并添加上水印,即使使用了OCR(Optical Character Recognition,文字识别)也无法识别出来,让爬虫端获取了图片也得不到信息。早期一些电商的价格标签中经常见到这种方式。 2、JavaScript混淆技术 这是爬虫程序员遇到最多的一种反爬方式,简单来说其实就是一种障眼法,本质上还是一种加密技术。很多网页中的数据是使用JavaScript程序来动态加载的,爬虫在抓取这样的网页数据时,需要了解网页是如何加载该数据的,这个过程被称为逆向工程。为了防止被逆向工程,就用到JavaScript混淆技术,加JavaScript代码进行加密,让别人看不懂。不过这种方式属于比较简单的反爬方式,属于爬虫工程师练级的初级阶段。 3、验证码 验证码是一种区分用户是计算机还是人的公共全自动程序,也是我们经常遇到的一种网站访问验证方式,主要分为以下几种: (1)输入式验证码 这是最最常见的,通过用户输入图片中的字母、数字、汉子等字符进行验证。 图中CAPTCHA 的全名是(Completely Automated Public Turing test to tell Computers and Humans Apart),中文翻译为:全自动区分计算机与人类的图灵测试。实现的方式很简单,就是问一个电脑答不出来但人类答得出来的问题。不过,现在的爬虫往往会用深度学习技术对这样的验证码进行破解,这样的图灵测试已经失效。 (2)滑块式验证码 鉴于输入式的图形验证码的缺点,容易被破解,而且有时候人类都识别不了。滑块验证码横空出世,这种验证码操作简便,破解难度大,很快就流行起来了。破解滑块验证码存在两大难点:一是必须知道图形缺口在哪里,也就是得知道滑块滑到哪;二是要模仿出人类滑动的手势。这样的验证码增加了一定的难度,也给爬虫界增加了很多乐趣,一时间大量破解滑块验证码的技术出现。 (3)点击式的图文验证和图标选择 图文验证,是通过文字提醒用户点击图中相同字的位置进行验证。 图标选择,是给出一组图片,按要求点击其中一张或者多张。 这两种原理相似,只不过是一个给出文字,点击图片中的文字;一个给出图片,点出符合内容的图片。这两种方法的共同点就是体验差,被广为诟病。 (4)手机验证码 对于一些重要的敏感信息访问,网站或APP端一般会提供填写手机验证码的要求,通过手机接受网站发送的验证码来进一步访问,这种方式对于数据隐私的保护比较好。 4、账号密码登陆 网站可以通过账号登陆来限制爬虫的访问权限,个人在使用很多网站服务的时候一般是需要进行账号注册的,使用的时候需要通过账号密码登陆才能继续使用服务。网站可以利用用户浏览器的Cookie来对用户的身份进行识别,通过保存在用户本地浏览器中加密的Cookie数据来进行用户访问会话的跟踪。这一般作为前面几种反爬方式的补充。 五、爬虫技术的发展方向 传统网络爬虫最大的应用场景是搜索引擎,普通的企业更多是做网站或应用。后来随着网络数据分析的需要,以及互联网上的舆情事件层出不穷,针对网络爬虫有了大量的需求,采集的对象主要是些新闻资讯。 近些年,由于大数据处理和数据挖掘技术的发展,数据资产价值的概念深入人心,爬虫技术得到更加广泛和深入的发展,采集对象也更丰富,高性能、并发式的技术指标也更高。 围绕网络爬虫合法性的讨论仍然存在,情况也比较复杂。目前的趋势下,许多法律问题还处于模糊地带,往往取决于具体的案例影响。然而,可以肯定的是,只要有互联网,就会有网络爬虫。只有网络爬虫让体量巨大的互联网变得可以搜索,使爆炸式增长的互联网变得更加容易访问和获取,在可预见的未来,互联网爬虫技术将继续得到发展。 互联网作为人类历史最大的知识仓库,是非结构化或非标准化的。互联网上聚集了大量的文本、图片、多媒体等数据,内容虽然非常有价值,但是知识提取的难度仍然非常巨大。语义互联网、知识共享等概念越来越普及,真正语义上的互联网将是网络爬虫的目标。此外,物联网技术的发展,将是互联网的升级形式,也将是爬虫技术未来发展的方向。[详情]
原标题:一地鸡毛,央行紧急调研银行与三方数据公司合作情况 国际金融报记者 黄希 10月24日,有媒体称,央行日前发文紧急调研银行与第三方数据公司合作情况。其中,湖北的一家银行与位于安徽的一家银行均确认,已收到央行相关通知,正在进行自查。 不过,《国际金融报》记者向浙江某城商行和江苏某农商行方面求证该消息时,上述两家银行均表示目前未收到相关通知。 据报道,通知显示,央行紧急排查银行和企业征信机构对开展数据采集、风控建模、爬虫等相关业务的调研。其中,银行需填报的内容包括是否与第三方数据公司开展合作,排查的内容主要涉及数据采集、信用欺诈、信用评分、风控建模等方面。 根据一份《XX省辖内银行与数据公司合作情况排查统计表》,商业银行需填报合作的数据公司全称、数据公司资质(备案、许可证等),合作数据公司注册地址、合作开始时间、数据的主要类型,以及合作模式、是否与该数据公司共享本单位信贷信息等。 值得的一提的是,确认没有合作的,也需要按照要求进行报送和报告。历史合作过但已结束合作的无需填报。同时,对于商业银行和数据公司合作在总行,执行在分支行的,也属于此次排查范围。其中,企业信息合作内容不包括在内,主要是与数据公司在个人信息方面的合作情况。 同时,央行要求各企业征信机构排查自身业务中是否存在违规爬虫行为。央行表示,如存在上述情况,请立即上报,对于存在违规爬虫业务的要立即整改。如不存在上述情况的,请出具加盖公章的书面承诺函,并于10月24日前送至征信管理处。 根据柒财经了解,对于企业征信机构,央行也要求相关机构,梳理是否与以下公司有业务或股权投资关联:魔蝎科技、新颜科技、公信宝、白骑士、天机数据、立木征信与聚信立等。 而互金通讯社拿到的名单涉及公司范围更广,包括摩羯科技、新颜科技、集奥聚合、白骑士、公信宝、天机数据、立木征信、聚信立、51信用卡。 记者注意到,另有一份网络流传的名单中,同盾科技也在列。 对此,同盾方面对《国际金融报》记者表示,同盾并不在这个名单之列,是友商恶意拼凑杜撰的。 今年10月12日,北京银保监局曾下发《关于规范银行与金融科技公司合作类业务及互联网保险业务的通知》(京银保监发〔2019〕310号),其中提及,严禁与以“大数据”为名窃取、滥用、非法买卖或泄露客户信息的企业开展合作。 伴随着针对大数据行业的整顿逐渐白热化,行业风声鹤唳,人人自危。[详情]
作者:侯小溪 程维妙 陈鹏 近日,记者得到一份某银行内部通知,该通知称,央行日前发文紧急调研银行与第三方数据公司合作情况,同时请各机构排查自身业务中是否存在违规爬虫行为。 通知称,收到人行紧急调研,需填报是否与第三方数据公司开展合作。排查的合作内容主要涉及数据采集、信用欺诈、信用评分、风控建模等方面。人行要求上报第三方公司的名字、股东背景、是否涉及爬虫。 此外,一同通知的还有辖内各企业征信机构,请辖内各机构梳理是否与以下公司有业务或股权投资关联:同盾科技、摩羯科技、新颜科技、集奥聚合、公信宝、白衣骑士、天机数据、立木征信、聚信立、51信用卡。 通知称请各机构排查自身业务中是否存在违规爬虫行为。如存在上述情况,请立即上报。对于存在违规爬虫业务的要立即整改。如不存在上述情况的,需出具加盖公章的书面承诺函,于10月24日前送至征信管理处。 多位业内人士对记者表示,自己的银行相关部门收到了梳理是否与上述企业存在关联的通知,通知下发于51信用卡相关人员遭警方调查前。 业内人士对记者透露,部分银行的数据中心向第三方输出数据和自第三方接收数据可能存在问题。 此外,有银行内部人士对记者表示,该自查涉及银行科技部分,包含“行内科技部或者科技子公司,还有一部分是外包。”[详情]
“近期公安机关侦办的一起网络‘套路贷’案件,打掉了一个专门为犯罪团伙提供软件开发和系统运营的公司,被打掉时该公司还在运营200余款‘套路贷’APP。”公安部网络安全保卫局巡视员、副局长张宏业在最高人民法院新闻发布会上指出,网络犯罪牟利性日益突出,推生了协同共生的黑色产业链条,大大减低了犯罪成本和技术门槛,极大地助长了网络犯罪。 最高人民法院研究室主任姜启波表示,2011年5月1日至2019年9月,全国法院共审理相关网络犯罪案件260件,判决473人。其中,非法利用信息网络刑事案件159件、223人,帮助信息网络犯罪活动刑事案件98件、247人。 为保障法律正确统一适用,依法严厉惩治有效防范网络犯罪,10月25日,最高人民法院新闻发布会公布了《最高人民法院、最高人民检察院关于办理非法利用信息网络帮助信息网络犯罪活动等刑事案件适用法律若干问题的解释》(以下简称《解释》)。 《解释》共十九条,主要包括以下十个方面的内容: 明确了拒不履行信息网络安全管理义务罪的主体范围。 明确了拒不履行信息网络安全管理义务罪的前提要件。 明确了拒不履行信息网络安全管理义务罪的入罪标准。 明确了非法利用信息网络罪的客观行为方式。 明确了非法利用信息网络罪的入罪标准。 明确了帮助信息网络犯罪活动罪的主观明知推定规则。 明确了帮助信息网络犯罪活动罪的入罪标准。 明确了单位实施相关网络犯罪的定罪量刑标准。 明确了相关网络犯罪的职业禁止和禁止令适用规则。 明确了相关网络犯罪的罚金刑适用规则。 “网络服务提供者”包括哪些人 《解释》进一步明确了“网络服务提供者”的范围,即包括提供下列服务的单位和个人: (1)网络接入、域名注册解析等信息网络接入、计算、存储、传输服务; (2)信息发布、搜索引擎、即时通讯、网络支付、网络预约、网络购物、网络游戏、网络直播、网站建设、安全防护、广告推广、应用商店等信息网络应用服务; (3)利用信息网络提供的电子政务、通信、能源、交通、水利、金融、教育、医疗等公共服务。 七种情形属帮助网络犯罪 《解释》还明确了帮助信息网络犯罪活动罪的入罪标准。根据刑法规定,帮助信息网络犯罪活动罪以“情节严重”作为入罪要件。根据司法实践中的具体情况,《解释》明确了“情节严重”的认定标准,即帮助信息网络犯罪活动,具有下列情形之一,应当认定为刑法第二百八十七条之二第一款规定的“情节严重”。 一是为三个以上对象提供帮助的; 二是支付结算金额二十万元以上的; 三是以投放广告等方式提供资金五万元以上的; 四是违法所得一万元以上的; 五是二年内曾因非法利用信息网络、帮助信息网络犯罪活动、危害计算机信息系统安全受过行政处罚,又帮助信息网络犯罪活动的; 六是被帮助对象实施的犯罪造成严重后果的; 七是其他情节严重的情形。 此外,确因客观条件限制无法查证被帮助对象是否达到犯罪的程度,但相关数额总计达到前述标准五倍以上,或者造成特别严重后果的,应当以帮助信息网络犯罪活动罪追究行为人的刑事责任。 明确非法利用信息网络罪的入罪标准 《解释》明确了非法利用信息网络罪的入罪标准。 一是设立网站、通讯群组、发布信息的数量。《解释》规定,假冒国家机关、金融机构名义,设立用于实施违法犯罪活动的网站的,设立用于实施违法犯罪活动的网站,数量达到三个以上或者注册账号数累计达到二千以上的,设立用于实施违法犯罪活动的通讯群组,数量达到五个以上或者群组成员账号数累计达到一千以上的,或者发布有关违法犯罪的信息或者为实施违法犯罪活动发布信息,达到相应标准的,属于“情节严重”。 二是违法所得数额。《解释》规定,违法所得一万元以上的,属于“情节严重”。 三是前科情况。《解释》规定,二年内曾因非法利用信息网络、帮助信息网络犯罪活动、危害计算机信息系统安全受过行政处罚,又非法利用信息网络的,属于“情节严重”。 造成用户信息泄露或担刑责 根据刑法规定,拒不履行信息网络安全管理义务,经监管部门责令采取改正措施而拒不改正,有严重情节的,构成犯罪。为统一司法适用,《解释》根据拒不履行信息网络安全管理义务罪的不同情形,对其入罪标准作了明确。 一是致使违法信息大量传播的,具体从违法信息数量、传播范围等方面加以判断; 二是致使用户信息泄露,造成严重后果的,具体从泄露的用户信息数量、后果严重程度等方面加以判断; 三是致使刑事案件证据灭失,情节严重的,具体从相关证据所涉案件重要程度、造成证据灭失的次数、对刑事诉讼程序的影响等方面加以判断; 四是有其他严重情节的,具体从拒不履行信息网络安全管理义务的重要程度、前科情况、造成后果等方面加以判断。 网络犯罪刑满三至五年禁止从事相关职业 《解释》明确了相关网络犯罪的职业禁止适用规则。刑法规定,因利用职业便利实施犯罪的,人民法院可以根据犯罪情况和预防再犯罪的需要,禁止其自刑罚执行完毕之日或者假释之日起从事相关职业,期限为三年至五年。 同时,《解释》针对非法利用信息网络设置了较低入罪门槛。 谈及司法解释在惩治网络犯罪,保障网络安全方面的整体思路和亮点,姜启波表示,近年来网络犯罪案件蔓延和逐年增多,严重危害了国家安全、危害社会秩序和人民群众合法权益。特别是传统的犯罪日益向互联网转移,加大了预防和惩治的难度。基于此,根据《刑法修正案(九)》的精神,司法解释将严惩相关网络犯罪,维护网络安全,维护网络安全的秩序,作为《解释》的主线。突出表现在以下三个方面。 一个坚持要打早打小。从惩治设立违法犯罪网站开始,将打击犯罪的环节向前推进了一步。不是等到行为人进行了严重的犯罪才开始惩罚,而是从设立网站开始就要进行严厉惩治。《刑法修正案(九)》设立了非法利用信息网络罪,目的就是要惩治设立网站,通过通讯群组发布信息这些带有预备性质的行为。设立诈骗网站,或者发布买卖枪支,买卖违禁物品的违法信息,目的就是为了犯罪。此类行为就可能构成犯罪。《解释》针对非法利用信息网络设置了比较低的入罪门槛。《解释》专门规定,假冒国家机关、金融机构的名义设立用于实施违法犯罪活动网站,设立一个,就构成犯罪。 二是实现对网络犯罪的全链条惩治。大家知道,当前互联网犯罪分工相当细化,逐步形成了环环相扣的利益链条。这也是网络犯罪迅速蔓延的重要原因。惩治网络犯罪就必须要斩断利益链条。这也是《刑法修正案(九)》增设帮助信息网络犯罪活动罪的旨向。根据修法精神,《解释》针对帮助信息网络犯罪活动这些行为,也设置了比较低的入罪门槛,有真正实现对网络犯罪的全链条惩治。特别是《解释》明确规定,帮助信息网络犯罪活动罪的对象,既可以是犯罪活动,在例外的情况下也可以是因客观条件限制无法查证帮助对象是否达到犯罪程度的情形,以实现对网络犯罪帮助行为的独立入罪。 三是在自由刑的基础上进一步加大了职业禁止和财产刑的适用力度。《解释》规定可以对相关犯罪分子依法宣告职业禁止或者是禁止令,防止其“重操旧业”。同时加大财产刑的适用力度,让犯罪分子得不偿失,剥夺他们的再犯罪的能力。 [详情]
原标题:“两高”关于办理非法利用信息网络、帮助信息网络犯罪活动等刑事案件适用法律若干问题的解释 来源:最高人民法院 《最高人民法院、最高人民检察院关于办理非法利用信息网络、帮助信息网络犯罪活动等刑事案件适用法律若干问题的解释》已于2019年6月3日由最高人民法院审判委员会第1771次会议、2019年9月4日由最高人民检察院第十三届检察委员会第二十三次会议通过,现予公布,自2019年11月1日起施行。 最高人民法院 最高人民检察院 2019年10月21日 最高人民法院 最高人民检察院 关于办理非法利用信息网络、帮助信息网络犯罪活动等刑事案件适用法律若干问题的解释 (2019年6月3日最高人民法院审判委员会第1771次会议、2019年9月4日最高人民检察院第十三届检察委员会第二十三次会议通过,自2019年11月1日起施行) 法释〔2019〕15号 为依法惩治拒不履行信息网络安全管理义务、非法利用信息网络、帮助信息网络犯罪活动等犯罪,维护正常网络秩序,根据《中华人民共和国刑法》《中华人民共和国刑事诉讼法》的规定,现就办理此类刑事案件适用法律的若干问题解释如下: 第一条 提供下列服务的单位和个人,应当认定为刑法第二百八十六条之一第一款规定的“网络服务提供者”: (一)网络接入、域名注册解析等信息网络接入、计算、存储、传输服务; (二)信息发布、搜索引擎、即时通讯、网络支付、网络预约、网络购物、网络游戏、网络直播、网站建设、安全防护、广告推广、应用商店等信息网络应用服务; (三)利用信息网络提供的电子政务、通信、能源、交通、水利、金融、教育、医疗等公共服务。 第二条 刑法第二百八十六条之一第一款规定的“监管部门责令采取改正措施”,是指网信、电信、公安等依照法律、行政法规的规定承担信息网络安全监管职责的部门,以责令整改通知书或者其他文书形式,责令网络服务提供者采取改正措施。 认定“经监管部门责令采取改正措施而拒不改正”,应当综合考虑监管部门责令改正是否具有法律、行政法规依据,改正措施及期限要求是否明确、合理,网络服务提供者是否具有按照要求采取改正措施的能力等因素进行判断。 第三条 拒不履行信息网络安全管理义务,具有下列情形之一的,应当认定为刑法第二百八十六条之一第一款第一项规定的“致使违法信息大量传播”: (一)致使传播违法视频文件二百个以上的; (二)致使传播违法视频文件以外的其他违法信息二千个以上的; (三)致使传播违法信息,数量虽未达到第一项、第二项规定标准,但是按相应比例折算合计达到有关数量标准的; (四)致使向二千个以上用户账号传播违法信息的; (五)致使利用群组成员账号数累计三千以上的通讯群组或者关注人员账号数累计三万以上的社交网络传播违法信息的; (六)致使违法信息实际被点击数达到五万以上的; (七)其他致使违法信息大量传播的情形。 第四条 拒不履行信息网络安全管理义务,致使用户信息泄露,具有下列情形之一的,应当认定为刑法第二百八十六条之一第一款第二项规定的“造成严重后果”: (一)致使泄露行踪轨迹信息、通信内容、征信信息、财产信息五百条以上的; (二)致使泄露住宿信息、通信记录、健康生理信息、交易信息等其他可能影响人身、财产安全的用户信息五千条以上的; (三)致使泄露第一项、第二项规定以外的用户信息五万条以上的; (四)数量虽未达到第一项至第三项规定标准,但是按相应比例折算合计达到有关数量标准的; (五)造成他人死亡、重伤、精神失常或者被绑架等严重后果的; (六)造成重大经济损失的; (七)严重扰乱社会秩序的; (八)造成其他严重后果的。 第五条 拒不履行信息网络安全管理义务,致使影响定罪量刑的刑事案件证据灭失,具有下列情形之一的,应当认定为刑法第二百八十六条之一第一款第三项规定的“情节严重”: (一)造成危害国家安全犯罪、恐怖活动犯罪、黑社会性质组织犯罪、贪污贿赂犯罪案件的证据灭失的; (二)造成可能判处五年有期徒刑以上刑罚犯罪案件的证据灭失的; (三)多次造成刑事案件证据灭失的; (四)致使刑事诉讼程序受到严重影响的; (五)其他情节严重的情形。 第六条 拒不履行信息网络安全管理义务,具有下列情形之一的,应当认定为刑法第二百八十六条之一第一款第四项规定的“有其他严重情节”: (一)对绝大多数用户日志未留存或者未落实真实身份信息认证义务的; (二)二年内经多次责令改正拒不改正的; (三)致使信息网络服务被主要用于违法犯罪的; (四)致使信息网络服务、网络设施被用于实施网络攻击,严重影响生产、生活的; (五)致使信息网络服务被用于实施危害国家安全犯罪、恐怖活动犯罪、黑社会性质组织犯罪、贪污贿赂犯罪或者其他重大犯罪的; (六)致使国家机关或者通信、能源、交通、水利、金融、教育、医疗等领域提供公共服务的信息网络受到破坏,严重影响生产、生活的; (七)其他严重违反信息网络安全管理义务的情形。 第七条 刑法第二百八十七条之一规定的“违法犯罪”,包括犯罪行为和属于刑法分则规定的行为类型但尚未构成犯罪的违法行为。 第八条 以实施违法犯罪活动为目的而设立或者设立后主要用于实施违法犯罪活动的网站、通讯群组,应当认定为刑法第二百八十七条之一第一款第一项规定的“用于实施诈骗、传授犯罪方法、制作或者销售违禁物品、管制物品等违法犯罪活动的网站、通讯群组”。 第九条 利用信息网络提供信息的链接、截屏、二维码、访问账号密码及其他指引访问服务的,应当认定为刑法第二百八十七条之一第一款第二项、第三项规定的“发布信息”。 第十条 非法利用信息网络,具有下列情形之一的,应当认定为刑法第二百八十七条之一第一款规定的“情节严重”: (一)假冒国家机关、金融机构名义,设立用于实施违法犯罪活动的网站的; (二)设立用于实施违法犯罪活动的网站,数量达到三个以上或者注册账号数累计达到二千以上的; (三)设立用于实施违法犯罪活动的通讯群组,数量达到五个以上或者群组成员账号数累计达到一千以上的; (四)发布有关违法犯罪的信息或者为实施违法犯罪活动发布信息,具有下列情形之一的: 1.在网站上发布有关信息一百条以上的; 2.向二千个以上用户账号发送有关信息的; 3.向群组成员数累计达到三千以上的通讯群组发送有关信息的; 4.利用关注人员账号数累计达到三万以上的社交网络传播有关信息的; (五)违法所得一万元以上的; (六)二年内曾因非法利用信息网络、帮助信息网络犯罪活动、危害计算机信息系统安全受过行政处罚,又非法利用信息网络的; (七)其他情节严重的情形。 第十一条 为他人实施犯罪提供技术支持或者帮助,具有下列情形之一的,可以认定行为人明知他人利用信息网络实施犯罪,但是有相反证据的除外: (一)经监管部门告知后仍然实施有关行为的; (二)接到举报后不履行法定管理职责的; (三)交易价格或者方式明显异常的; (四)提供专门用于违法犯罪的程序、工具或者其他技术支持、帮助的; (五)频繁采用隐蔽上网、加密通信、销毁数据等措施或者使用虚假身份,逃避监管或者规避调查的; (六)为他人逃避监管或者规避调查提供技术支持、帮助的; (七)其他足以认定行为人明知的情形。 第十二条 明知他人利用信息网络实施犯罪,为其犯罪提供帮助,具有下列情形之一的,应当认定为刑法第二百八十七条之二第一款规定的“情节严重”: (一)为三个以上对象提供帮助的; (二)支付结算金额二十万元以上的; (三)以投放广告等方式提供资金五万元以上的; (四)违法所得一万元以上的; (五)二年内曾因非法利用信息网络、帮助信息网络犯罪活动、危害计算机信息系统安全受过行政处罚,又帮助信息网络犯罪活动的; (六)被帮助对象实施的犯罪造成严重后果的; (七)其他情节严重的情形。 实施前款规定的行为,确因客观条件限制无法查证被帮助对象是否达到犯罪的程度,但相关数额总计达到前款第二项至第四项规定标准五倍以上,或者造成特别严重后果的,应当以帮助信息网络犯罪活动罪追究行为人的刑事责任。 第十三条 被帮助对象实施的犯罪行为可以确认,但尚未到案、尚未依法裁判或者因未达到刑事责任年龄等原因依法未予追究刑事责任的,不影响帮助信息网络犯罪活动罪的认定。 第十四条 单位实施本解释规定的犯罪的,依照本解释规定的相应自然人犯罪的定罪量刑标准,对直接负责的主管人员和其他直接责任人员定罪处罚,并对单位判处罚金。 第十五条 综合考虑社会危害程度、认罪悔罪态度等情节,认为犯罪情节轻微的,可以不起诉或者免予刑事处罚;情节显著轻微危害不大的,不以犯罪论处。 第十六条 多次拒不履行信息网络安全管理义务、非法利用信息网络、帮助信息网络犯罪活动构成犯罪,依法应当追诉的,或者二年内多次实施前述行为未经处理的,数量或者数额累计计算。 第十七条 对于实施本解释规定的犯罪被判处刑罚的,可以根据犯罪情况和预防再犯罪的需要,依法宣告职业禁止;被判处管制、宣告缓刑的,可以根据犯罪情况,依法宣告禁止令。 第十八条 对于实施本解释规定的犯罪的,应当综合考虑犯罪的危害程度、违法所得数额以及被告人的前科情况、认罪悔罪态度等,依法判处罚金。 第十九条 本解释自2019年11月1日起施行。[详情]
新浪财经讯 9月27日消息,财新旗下自媒体“金融混业观察”昨晚发文称,知名大数据公司同盾科技有限公司(下称“同盾科技”)爬虫类产品“数聚魔盒”负责人被查。同时,有媒体表示,同盾科技两位高管童保华和徐斐失联,并指同盾接入的高炮平台有上千家,自己运营的高炮平台也有十几家。 对此,同盾科技今日发布声明公开回应,并表示,信川科技总经理徐斐“为配合警方调查曾经服务的某第三方单位,正积极协助警方调查取证”。 信川科技回应高管被带走 今日上午,同盾科技在微信公众号上回应称,杭州信川为独立运营的法人实体,不涉及金融业务、不引流、不放贷。数聚魔盒为杭州信川旗下的独立品牌产品,在进入条件与适用场景上均有严格的授权要求与限制。为积极响应国家关于个人信息保护的相关政策和最新要求,杭州信川自2018年开始已逐步调整业务,截止目前已全部终止相关服务。 同时,同盾科技回应新浪财经称,徐斐为信川科技总经理,为配合警方调查曾经服务的某第三方单位,正积极协助警方调查取证,以协助相关部门查清该单位的情况。 至于该第三方单位是哪一家,同盾科技表示,“ 可能属于监管部门的保密信息,以监管部门对外披露信息为准。” 公开信息显示,数聚魔盒主要涉及数据采集流程,支持爬取数据用作信用评估。此前其宣传文章中曾如此介绍该产品,“依托同盾科技强大的技术能力和数据积累,数聚魔盒面向各行各业的客户对数据和智能决策的需求,推出了不同的服务及解决方案。” 天眼查信息显示,杭州信川科技有限公司正是“数聚魔盒”的运营主体。信川科技成立于2016年5月,注册资本500万元,徐斐为法定代表人,同盾控股有限公司为全资控股股东,同盾科技创始人兼CEO蒋韬为实控人。就在今年6月26日,信川科技法定代表人才由同盾科技创始人兼CEO蒋韬变为徐斐。 爬虫类数据服务商相继“出事 ” 不久前,魔蝎科技 CEO 周江翔、新颜科技 CEO 黄向前以及公信宝项目方,先后被警方带走调查。据报道,魔蝎科技被传因涉嫌侵犯公民个人信息。 9月16日,又有消息传出,同盾科技已解散其爬虫部门,该部门员工集体待岗。 尽管同盾科技随后迅速发文辟谣,但十天之后,同盾科技旗下的爬虫业务负责人也“出事”了。 值得注意的是,“数聚魔盒”已经在2018年下半年开始逐步收缩,2019年彻底停止。该部门的员工也调岗到其他部门,正常上班。而公开资料显示,本次被传带走调查的两个人,童保华2016年加入同盾,历任同盾旗下产品“数据魔盒”商务管理、同盾数据魔盒负责人,2018年9月开始担任同盾数据魔盒负责人,曾任杭州信川科技业务总经理,目前已离职。 面对近期处于风口浪尖的爬虫技术,同盾科技表示,“爬虫是互联网中广泛应用的技术。从技术本身而言具有中立性,但技术的应用应以严格遵照法律法规与监管要求为前提。” 附:信川科技回应 [详情]
原标题:数聚魔盒到底怎么回事,同盾第二次出来辟谣了 作者:李勤 上次,雷锋网带你了解了“爬虫”业务的动荡:魔蝎科技 CEO 周江翔、新颜科技 CEO 黄向前以及公信宝项目方,先后被警方带走调查。其中,魔蝎科技被传因涉嫌侵犯公民个人信息,涉及爬虫类的数据服务商瑟瑟发抖。 9月16日,剧情更新第一波:杭州大数据公司同盾科技有限公司(以下简称“同盾科技”)被造谣已解散其爬虫部门,该部门员工集体待岗,同盾科技实控人兼 CEO 蒋韬已出国“跑路”,并且魔蝎科技以及新颜科技被查是同盾科技举报的。 第二天(9月17日),同盾科技向雷锋网(公众号:雷锋网)证实,上述说法均为谣言,并发出了一份辟谣声明。这则声明指出,同盾科技创始人蒋韬一直在国内照常处理公司事务,数聚魔盒已经停止相关业务,员工调整至其他岗位,举报则是无中生有。 蒋韬都被逼得发了一封公开信,再次辟谣。 据企查查信息,数聚魔盒为杭州信川科技有限公司所有,该公司由同盾控股有限公司百分百持有股权,同盾科技则是国内智能风控和分析决策服务提供商。 9月27日,同盾科技又来了一封声明,专门对“数聚魔盒”进行说明。 有三点关键信息: 1、同盾科技称,杭州信川为独立运营的法人实体,不涉及金融业务、不引流、不放贷。 2、为配合警方调查曾经服务的某第三方单位,杭州信川及有关人员正积极协助警方调查取证,以协助相关部门查清该第三方单位的情况。 3、跟同盾科技没关系,如果客户有违规违法行为,同盾科技即刻主动终止相关合作。 具体信息如下: [详情]
来源:皂话金融 近期,关于大数据公司接连被调查的问题再次发酵,金融整治已经“入木三分”。值得一提的是,几个行业热点和新闻,虽然表面上看似没有联系,但是从金融业务的角度出发,却暗含了多重的信号。 从政策表象上来看,网贷逃废债人群未来将要上征信、信用卡业务收紧、浙江监管全面整顿个人消费信贷业务、以及大数据公司、贷款超市被查……这一切都是有内在联系的。 昨天,人民银行相关领导也表示:人民银行将多措并举推动金融科技健康发展,建立健全金融科技监管体系,加强金融科技创新产品监管,为金融科技创新产品划定刚性法律底线,设置柔性管理边界;强化个人金融信息保护,严防个人金融信息的泄露、篡改和滥用,平衡好金融服务便捷和安全的关系;加强监管科技应用,防范新技术应用的风险。 从监管的表态中可以明显看出,虽然鼓励金融科技的发展,但是金融科技的发展不能触碰法律红线。尤其是对强化个人信息、滥用、泄露个人信息,要严防死守。说到底,金融科技的发展、数据的应用,应该建立在个人隐私保护上,金融科技是工具,不能当做“商品”来买卖。 据21世纪经济报道:近日多家城商行、农商行暂停了大数据风控合作业务。而一家智能大数据风控机构负责人透露,近期,多家涉及爬虫技术的大数据风控机构被调查。大数据风控平台遭遇的风波,进一步波及到助贷机构。同时一家助贷机构负责人坦言,由于流量成本居高不下,助贷领域的导流业务已入不敷出。 牵一发而动全身。 大数据风控行业是否已经进入“黄昏”?在金融风险整治不断深化的大背景下,大数据、金融科技应当如何的发展?未来,依托网络来进行的现金贷、助贷业务又将何去何从?通过以上的信息,我们来分析一下。 一、今日之“祸”并非偶然 2017年12月,《关于规范整顿“现金贷”业务的通知》下发。在这份对“现金贷”、“助贷”的监管政策中曾经提到: (四)各类机构应坚持审慎经营原则,全面考虑信用记录缺失、多头借款、欺诈等因素对贷款质量可能造成的影响,加强风险内控,谨慎使用“数据驱动”的风控模型,不得以各种方式隐匿不良资产。 谨慎使用“数据驱动”的风控模型,监管虽然没明确说,“谨慎”二词也是表达了一个潜在的含义,说的通俗一点就是“小心点”。起码,监管没说鼓励使用大数据风控。 二、同出一源,同坐一船 从业务上来看,大数据风控公司和网络贷款类公司是坐在同一条船上。此前,金融整治不断深化,监管机构和公安部门在今年开展联合行动,对“套路贷”进行严厉打击。尤其是今年315晚会 集中曝光了一批“线上借款公司”,这些所谓的“贷款超市”、“借款APP”,或多或少都存在“套路贷”、“高利贷”。 大数据风控能够给线上借款平台解决的就是“异地风控”问题。所以,大数据风控公司深深的绑定在了线上贷款企业身上。如果贷款企业出现问题,踩红线、违法违规,一旦遭到监管或者警方的调查,大数据公司向其提供数据源、提供风控服务,其实是掌握了整个借贷流程中借款人的核心信息。 目前的网络贷款公司从业务模式上可以分为:P2P、助贷、现金贷、消费金融。其中,消费金融类大多都是持牌机构,并且有一定的“消费品”、“场景化”作支撑。同理,助贷公司也具备一定的“场景”,对消费品进行分期付款。然而,不同的是,助贷公司的本身资质参差不齐,有的具备独立数据、独立风控,有的风控和数据并非是自己的,而是借助其他第三方来完成。 三、服务于类金融的第三方或将被“严管” 不管是之前的支付行业,还是如今的大数据行业,都进入了整治、整顿、收紧的状态。这二者之虽然提供的业务形式不同,但是有一个共同点:对类金融机构(网络贷款)提供技术支持。 在此之前,支付公司因为接入“套路贷”、“高炮”平台,并且为其提供“委托划扣协议”,导致借款人在无授权、不知情的情况下进行“强行划扣”,这种行为不仅仅违背了相应的金融条款、政策法规,侵害借款人应有的权利,也在一定程度上触碰了法律的红线。 所以,支付整治完后,又牵扯到了大数据风控公司,那些违法借贷的“左膀右臂”将被砍断。未来,服务于类金融机构的第三方或将被“严管”。 拿私募基金来举例。一般来讲,证券私募类也有“委托”业务,委托证券公司进行“估值核算”、“PB数据”。证券公司在其中扮演的是一个“第三方”角色(那两方为投资者、私募基金公司)。 值得一提的是,证券私募基金在产品备案过程中,需要提交相应的委托外包方资质。也就是说,我的第三方是谁、提供了哪些服务、进行了哪些业务,都要向监管报备,并且向监管提交相应的协议。并且,相关证券公司也必须具备相应的“委托管理”、“托管”资质。 从这个例子中不难看出,类金融的委托业务,应在监管的进行下完成。目前的大数据风控公司、支付公司,虽然有的持有一定的牌照,但是委托业务并不在监管监督范围之列,其委托模式、运作方式、产生什么样的服务,也不在监管控制之列。 然而,这一问题又引出来大数据公司另外一个问题:归根到底,是业务模式的问题,你到底是一家什么公司? 四、你说你是金融科技,你科技在哪儿 行业发展态势看,目前的大数据公司或者说金融科技公司有以下几种形态: 第一、只是提供数据支持不参与金融业务,本身不经营金融产品。从表面来看,符合央行对在金融科技规划纲要的定义。然而,如果只是提供数据,输出的只是点,并没有形成完整的科技产品,也没有打通被服务人的业务条线。 第二、数据公司,本身对外提供大数据、风控支持,旗下也有自己的金融产品。大家可以理解为开烧锅酿酒,自己喝着还往外卖着。给人一种近水楼台先得月的感觉,你说他是金融科技吧,确实有一定技术;你说他不是金融科技吧,也对,自己还对外放款,干着借贷业务。 第三、以消费金融、助贷或者线上放款为主营业务模式,本身有用自己的技术和大数据风控。这类公司基本上是P2P或者网贷平台转型后,衍生出来的“金融科技模式”。目前,这种“金融科技”尚处在初级阶段,还没有形成一定的生态,也没有形成有效的金融科技产品和成熟的技术。 这样分析一下大家都应该清楚了。那么,现在风险最大的就是第一种完全提供数据的公司。虽然本身并没有涉及到金融业务本身,但是服务方如何涉及到了违法违规放贷,同样作为数据提供者,也要承担相应的责任。 弄清楚这个问题,接下来的问题将会迎刃而解。现在的金融科技公司确实“鱼龙混杂”,但看名称就能看得出来,有的叫“科技公司”、“数科公司”、“金科公司”。根据央行金融科技规划纲要来看,只要你存在放贷业务,你怎么说也不是一家金融科技公司。当然,不否认你有金融科技,但是只限于你业务层面有,主营并不是金融科技。 所以,还请大家清楚,有些公司虽然改名叫金融科技、数科,但是依然从事着线上放贷业务,这根本不跟金融科技沾边。 综上所述,金融科技的发展虽然在起步阶段,监管也表达了鼓励金融科技的发展,但是要在法律法规下良性发展。虽然已经出台相关的规划和布局,但是金融科技的具体政策也要不断细化。 五、金融科技政策应细化 监管部门已经汲取了互金行业的发展的“教训”,在源头上开始规范金融科技的发展。从监管释放出的信号来看,金融科技的细则也将会落地。那么,不管是大数据风控还是数据提供方还有助贷、消费金融,如何去界定?如何让金融科技变得更清晰,是监管部门应该重点考虑的问题。 金融科技的发展,能够有效的防范金融风险发生。但是,现阶段很多“假借”金融科技之名的公司却在让风险加大。随着金融政策的不断完善、个人隐私保护的逐渐加强,冥冥之中,大数据风控公司已经从神坛跌落,黄昏将至,深秋已来。[详情]
“爬虫”凶猛,大数据风控平台“黑幕”调查 文|吕笑颜 石丹 作为现金贷风控的关键一环,第三方大数据公司在近几年可谓风生水起。但由于数据的授权、来源、用途十分不透明,导致的隐私侵权、数据滥用等问题越来越严重。 第三方大数据风控服务平台正“风声鹤唳,草木皆兵”。 9月16日晚,一篇名为《同盾科技爬虫部门解散,无意间掀起行业整治风暴》的文章在业内疯转,文章直指知名大数据风控平台——同盾科技有限公司(下称“同盾科技”)举报杭州魔蝎数据科技有限公司(下称“魔蝎科技”)与上海新颜人工智能科技有限公司(下称“新颜科技”),引发了这次大数据行业风波。 就在9月初,魔蝎科技、新颜科技两家大数据风控服务商相关人员被警方带走,随后第三方数据服务公司聚信立、杭州有盾网络科技有限公司(下称“有盾”)、北京天机数测数据科技有限公司(下称“天机数据”)等纷纷暂停爬虫服务。 9月11日,大数据服务商上海诚数信息科技有限公司(聚信立)被爆为积极迎合国家监管,暂停对外提供用户授权的运营商爬虫业务。 紧接着,公信宝的运营主体——杭州存信数据科技有限公司办公地被警方贴上封条。大概率是因为“爬虫业务和数据”。 9月12日,业界再爆天翼征信有限公司(下称“天翼征信”)的多位高管及员工被警方带走。 有知情业内人士向记者透露:“公安部门正开展数据安全的专项整顿,而这一切的根源则是7.14高炮、现金贷平台的催收案件调查。” 那么,第三方数据公司在其中扮演了什么角色?爬虫业务是如何“助力”催收乱象的? 目前,第三方数据服务公司纷纷暂停爬虫业务谨慎“观望”。什么才是第三方风控平台该有的健康的商业模式、未来行业如何良性发展等,仍有待监管与平台不断“磨合”。 “风控独角兽”深陷囹圄? 上述名为《同盾科技爬虫部门解散,无意间掀起行业整治风暴》的文章引述“同盾内部知情人士”的话,爆出“同盾科技爬虫部门集体待岗、同盾科技实控人兼CEO蒋韬出国避风头”等重磅内幕。 文章发布次日,蒋韬在公众微信号“智能风控联盟”上发布了《心存敬畏向善而行》一文进行回应。 对于文章所述之事,同盾科技相关负责人9月19日在接受《商学院》记者采访时表示:“该报道中涉及同盾的多处失实,原发文章作者已经自行删除,同盾创始人蒋韬也已经发布公开信表示‘心存敬畏,向善而行’,蒋韬先生一直在国内照常处理公司事务,一切业务正常开展。9月18日蒋韬在杭州接待富民银行到访,所谓‘跑路,出国避风头’已经不攻自破。” 该负责人还表示,“作为已经成为智能分析领域独角兽的同盾科技,在市场上产品和技术早已经有口皆碑,完全没有必要牺牲自己的羽毛做举报之事。一直以来同盾以领先、可靠的产品立足于市场,服务于客户,坚持良性竞争,任何时候均未考虑以不正当手段与友商竞争。” 不过,据某头部风控平台高层分析,“相比而言,同盾科技的业务风格比较激进。” 据企查查显示,同盾科技成立于2012年10月10日,为国内第三方大数据风控服务提供商。其中,蒋韬为法定代表人、创始人及高管。资料显示,蒋韬在取得复旦大学计算机软件和理论硕士学位后加入IBM全球化研究院,2009年加入阿里巴巴担任安全部技术总监,随后创立同盾科技。据官网显示,同盾科技入选了全球知名创投研究机构CB insights 2018年5月发布的全球Fintech“独角兽”榜单。 据悉,同盾科技子公司杭州信川科技有限公司(下称“信川科技”)旗下有数聚魔盒品牌。据公开报道,数聚魔盒是基于云平台、云计算、机器学习等技术,通过数据采集能力和数据挖掘能力,对用户进行风险评估,帮助企业客户深度剖析其用户的诚信画像。该报道还指出,凭借团队多年积累的爬虫技术经验,魔方产品的基础平台能够支持每天千万级的调用量,和上千个数据源的服务能力。 关于爬虫业务,以及爬虫部门已解散、该部门员工集体待岗等情况,相关负责人对记者表示:“信川科技自2018年开始已逐步调整业务,截至目前已全部停止相关服务。调整过程中相关员工均已正常调整至其他岗位,目前均正常工作。” 停业观望,爬虫助“现金贷”催收 对于此次行业风波,上述业内人士向记者透露:“公安部门正开展数据安全的专项整顿,而这一切的根源则是7.14高炮、现金贷平台的催收案件调查,这些案件的调查引起了他们对数据信息的注意。”上述头部风控平台高层透露:“此次事件主要是爬虫服务涉及的数据方面。其实在被查的几家公司里,只有魔蝎科技的数据几乎全是依靠爬虫技术,其他两家其实本身是有自己的数据的。” 据此,事发次日,魔蝎科技官网已无法打开。据多家合作机构反馈,他们与魔蝎科技的服务突然被终止,魔蝎科技提供的账号也已无法登录。 据企查查信息显示,杭州魔蝎数据科技有限公司成立于2016年1月,法定代表人为周江翔,注册资本1000万元人民币。其主要业务是提供精准营销模型、反欺诈、多维度用户画像、授信评分、贷后预警、催收智能运筹等全面风险管理服务。此前,曾先后获得MFund魔量资本、邦盛科技投资。 关于魔蝎科技被调查的原因,据多位业内人士猜测,或与数据抓取业务涉嫌侵犯隐私、助力暴力催收有关。 据官网显示,截至目前,魔蝎科技已为国内多家银行、保险机构、消费金融、互联网金融等超过2000家企业提供了相关金融风控产品和服务,累计服务用户数更是超过了1亿。 事实上,在2017年11月8日,文章《爬虫凶猛:爬支付宝、爬微信、窃取现金贷放贷数据》就对大数据行业的“同业爬虫”产品直接将其他现金贷平台的放款额和风控数据爬取出来做风控,显露出了担忧。文章甚至特别点名称魔蝎科技开发的“同业爬虫”产品是“窃取别人家的劳动成果,太野蛮”。 除了涉嫌利用技术手段侵犯用户隐私、买卖公民个人信息外;魔蝎科技还涉嫌自营现金贷业务,其对外投资了杭州信邦科技有限公司,后者曾发布现金贷产品信邦贷和现金分期云平台。 针对被调查原因、为现金贷公司提供风控服务时抓取的主要信息、运营状况及转型规划问题,记者试图联系魔蝎科技方面,不过,多个电话并未有人接听,记者向对方发去采访函,截至发稿,并未获得回复。 在魔蝎科技遭调查传闻不到一周,同业公司聚信立也被传遭警方上门调查。 据企查查显示,聚信立隶属于上海诚数信息科技有限公司,据官网显示,该公司成立于2013年7月,是专注大数据智能解决方案的服务商,主要为银行、保险、消费金额公司、贷款机构等提供智能风控、风险分析、信用分析、多头借贷、风控建模等一站式风控技术解决方案。 据悉,近日聚信立曾向商户下发通知称,为积极响应国家日益收紧的监管政策,保证所有商户业务运作的合法合规,聚信立将对现有的业务板块作出如下调整:2019年9月6日23时起,聚信立将暂停对外提供用户授权的运营商爬虫服务。 针对暂停爬虫服务的原因、为现金贷平台提供大数据风控服务时抓取的信息、此次风波的影响等问题,记者联系聚信立方面,不过,截至发稿,并未得到明确回复。 爬虫服务到底犯了什么错? 据百度百科显示,所谓“爬虫”其实是一个自动提取网页的程序,其按照一定的规则,自动抓取互联网信息并存储到自身数据库的程序或者脚本。在用户授权后,风控数据提供商可通过后台“爬虫”搜集信息,将通话信息、消费数据等互联网信息整合标准化,最终形成对借款人的综合评估,供金融机构做相应的后续决策。 在金融风控行业,爬虫业务曾被广泛使用。它可以帮助风控机构进行信息整合、勾勒人群画像,起到防范风险的作用。不过,有些机构却借此窃取用户手机号等个人信息,并服务于高利贷、暴力催收等违法行为,使得爬虫技术面临“是否经过用户授权、是否存在过度爬取信息、爬取到的信息用途不明”等诸多争议。 据上述头部风控平台高层表示:“其实,爬虫服务本身如果在客户充分授权的前提下是可以用的,但是因为像一些第三方数据平台使用爬虫时,他们的数据来源往往说不清。更加严重的是,这些由爬虫获取的数据,会被一些比较下沉的金融平台拿去做一些涉及暴力催收的事情。” 而此次聚信立等停业或被查的大数据公司,客户主要为消费金融机构和现金贷企业。 作为现金贷风控的关键一环,第三方大数据公司在近几年可谓风生水起。但由于数据的授权、来源、用途十分不透明,导致的隐私侵权、数据滥用等问题越来越严重。 据上述头部风控平台高层透露,爬虫技术一般所采集的信息包括:公开的第三方数据;抓取用户主动授权的个人基本信息、联系人信息、银行卡信息等数据;授权抓取数据,如设备号、IP地址、运营商/电商等用户授权后合规采集数据;经授权的平台数据,如用户在平台的历史借款、还款情况等用户已在注册协议或隐私协议中授权业务方进行分析的数据。 在他看来,目前爬虫数据不合法的行为表现在数据来源和数据用途方面,“数据来源不合法,就是在没有收到客户的授权的情况下去爬取这些数据;数据用途方面,就是爬取的数据最后通过什么渠道使用的,比如借助地理位置或联系人的信息进行催收。不断出现的暴力催收血案,也最终指向了这些爬取数据的公司。” 在监管态势逐渐趋紧的背景下,第三方大数据公司纷纷作出反应:目前,同盾科技、魔蝎科技、天机数据、有盾、聚信立、深圳白骑士大数据有限公司(下称“白骑士”)等多家公司都已经主动或被动地停止了相关“爬虫”业务。 据上述知情业内人士表示,监管或有意从源头整顿数据行业,90%的服务商都将暂停爬虫业务,即便能活下来也必须要转型,基本只能服务于银行和持牌玩家了。 第三方风控平台数据之困 按照上述逻辑,随着监管信号的不断释放,野蛮生长的大数据收集时代进入冷静期。那么,受到影响不只是独立的第三方数据公司,所有自身不产生数据而又高度倚赖数据的商业模式可能都将面临艰难的处境。例如,金融科技公司、人工智能公司等等。 模型没有了数据的持续“喂养”,又将如何迭代实现不断优化呢? 从长远来看,在缺少了上游数据服务商以及其所提供的数据服务之后,那些缺乏风控能力的中小现金贷平台、网贷平台们势必受到影响。 实际上,细查此次数据公司的合作伙伴名单,可以看到的是,目前他们的合作对象不仅包括现金贷、P2P平台,消费金融公司甚至全国性银行都已经在其名单之列。 那么,如何整肃现金贷爬虫技术涉嫌侵犯隐私的产业链? 在上述头部风控平台高层看来,应当尽快制定完善针对网络爬虫的数据安全法律法规,将网络爬虫引向合法轨道。若是违法进行网络爬虫,就要重拳出击,加大惩罚力度和侦查力度,涉及刑事犯罪的要重点处理。 在上述业内人士看来,未来监管环境会越来越严格,他说:“未来监管对于灰色地带的法律执行会更加严格,如必须获得用户的授权;授权必须是一次性的,不许插次和间歇等。其实,原本这块的法律就存在,只是执行单位没有较真,现在确实是认真执行了。下一步有可能出现类似于互联网金融协会,或者一些‘国家队’,由国家牵头,把大的实力比较强的头部企业拉出来,组成风控联盟,这符合中国的国情。” 不过,他认为这个过程是有阻力的,“按照现在的情况来看,最大的阻力是由谁来牵头、未来行业自律如何规范,这其中需要不断地博弈,如什么样的数据能用、授权到什么样的程度,这个平衡是很难的。” 据悉,近几年大数据风控市场主要有三类玩家:一是传统征信公司,如人行征信、鹏元征信、前海征信,为“国家队”;二是同盾科技、百融金服(全称“百融金融信息服务有限公司”,现已更名为“百融云创科技股份有限公司”)等新兴垂直类大数据风控公司,主要采集、整合各类基础数据进行大数据风控,为银行、互联网金融机构等提供风控模型和数据,并且逐渐积累了一些网贷数据积累;三是蚂蚁金服、腾讯金融科技以及度小满金融这类互联网巨头公司,主要基于自身生态链的电商、社交、搜索数据,形成风控产品和数据输出能力。 当前,P2P行业持续出清的过程中,各家企业都在寻求转型,随之而来的是风控服务的行业竞争将加剧。 在上述头部风控平台高层看来,在激烈的竞争中,数据服务商的核心竞争力还是数据,最重要的能力是获取丰富的数据源,以及构建精准的风控模型。因此,必须与各类拥有数据的机构建立深度合作,获取丰富的或者独家数据来源,才能屹立不倒。 那么,如今监管不断加强的态势下,想要随意地获取信息势必会越来越难,风控服务商们原本的商业逻辑是否需要转变? 据上述头部风控平台高层表示,实际上,目前第三方风控服务商的商业模式面临诸多矛盾之处。由于没有个人征信牌照,很多第三方风控服务商对外宣称不收集、留存客户数据,与其他机构合作仅提供风控模型输出。但是,好的风控模型需要不断优化,这需要掌握客户的多维度、大批量数据。因此,在未经客户许可的情况下,很多第三方风控服务商是没有资格查看个人客户的征信信息的,而这样风控模型就无法优化。所以说,部分风控服务商的商业模式值得商榷,需要进一步调整,否则政策风险较大。 那么,未来风控公司好的商业模式是什么?如何做到既符合监管标准,也符合科学的发展路线,有创新、既“利他”又“利己”呢? 上述头部风控平台高层表示:“好的商业模式,只有金融科技公司一方努力是不够的,以美国的市场为例,需要监管层、相关的法律法规来约束市场参与者的行为,包括服务使用方和服务提供方,同时,监管层需要对什么东西可用、什么东西不可用、该怎么用,都应该有一个明确的规定、要求,这样大家就可以在合规的情况下,在遵守游戏规则的前提之下参与竞争,这样才有利于市场的繁荣发展。在此基础之上,金融科技公司应该在框架约束之内,尽可能地探索、在技术上做一些创新,然后更有效地识别风险。” 近一两年来,P2P暴雷潮与互联网金融监管趋严导致第三方风控机构的客户数量锐减,它们已经逐渐将服务重心转移到银行等传统金融机构方面。不过,在上述头部风控平台高层看来,转型传统金融机构的前期依旧是有数据,他说:“跟银行合作,仍然需要用训练出来的这些数据产生评分,没有这些数据产生评分,银行业不会跟你合作。如果没有数据,那么只能输出技术,比如教银行怎么建模,这个空间是非常有限的。” 第三方大数据风控平台究竟要如何发展,《商学院》将持续关注。[详情]
新浪财经讯 9月27日消息,财新旗下自媒体“金融混业观察”昨晚发文称,知名大数据公司同盾科技有限公司(下称“同盾科技”)爬虫类产品“数聚魔盒”负责人被查。同时,有媒体表示,同盾科技两位高管童保华和徐斐失联,并指同盾接入的高炮平台有上千家,自己运营的高炮平台也有十几家。 今日上午,同盾科技在微信公众号上回应称,杭州信川为独立运营的法人实体,不涉及金融业务、不引流、不放贷。数聚魔盒为杭州信川旗下的独立品牌产品,在进入条件与适用场景上均有严格的授权要求与限制。为积极响应国家关于个人信息保护的相关政策和最新要求,杭州信川自2018年开始已逐步调整业务,截止目前已全部终止相关服务。 同时,同盾科技表示,为配合警方调查曾经服务的某第三方单位,杭州信川及有关人员正积极协助警方调查取证,以协助相关部门查清该第三方单位的情况。 天眼查信息显示,杭州信川科技有限公司正是“数聚魔盒”的运营主体。信川科技成立于2016年5月,注册资本500万元,徐斐为法定代表人,同盾控股有限公司为全资控股股东,同盾科技创始人兼CEO蒋韬为实控人。 值得注意的是,就在今年6月26日,信川科技法定代表人才由同盾科技创始人兼CEO蒋韬变为徐斐。 公开资料显示,童保华2016年加入同盾,历任同盾旗下产品“数据魔盒”商务管理、同盾数据魔盒负责人,2018年9月开始担任同盾数据魔盒负责人,曾任杭州信川科技业务总经理,目前已离职。 [详情]
原标题:爬虫业务负责人被查?!同盾科技回应了 记者:黄鑫宇 陈鹏 继9月中旬同盾首次发布关于其爬虫业务声明后,今日再次就其爬虫业务及相关负责人被查事宜,公开回应。 新京报讯 据媒体9月26日晚的报道,知名大数据公司同盾科技有限公司(下称“同盾”)爬虫类产品“数聚魔盒”负责人被查。9月27日,同盾官方就此做以回应,称“为配合警方调查曾经服务的某第三方单位,杭州信川(即“杭州信川科技有限公司”)及有关人员正积极协助警方调查取证,以协助相关部门查清该第三方单位的情况。”天眼查显示,杭州信川科技有限公司正是“数聚魔盒”的运营主体。 同盾9月27日的《关于杭州信川科技有限公司相关情况的公开声明》全文如下: 近日,网络上出现有关杭州信川科技有限公司(以下称“杭州信川”)的舆论内容,为避免不实谣传和恶意攻击,为接受行业及媒体公众的监督,为更好地服务社会及广大客户,同盾科技有限公司(以下称“同盾科技”)特此声明: 1、杭州信川为独立运营的法人实体,不涉及金融业务、不引流、不放贷。 数聚魔盒为杭州信川旗下的独立品牌产品,在进入条件与适用场景上均有严格的授权要求与限制。为积极响应国家关于个人信息保护的相关政策和最新要求,杭州信川自2018年开始已逐步调整业务,截至目前已全部终止相关服务。 2、为配合警方调查曾经服务的某第三方单位,杭州信川及有关人员正积极协助警方调查取证,以协助相关部门查清该第三方单位的情况。 3、同盾科技是国内第三方智能风控与分析决策技术服务提供商,专注于科技赋能。作为涉金融服务的数据分析行业的头部企业,同盾科技严格遵照法律法规与监管要求开展个人信息保护及相关合规工作。在企业内部,同盾科技已参照法律法规及相关国家标准的要求,积极制定了应用系统全生命周期安全管理流程、同盾安全风险管理流程、产品合规内部指引、同盾员工行为安全准则、同盾科技员工商业行为准则红线等几十条巨细靡遗的安全规范制度。针对合作客户,同盾科技有着严格的准入筛选和退出机制,一旦发现客户存在违规违法行为,同盾科技即刻主动终止相关合作。 同盾科技1300位员工,依然相信并且坚持心存敬畏,向善而行,呼吁行业良性竞争,为金融风险管控和维护金融体系稳定贡献绵薄之力,共同创造更大的商业和社会价值! 9月26日晚间,据财新的报道,同盾科技爬虫业务负责人被查。与前几轮整治不同,这轮带走的不乏CEO之类的公司高管。 在此之前的11天前,即9月16日晚间,曾网传同盾爬虫部门解散以及创始人CEO蒋韬“跑路”等消息。 同盾9月17日曾发布辟谣声明。声明称,CEO蒋韬近日一直在国内处理公司事务。涉及爬虫技术的产品数聚魔盒为子公司杭州信川科技有限公司独立运营产品。为响应个人信息保护政策,目前杭州信川科技有限公司已停止相关服务,员工已正常调岗。蒋韬也发表微信公号文章《心存敬畏 向善而行》,称“我在杭州,一切安好”。 9月6日,多家媒体报道称大数据公司杭州魔蝎数据科技有限公司,被警方调查。随后,数家大数据公司传闻高管被警方带走协助调查。[详情]
记者 柴刚 同盾科技相关负责人向财联社记者确认,公司旗下爬虫业务负责人童保华、徐斐系配合警方调查曾经服务的某第三方单位,具体带走时间不清楚。另有消息称,同盾科技实控人蒋韬被有关方面要求近期不得离开杭州,该人士称“这个没有”。同盾科技系国内领先的大数据风控机构、金融科技独角兽企业。公司称,旗下从事爬虫业务的子公司自2018年开始逐步调整业务,目前已全部终止相关服务。[详情]
原标题:确认!同盾爬虫业务相关高层配合调查中,独家披露同盾近3年业绩 作者:小慧吖 大数据风控行业风波持续不断。9月26日,财新传媒旗下“金融混业观察”报道称,同盾科技爬虫类产品“数聚魔盒”负责人被查。同时有消息称,此次同盾科技业务相关高管童保华、徐斐已失去联系。 今日上午,同盾科技官方已确认这两位人士的确正在配合警方调查。 公开资料显示,童保华2016年加入同盾,历任同盾旗下产品“数据魔盒”商务管理、同盾数据魔盒负责人,2018年9月开始担任同盾数据魔盒负责人,曾任杭州信川科技业务总经理,目前已离职。 业内人士透露,童保华此前实际为同盾旗下产品“数据魔盒”的操盘手。 而另一位配合调查的高管徐斐曾任同盾科技销售副总裁,前阿里B2B资深销售专家,负责同盾的新金融业务线。目前徐斐为“数聚魔盒”的运营主体杭州信川科技有限公司总经理。 针对此次财新报道相关负责人,同盾科技官方回应: “为配合警方调查曾经服务的某单位,杭州信川公司有关人员正积极协助警方调查取证,以协助相关部门查清该单位的情况。杭州信川科技有限公司为同盾科技子公司,独立运营,不涉及金融业务、不引流、不放贷。经过举证,目前财新已删除同盾运营高炮平台等不实的表述。” 不过,针对童保华和徐斐具体在配合警方调查哪家杭州信川公司的合作机构,同盾方面对新流财经表示目前还不知道。 数据魔盒的运营主体为杭州信川科技有限公司,成立于2016年5月,注册资本500万元,徐斐为法定代表人,同盾控股有限公司为全资控股股东,同盾科技创始人兼CEO蒋韬为实控人。 此前,同盾科技相关资料显示,数聚魔盒主要通过“爬取互联网公开数据+打通同盾体系内数据+用户授权数据采集”的方式作出风险分析判断。 此外,新流财经获得的一份同盾科技股权投资建议书中,披露了同盾科技截至2019年4月的部分信息。 资料显示,在同盾科技的签约订单金额产品分布结构中,数聚魔盒从2018年起,与同盾的其他智能营销、智能运营等多项新产品开始产生收入,2018年三、四季度中,数聚魔盒的签约订单金额占比分别为4.8%、3.9%。 此前,同盾科技称“数聚魔盒”已经在2018年下半年开始逐步收缩,2019年彻底停止。而针对2018年数聚魔盒开始产生收入,且单季签约订单金额占比高达4.8%的情况,新流财经曾向同盾科技方面核实,同盾科技方面回复: “第一,数聚魔盒业务(包括同盾的一些创新产品)开展初期我们会给到客户免费试用,to B类客户合作周期较长,体现在财报签约率上在年底会有小幅增长,但业务确在调整收缩。 第二,去年以来我们收紧了对新金融客户的合作审查机制,主动停止了部分客户的合作,因此信贷类产品签约金额在2018年三四季度逐渐降低,结合第一点原因,反而使魔盒业务从占比数值上看起来有所上升。” 该资料显示,2016-2018年同盾科技的付费调用量情况持续增长,2018年同盾信贷类付费调用量达到22.87亿次,平均调用单价上升到0.21元。 2018年,同盾贡献前十大客户中包含了捷信、马上、360金融、京东金融(现京东数科)、度小满金融等知名企业,贡献度最高的一家金融机构2018年为同盾的收入贡献近2695万元。 另外,资料还显示,2016-2018年,同盾科技营业收入为别为:6065.6万元、2.61亿元、5.42亿元。同盾科技在2017年与2018年虽均录得会计亏损,但均实现了现金利润,经营性现金流净额分别为4995万与7677万元人民币,2019年预计实现营业收入9.8亿元人民币,净利润1600万元人民币,计划在2020年启动上市计划。 但就目前的形势来看,这一收入目标和上市计划的启动可能面临着不小的困难。 2019年4月前后同盾宣布完成最新一轮超1亿美金融资,由招商局资本旗下中白基金、GGV纪源资本、光大控股旗下光控华登、国泰全球等投资机构领投,信达汉石等老股东跟投。 当时大量媒体报道均称,这轮融资后同盾科技的估值达到20亿美元,但这份同一时间的股权投资建议书显示,2019年4月这轮融资之前,同盾科技投前估值仅为12亿美元。而后同盾方面则否认“20亿美元”这一估值数字为同盾方面的官方口径。[详情]
原标题:部分中小银行 暂停外部大数据风控合作 消费贷门槛收紧 21世纪经济报道 “近日多家城商行、农商行暂停了大数据风控合作业务。”一家智能大数据风控机构负责人赵诚(化名)向21世纪经济报道记者透露。近期,多家涉及爬虫技术的大数据风控机构被调查。 赵诚坦言,近日众多中小银行询问最多的,就是大数据风控平台获取的借款人信息是否经过“充分授权”,是否存在过度收集行为,向银行提供的借款人信息是否从第三方数据机构采购得来。若大数据风控平台存在上述状况,银行就会果断暂停合作。 大数据风控平台遭遇的风波,进一步波及到助贷机构。 “越来越多银行因缺乏借款人信息而收紧信贷审批门槛,甚至少数银行只做‘熟客’,新客户一律不放贷,导致助贷机构导流的借款人通过率大幅下降。”一家助贷机构负责人向21世纪经济报道记者透露,“以往每推荐10位借款人,大概4-5人能获得消费贷款,如今银行收紧审批门槛,降至两人左右。” 该负责人坦言,由于流量成本居高不下,助贷领域的导流业务已入不敷出。 银行收紧消费信贷门槛 多位中小银行消费金融部门人士向21世纪经济报道记者坦言,以往对消费金融贷款的风控审核,主要基于两大数据的评估:一是借款人在央行的征信报告,二是银行通过第三方大数据风控机构获取的借款人行为、电商购物、生活特征等数据。两者相互交叉验证,让银行更全面了解借款人的还款能力与还款意愿。 “在两种数据交叉验证的情况下,我们个人消费信贷的坏账率一直控制在2%以内。”一家城商行消费金融部门人士向记者透露。 但是,近期多家涉及爬虫技术的大数据风控平台被调查,上述人士所在银行决定暂停所有的外部数据合作。 上述城商行消费金融部门人士解释,银行目前不清楚这些平台提供的借款人信息,是否存在过度收集行为,是否在借款人不知情的情况下获取,是否从另外的第三方机构购入,因此银行消费信贷业务也可能陷入“非法获取借款人隐私数据”的困境。 “不只是我们这么做,很多中小银行都暂停了大数据风控合作业务。”上述城商行消费金融部门人士表示,这也让银行个人消费信贷业务风控压力骤然加剧。 “目前我们只能收紧个人消费信贷业务的审核门槛,即便合作的助贷机构会先对借款人做一番风控核查,但我们现在仍可能拒绝放贷。在以往,这些通过外部平台风控遴选的借款人,获批率很高。”上述人士透露,本周以来银行内部决定只对放过贷的客群提供续贷服务。 这导致近期银行消费信贷业务规模缩水不少。 助贷机构再遇大考 多位助贷机构负责人向21世纪经济报道记者透露,近日推荐给中小银行的借款人客群贷款获批率明显下滑,导致相应的导流获客收入缩水不少。 “我们内部粗略估算,从多家涉及爬虫技术的大数据风控平台被调查开始,我们面向中小银行的导流获客业务收入缩水约40%。由于流量成本并未下降,这段时间这类业务营收基本是亏损的。”一家助贷机构业务主管向记者直言。若爬虫技术获取用户信息数据的合规操作标准迟迟不能明确,助贷行业的苦日子还将延续相当长一段时间。 更重要的是,以往银行与助贷机构合作期间,会向助贷机构查询借款人是否存在欺诈风险等信息,并为此支付费用。如今银暂停了这项业务合作,助贷机构又失去另一块重要收入来源。 为此,部分助贷机构只能将借款人的借款需求与信托产品资金进行对接。助贷机构与信托机构合作时,往往通过关联担保公司与保险机构信用保证保险业务保障信托产品本金安全,因此信托公司也会将消费信贷主要风控审批决策交给助贷机构处理,令助贷机构在借款人信贷决策方面具有较高的话语权,以此弥补银行收紧信贷门槛造成的助贷业务收入下滑。 “但这种做法未必能持久。”赵诚坦言,一方面信托产品资金的融资成本较银行高出不少,由此造成消费金融信贷产品利率水涨船高,不少信用评级较高的借款人对贷款利率抬高感到不满意,从而放弃贷款,令助贷业务坏账风险增加;另一方面部分信托机构也借鉴银行的做法,对借款人信息数据获取的合规性加大审查,整个业务同样存在较高的不确定性。[详情]
来源:零壹财经 作者:温泉 数据行业主要爬虫服务暂停的影响开始显现。 “我们这边影响很大,很多贷超产品下架了。”一位头部网贷机构内部人士向零壹财经透露。 另据零壹财经向多位业内人士了解核实,这是贷款超市当下面临的普遍状况——贷款产品大面积下架。下架产品的数量,有的机构在三分之一,有的机构则达到一半以上。 据了解,爬虫服务的暂停,使得相当一部分贷款产品风控受到影响,不得不暂停贷款服务,因为这些产品的风险控制依赖于爬虫服务所提供的数据。一位贷超业内人士向零壹财经透露,此次下架的产品,主要是一些名义利率在36%以内,但实际利率超过36%的产品。 这样的产品在目前面向个人用户的网络现金贷款中占比不小。据零壹财经此前了解,一般来说,根据目前现金贷的资金成本、获客成本、运营成本、风控成本和坏账水平,如果现金贷的实际利率为36%,放款机构是略微亏损的。只有银行和持牌消费金融公司、以及一些头部公司在实际利率36%以内可以盈利。 一位贷款超市内部人士向零壹财经透露,目前没有下架的产品主要是持牌机构的产品。已经下架的产品,是否能够恢复,目前看来还不确定。该人士透露: “有的说国庆节之后再上架,有的干脆不干了。但是看目前这个形势,国庆节之后那些产品能不能上架,我们也没底。” 影响波及P2P及助贷机构 这将影响到不少P2P公司和助贷机构的产品。 实际利率超过36%的产品主要是面向下沉人群的产品。不少P2P公司都在经营这样的产品。P2P的借款客户都是市场上的次级用户,因此一般风险较高,贷款的成本和利率降不下来。为了节省成本,这些公司会选择使用外部公司提供的爬虫服务,而不是自建爬虫技术团队,因为自建爬虫技术团队是一笔不小的费用。 值得注意的是,受影响的不只是一般的P2P机构。头部网贷机构虽然由于拥有自己的爬虫团队而受影响并不大,但是据业内人士向零壹财经透露,网贷机构多多少少都会使用一些外部的爬虫服务。因为如果所有的数据都要自己的团队爬取,数据挖掘和存储的成本都非常高,但是用第三方服务就可以节省成本。因此,此次头部网贷机构受影响不大,但是由于一些数据服务的停止,也会面临寻找替代方案、调整风控模型的问题。 助贷机构不少服务于下沉人群,因此此次受影响也不小。据零壹财经了解,由于爬虫服务的暂停,目前一家头部助贷机构已经开始调整模型。助贷一般是指金融中介机构(包括商业银行、消费金融公司、信托等)与助贷机构合作,金融中介机构提供资金,助贷机构提供获客、风控等环节服务,金融中介机构与助贷机构的风险与收益划分由双方协商决定。 贷超承压 这一波产品下架,已影响到大部分贷款超市。 目前,贷款超市遍布网贷市场,其中包括专门的贷款超市和网贷平台下设的贷款超市。 行业内较为知名的贷款超市有融360、借点钱、速贷之家、榕树贷款、挖财等。零壹财经登录这些贷超的APP发现,有头部贷超目前上线有将近80款贷款产品,其中28款显示“人数已满”。有的只剩十几款产品,有的则只剩不到10款产品。 除了这些专业的贷款超市之外,许多网贷机构除了自营网络贷款之外,都有贷款超市。在这些网贷机构内部,这项业务称为“拒量输出”,意为将自家产品拒绝的客户输出给其他的网贷机构。据业内人士透露,“拒量输出”是网贷机构盈利丰厚的一块业务,因为头部平台拒绝的客户在其他网贷平台上转化率很高。 据业内人士透露,今年315之后,贷款超市都下架了“714”产品,目前贷款超市的714产品已经很少。这次多家大数据公司的爬虫服务暂停,开启了新一波的产品下架,下架的主要是非持牌机构表面合规的贷款产品。目前还未下架的产品,基本上都是持牌机构的产品了。其中,中小贷超上小贷公司的产品比较多,头部贷超则有一些银行和消费金融公司的产品。 这一波产品下架,将在一定程度上影响到贷款超市的盈利。贷款超市是随着网贷产品的出现而产生的一种产品,其作用是聚合各种贷款产品,供消费者选择。在2016年、2017年前后,贷款超市赚得盆满钵满。但是在今年315之后,贷款超市大面积下架了714产品,使得市面上的贷款产品和贷款超市的供求关系发生变化,这重创了贷款超市的利润。这一次,贷款超市又大面积下架非持牌机构贷款产品,进一步影响到贷款超市的盈利。[详情]
原标题:互金爬虫大清洗!大数据智能风控安全风暴骤起,多公司及助贷平台业务被迫暂停,风控服务商遭重创 作者: 段久惠 张雪囡 来源:券商中国 近期杭州、上海等地多家大数据智能风控企业连遭警方调查。一时间,大数据行业风声鹤唳。 券商中国记者了解到,此次风波中的魔蝎科技和公信宝被调查的原因均与爬取用户信息(可简单理解为“爬虫”技术)及用户数据引用服务违规有关。公开消息显示,魔蝎科技曾推广过有关爬虫的应用产品,可快速获取用户基本信息、放款额度、风控数据等。 同盾科技爬虫部门也在这时传出解散消息,该公司相关人士告诉券商中国记者,“公司旗下爬虫业务在2018年就酝酿调整,2019年3月整个平台下线,业务团队消化到其他团队去了。当前,公司业务以智能金融风控技术服务输出为主,爬虫只是很小的一部分业务。公司获取的数据方式,是客户(合作金融机构)合法授权数据,像游戏、社交、航旅行业都有合作;最大的合作机构,还是银行、保险、持牌消费金融公司。” 风控服务商遭重创 “随着互联网金融兴起、金融科技发展,用户金融行为线上化,产生了大量除了工商财税、水电煤缴费等传统征信数据之外的一些结构化数据,这些数据银行是缺失的,但它们对银行在贷前审核、贷中审批和贷后管理上有很大的辅助和参考作用,所以早期,银行会与之合作,开拓一些新的商业模式。”华东一位城商行人士向记者透露,但近年来的情况是,银行自身大数据风控产品和金融科技应用逐渐成熟,逐渐摒弃了初期这类合作模式。 “爬虫技术有利于挖掘数据价值,它是中性的,但部分第三方数据公司在与其他金融机构合作过程中,留存部分数据,又把这些数据转手倒卖给第三方消费信贷公司,甚至是现金贷、高炮台公司,使得用户数据被滥用,这就触及合规的底线了。”华东某城商行人士告诉记者。 大数据智能风控安全风暴骤起,后续影响仍在发酵。“监管这次下了狠手要规范行业,部分与现金贷行业联系较强的大数据公司及助贷平台已经暂定做业务了,有些消费金融公司也缩减了业务规模。”华东地区一家大数据公司负责人表示。 剑指高利贷、超利贷平台 “此次大数据整治并非一刀切,主要是针对一些大数据提取、应用上的违规现象,比如给一些不合规的高利贷、超利贷平台提供数据、风控服务。”苏宁金融研究院院长助理薛洪言告诉记者,高利贷、超利贷屡禁不绝,某种程度上和一些第三方大数据科技公司违规为其提供金融数据、风控服务等不无关系,一旦没有这些支持,高利贷、超利贷平台在反欺诈、风控业务运作上会面临非常大的考验。 “没有爬虫数据做风控支持,一些现金贷公司、消费金融公司要么降低额度、要么停止业务。之后去掉一批这类公司是一定的,毕竟自己搭建一个完整的风控系统成本都要上千万。”北京地区一家大数据公司相关负责人直言。 “影响最大的还是现金贷平台,他们主要就靠爬取用户的运营商数据来进行贷后催收。”一家消费金融平台资深风控业务负责人向记者介绍,相对于消费金融公司在风控环节,可以通过审核用户的综合资质、并通过其他数据比如黑名单、要素验证、消费记录等来准入,而现金贷平台的申请用户资质相对来说信用资质较为次级,“只要爬取了用户近半年的通讯记录,就可以获得用户的常用联系人关系等,用户基本上不再有什么秘密。所以会看到,有些恶意催收事件里,就是直接轰炸用户通讯录联系人。” 华东一家头部网贷平台也向记者证实,网贷平台主要还是自建风控模型、接入外部数据是用于辅助查询。此外,在互联网金融行业兴起之初,拓展在线零售业务的银行机构,也会选择与第三方大数据风控公司合作,进行数据交叉验证、丰富风控维度。 因此,薛洪言认为,这次数据违规现象整治,对与第三方大数据风控公司有合作关系的持牌金融机构(含银行和消费金融公司)、网贷平台、现金贷公司等所产生的影响,要区别开来看。 “对于一些提供贷款服务、年化利率在36%左右的平台影响会比较大,因为随着行业整治趋严,一些多头借款用户可能资金链断裂、逃废债;相比之下,一些贷款年化利率在24%~26%的平台安全垫比较厚,受到的影响会相对较小。”他分析,尤其是一些持牌金融机构,可以通过变换大数据风控服务商等方式,获得业务转型的腾挪空间。 智能风控场景应用爆发 对于整个大数据风控行业,行业内比较普遍的看法是,“爬虫技术还是存在不少争议的,因为这个技术存在过度爬取信息,爬取到的信息用途不明等。当前的阶段性整治,对于一些规模、技术实力强和合规性要求严格的大数据风控机构将获得较好发展,而一些靠低价夺取市场的不规范小平台可能会慢慢退出来或者转型去做其他业务。” 从国内的大数据智能风控公司创立时间轴来看,他们于2013年前后到2016年密集成立,跟随金融科技产业近年爆发,也经历了扩张期,部分公司完成多轮融资,其中如同盾科技的最新估值已经达到20亿美元。 “2013年之前,国内的智能风控公司更多是做网络安全层面的;而当前智能风控已经广泛应用在金融、电商等等各个业务层面了。”智能反欺诈服务商维择科技(DataVisor)中国区总经理吴中接受记者采访时介绍,国内智能风控行业有着明显的阶段变化。 他介绍,更早之前智能风控是通过设备、指纹采集数据制成黑白名单、用于预防共债风险;但是从2017年起至今,人工智能被广泛引用于风控行业之后,AI+脱敏后数据可以形成高纬度风控模型,在智慧化、精准化、反黑灰产反欺诈上更完善。 “以前很好的原料,没有很好的大厨。”吴中比喻,通过人工智能技术,比如该公司的无监督机器学习技术等,可以将原来的分散的有效用数据充分挖掘和应用到更多行业场景中。 IDC最新报告预测,2019年度全球市场的大数据与商业分析解决方案整体收益将达到1896.6亿美元;中国大数据市场总体收益将达到96.0亿美元,2019-2023年预测期内年复合年均增长率23.5%,高于全球平均水平。 大数据行业发展与安全寻求动态平衡 大数据、智能风控行业发展迅猛之际,与之而来的个人信息采集、应用规范受到监管重视。今年5月份到8月份,《数据安全管理办法(征求意见稿)》、《App违法违规收集使用个人信息行为认定方法(征求意见稿)》、《个人信息安全规范(征求意见稿)》、《信息安全技术、移动互联网应用(App)收集个人信息基本规范(草案)》等密集出台。 针对用户隐私,监管频出重拳,不仅仅是发生在智能风控大数据领域,甚至蔓延到整个互联网行业。近期,工信部对外披露二季度检测发现问题的应用软件名单,多个在线直播平台如YY、斗鱼直播,美团外卖、91短贷等32款应用软件被点名,多涉未经用户同意,收集、使用用户个人信息。 “爬虫技术等泛滥确实应该整治,保护用户个人隐私,个人信息安全保护趋于严格,但目前相关监管方法草案偏多,具体到细化和落实执行方面还有难度,行业也处在观望状态。”上述消费金融公司风控负责人称。 “要看到的是,当前,监管支持消费金融行业发展的大导向并没有变。”薛洪言看好当前金融数据在合规前提下深度应用开发前景,数据的发展和安全边界是一个动态平衡过程,对数据规范使用的监管将是一个长期过程。 在央行近期发布的金融科技发展规划(2019-2021年)中提出,在切实保障个人隐私、商业秘密与敏感数据前提下,强化金融与刑罚、社保、工商、税务、海关、电力、电信等行业的数据静源融合应用,实现数据资源有机整合与深度利用。[详情]
来源:趣谈公社 在这场数据公司的行业地震中,多家知名公司被查,但自建爬虫工程师团队的企业,他们获取的信息是否合规使用? 虽然数据公司纷纷公开表示,暂停该服务,但仍有多家互联网公司,金融科技公司自建爬虫服务团队,他们在这场行业肃清风暴中处于什么位置?在此之前,小米金融,京东金融等都被爆出涉及到个人信息泄露的问题。 BOSS招聘信息显示,连连支付、百融、小米金融、邦盛科技等仍在高薪招聘爬虫分析师。 在岗位描述中显示,“进行多平台信息的抓取和分析等。”且也给出了30K左右的薪资。 根据多位行业内人士观点总结,大数据公司的爬虫服务主要用于,向金融机构以及类金融机构提供协助贷款平台进行展业获客,以及催收服务。 爬虫工程师招聘需求高 杭州魔蝎数据科技有限公司(以下简称摩羯数据)、新颜科技人工智能科技有限公司(以下简称新颜科技)被查后,快钱支付、天翼征信等也传来被调查的消息。 在此背景下,服务金融机构以及类金融机构的第三方数据公司,接连发布公告暂停爬虫运营商服务。 有盾喊停运营商报告业务;上海诚数信息科技有限公司(聚信立)也向商户下发通知,停止对外提供用户授权的爬虫服务。 此外,根据某自媒体报道,传统银行互金部总经理就提出,应果断停止,或审慎开展与爬虫类技术服务公司的合作项目,清查行业涉及外部资产数据源合作的所有资料,防止恶性事件传染。 但从招聘网上信息来看,爬虫工程师仍然是各大企业的香饽饽,比如欢聚时代、百融等企业依旧在招聘数据爬虫分析师。 爬虫工作属于数据分析工作,高薪对人才吸引力度大。Boss直聘《2019年一季度人力吸引力报告》报告显示,市场回暖,人才需求同比增长31.8%,推荐算法工程师平均薪资近4万元。受资本市场波动影响,2019年Q1互联网、IT软件和金融行业的人才吸引力指数环比分别下降2.5%和3.7%。 对于岗位来说,人工智能与大数据相关岗位人才吸引力依然占据前列。 实则,社长了解到,爬虫工作对于程序员而言,门槛不高,刚入门的程序员就能通过培训掌握技能。据悉,爬虫数据主要就是通过一些自动化代码去网上抓取一些信息回来,整理成可以使用的数据。基本一个程序员,学几天就搞定了。掌握ETL这种比较简单的或者web相关的可以转。 社长还发现,部分互联网公司仍在公开招聘爬虫数据师。比如,邦盛科技、黑瞳、国美金控、小米金融、搜狗、去哪儿网、汽车之家等仍在高薪招聘爬虫分析师。 爬虫技术本来无可厚非,技术无罪,然而技术被用以在不当的方式,则将带来相反反向效应。比如,我们可以看到移动金融App通过捆绑甚至强制获取的方式,要求用户一次性同意多项敏感权限。不同意就不能继续应用软件,但是同意以后,就可以过度开发用户数据吗? 据媒体报道,天机、葫芦数据、白骑士等其他大数据风控服务商已暂停运营商数据服务,百融云创、鹏元征信部分服务无法使用。随着服务商暂定应用服务,也将对“超利贷”“714高炮”迎来行业巨震。 业内人士介绍,智能风控对于数据而言并非必要条件。相反,智能风控离得开数据,那么企业滥用数据,应用数据开发又为何? 贷前贷后应用爬虫服务 所谓运营商爬虫服务,是在用户授权账号的前提下,登录用户的运营商账户,抓取一些手机卡过往使用情况的信息,包括使用时长、常用联系人、套餐信息等,以此验证机主的真实性来做风控。 这类第三方数据服务商玩家众多,百融云创、第四范式、氪信科技、云蜂科技、智帆金科、通付盾等都在此领域深耕。 事实上,大数据风控公司数据来源大致分为第三方机构授权;是关联公司/场景数据;以及通过爬虫业务获取。 爬虫架构工程师几乎是所有互联网技术公司、数据公司、咨询服务服务机构的标配,市场需求量很大,且大多薪资不菲。那么分析师爬到的数据究竟都做了什么? 现金贷从业人士告诉社长,行业肯定存在数据泄露,拿到数据就等于找到了目标客户,通过群发短信,来间接获客。 也有从业人士告诉社长,除了第三方外,企业内部爬虫都是服务自身业务分析,或者是用来做竞品分析及数据咨询服务。 另一位从业人士认为,爬虫使用的数据没有泄露给第三方就不算是泄露隐私。他指出,爬虫如果按照robots协议,抓取的是网络上公开的消息(像百度爬虫一样),那么这种爬虫行为是符合规范。 但一直被质疑个人信息泄露。就在今天下午,社长在某个地铁站口的星巴克刷卡支付买了一杯咖啡,手机里的知乎广告马上给就给我推送星巴克;用手机浏览器搜索了一下去杭州的高铁票,不到一分钟就接到了同程旅游的广告。 如果说是巧合,反正我是不信的,在大数据公司面前,每个人都在裸奔。 爬虫爬的信息说起来主要都是个人的基本资料和一些选择。但是实际上,我们是否许可并未可知。 “大数据风控公司保护好用户隐私,是没有问题的;如果对外售卖用户隐私信息,就有问题了。”从业人士介绍。 有私募机构人士对我们表示,对于金融科技领域合规风险,他们关注是否有用户的双向授权,服务商的客户是否持牌金融机构,因持牌机构对合规性要求最严,意味着风控服务商合规性更强。 值得一提的是,App的信息安全已经引起官方重视。今年1月底,中央网信办联合工信部、公安部、市场监管总局等四部门表态,今年将在全国范围内发起专项治理活动。严重违法违规收集个人信息的App运营者,将被依法暂停相关业务、停业整顿、吊销相关业务许可证或者吊销营业执照。 有专家建议,要从保护用户隐私角度,应该是临时授权,并且这在技术上实现起来并不难,但是很多App并未做到。 社长认为,数据对于老百姓而言即平凡又重要,随着用户安全意识提高,更应该从源头上解决问题。一旦数据泄露,要大幅提升违法违规企业的惩罚力度,还需制定App过度索权的评估标准和有力的监管体系,并健全救济机制。[详情]
祸起爬虫 “数据圈”一夜入冬 本报记者 王仲琦 冯樱子 北京报道 对于第三方数据公司来说,仿佛一夜入冬了。 近期,“数据圈”接连传出重磅消息。先是魔蝎科技、新颜科技被爆遭到调查,然后公信宝运营主体——杭州存信数据科技有限公司也被杭州市公安局西湖分局古荡派出所查封。 而且这可能只是开始,本次监管部门对打击违法获取和使用信息的大数据公司的决心很大。北京一家数据科技公司研发部负责人刘毅(化名)告诉《华夏时报》记者:“公司已经放假了,何时上班‘十一’后等通知。其他一些公司也提前放假了,没放假的也在停工观望,现在监管部门对提供爬虫服务的数据公司整治力度空前的大。” 而对于目前“数据圈”存在的乱象,中信集团原监事长、中信银行原行长朱小黄在“2019中国银行业发展论坛智慧金融(上海)峰会”上指出,好多数据公司都是“爬”下来的数据,当然成本低,数据公司利用了这个成本低的优势,迅速获得收益。这种以侵犯个人、企业数据而形成的商业模式使行业产生了异化。 “没有爬不到的数据” 在近年互联网金融大潮中,大数据服务供应商一直扮演着重要角色。而近期多家公司接连被查,将处于数据风控服务核心的网络爬虫技术推到了风口浪尖。 爬虫作为一种计算机技术,具有技术中立性,爬虫技术在法律上从来没有被禁止。爬虫的发展历史可以追溯到20年前,搜索引擎、聚合导航、数据分析、人工智能等业务,都需要基于爬虫技术。但是爬虫作为获取数据的技术手段之一,由于部分数据存在敏感性,如果不能甄别哪些数据是可以爬取,就会触及监管红线。 “爬虫技术作为第三方大数据风控服务商的主打产品,也是互联网金融公司进行大数据风控必不可少的武器。”刘毅对记者说,“不过,目前网络爬虫存在着是否经过用户授权,是否存在过度爬取信息,爬取到的信息使用等问题。随着同业竞争越来越激烈,一些畸形的爬虫产品也随之出现,涉及数据窃取、泄露、滥用和隐私安全等问题。” 一些大数据风控服务商为了在竞争中取得领先地位,需要更精准地分析用户行为,制作用户画像,为了获取海量的数据支撑,电商数据、通信运营商、出行数据,信用卡、人行征信等信用数据,甚至网银、公积金等金融数据等,都成为爬虫们的目标。 据刘毅介绍, 市场上曾经有一款专门爬取支付宝数据的产品。只需要用支付宝扫描一下登录“二维码”,就可爬取支付宝用户的真实姓名、手机号、收货地址、近一年的购物信息、交易记录等。而一家第三方大数据风控服务商曾在市场上推出的一款“同业爬虫”产品更厉害,只需要用户提供其在其他现金贷平台的账号和密码,就可以爬取用户的所有信息,包括放款额和风控数据。放款机构可以根据这些数据进行评估,实现“秒批”和“秒放”。这个产品相当于直接掠夺同业数据,窃取别人的风控成果。由于过于野蛮粗暴,被业内称为“耍流氓”。 “只要技术好,就没有爬不到的数据。”刘毅总结道。 “一些第三方大数据风控服务商利用爬虫技术违法获取或过度获取用户信息并使用的行为,已经成为阻碍行业健康发展的瓶颈。而个别公司打着金融创新的幌子,就是为了突破监管的要求。无论公司发展的规模多大,违规获取和使用数据的行为都是不可能回避的‘原罪’。”一位不具姓名的金融业人士向本报记者指出。 提高自主风控能力 事实上,对大数据公司获取和使用用户信息的行为并非无法可依。 早在2017年6月1日,《网络安全法》正式施行,比如第四十一条规定,网络运营者收集、使用个人信息,应当遵循合法、正当、必要的原则,公开收集、使用规则,明示收集、使用信息的目的、方式和范围,并经被收集者同意;第四十四条规定,任何个人和组织不得窃取或者以其他非法方式获取个人信息,不得非法出售或者非法向他人提供个人信息。 而在2019年5月28日国家互联网信息办公室发布的《数据安全管理办法(征求意见稿)》中也明确出现了对网络爬虫规制的法律条文。其中第十五条规定,网络运营者以经营为目的收集重要数据或个人敏感信息的,应向所在地网信部门备案。备案内容包括收集使用规则,收集使用的目的、规模、方式、范围、类型、期限等,不包括数据内容本身;第二十条表示,网络运营者保存个人信息不应超出收集使用规则中的保存期限,用户注销账号后应当及时删除其个人信息;第二十七条指出,网络运营者向他人提供个人信息前,应当评估可能带来的安全风险,并征得个人信息主体同意。 目前,随着“数据圈”乱象整治的深入,一些公司纷纷对业务进行调整。其中,上海一家信息科技公司干脆发公告给合作商户称,暂停对外提供用户授权的运营商爬虫服务,拥抱监管、加强自律。 公开信息显示,本次被调查的公司大多是国内较早从事大数据智能解决方案的服务商。主要为银行、保险、消费金融公司、贷款机构等提供智能风控、风险分析、信用分析、多头借贷、风控建模等风控技术解决方案,合作机构多达数千家。 上述金融业人士也向本报记者表示,严格监管对于行业的长远发展起到了积极作用。随着强监管信号的不断释放,野蛮生长的大数据收集时代将结束。这对很多风控公司、征信公司以及金融机构都有深远的影响。 那么,对于金融等机构来说,这些民营第三方数据供应商,真的无可替代了吗?其实,早在2014年初,北京中关村就成立了树海大数据交易平台,2015年4月中国第一个大数据交易所在贵阳挂牌运营;同年7月底,武汉东湖大数据交易中心开业。此外,江苏、浙江等省份也筹建了自己的大数据交易中心或交易所。 河南一家城商行的高管告诉本报记者:“这些国家性质的数据交易所或交易平台,受到的国家管控较强,其数据确实非常合规,但由于来源渠道受限,对于金融机构来说在实际应用中效果不大。” 不过,对于金融机构来说,在有限的数据下做好风控是未来必须面对的问题。前述金融业人士认为,事实上,此前一些金融机构的风控工作,主要是靠引入数据供应商,反倒使自身的风控水平出现下滑。另外,数据资源太多也不一定是好事,会导致很多金融机构贷前审核不认真,降低了准入门槛,让很多还款能力弱、还款意愿不强的用户通过了审核,最后金融机构只好通过加大贷后催收力度的办法迫使其还款,这又衍生出暴力催收的问题。 断掉第三方数据供应商违规获取的数据后,金融机构只能扎扎实实地开展贷前审核工作,让真正优秀的、有技术能力的企业凸显出来。 在这次整治数据乱象中,9月17日,第三方智能风控与分析决策服务供应商同盾科技实控人兼CEO 蒋韬在公开信中表示,人工智能及大数据这个行业是个新领域,这个新领域是需要所有从业者一起努力,在竞争的过程中互相学习,共同帮助和配合监管机构,逐步建立起这个行业的最佳实践以及规制。[详情]
来源:新金融洛书 01 2006年,已经做了几年天使投资人的唐宁,自掏腰包借款给100多个大学生参加培训收到了回款,因此受到鼓舞,在北京SOHO现代城的三室一厅里创立了宜信公司,在这里一同办公的,还有他刚创办的华创资本,招进了早已熟识的第二号员工吴海燕,后者后来成了华创资本的当家人。 36岁这一年,从阿里巴巴安全部技术总监岗位上辞职的蒋韬找到吴海燕说,他想做一个SaaS级应用而服务所有网站,名叫同盾科技。吴海燕很快给了蒋韬第一笔天使投资。 那时,市场传闻一条不成文的规则,从阿里中层出来的人创业,天使风投100万美元起步。华创资本和IDG资本给蒋韬的则是千万元人民币的天使轮。 蒋韬出来单干之前两年,即2011年,在硅谷工作了11年的汪德嘉回国了。汪德嘉是个留美数学博士,在VISA等公司做大数据分析、金融反欺诈技术工作,回来后就创办了通付盾,仍是老买卖。 一次,汪德嘉带队在杭州参加一个安全技术交流会,遇见了还在阿里巴巴做安全部技术总监的蒋韬和团队。两人聊得投机,很快,双方签订了技术交流合同, 两个年轻人走向志同道合的路。不到几年时间,一个成为网络反欺诈领域的凶猛后生,一个成为数字身份认证领域的不得不提的主。 数据产业起于草莽,蒋韬、汪德嘉们也不得不剑悬颅顶。友商们数据倒卖、侵权爬虫、窃取隐私的事情太多了。干这事,像浅水行舟,还百舸争流,水不仅搅浑了,身边的人也一个个触礁了。 谁也没有想到,几年后,两人突然翻脸,汪德嘉指蒋韬偷窃通付盾核心技术。蒋韬则一纸状书将汪德嘉告上法庭,顿时反目成仇。 02 趟数据这趟浑水的,不止蒋、汪。 数据产业的淘金热,在2007年前后出现,于2013年前后兴起。与P2P的展业有着相当的轨迹。 同盾科技、百融金服、聚信立、GEO集奥聚合、白骑士、算话征信。这些大多涌现于2014年前后两年,这些第三方数据公司的出现,迅速满足并激活了消费金融、P2P甚至银行金融机构的风控、获客、营销需求。 通观第三方数据企业的合作体量,就知道市场需求并不少。截至目前,第三方数据企业的聚信立合作企业超过2900家、上海的新颜科技合作机构2500家以上;同盾科技的数聚魔盒,在2019年3月份下线前,合作企业10000多家。这些第三方数据公司的主顾们,主要来自互联网金融机构,包括了P2P网贷、消费金融、现金贷等。 IDC名为《数据时代2025》的报告显示,全球每年产生的数据将从2018年的33ZB增长到2025年的175ZB(1ZB相当于1.1万亿GB)。 资料来源:数据时代;数据来源:IDG 做金融的,无论银行、消费金融、P2P,言必称大数据风控。虽然有效性现在还能定论,但在品牌营销、精准获客上,这两年确实让做地推的都舍弃了原本的路子。银行们找腾讯、阿里、百度合作,P2P、现金贷、消费金融们则有同盾、通付盾们,大家各自配对。 问题是,这些第三方数据有多少是清白的。那些流量巨头的数据后门,个体甚至监管,都不容易摸到。 一些明目张胆做数据买卖的,就难免被拉出惩戒示众。 自称数据第一股的北京“数据堂”,2014年挂牌新三板。2017年7月山东公安上门时,这家公司日均传输公民个人信息1亿3000万余条,累计传输数据压缩后约为4000G。 数据堂的数据,大多是用自营众包平台、公共领域共享,网络爬虫爬取方式获取。一份“车辆标准图像数据”的数据包在网页公开售价20000元。新华视点记者曾问他们客服,这是否会涉嫌侵犯用户隐私。客服声称,这些照片都是摆拍,获得了授权。但该数据产品却明确写着“来自交通卡口监控视频截取”,并非摆拍。 被抓了几十人后,警方侦查发现,数据堂公司向不同的多家公司各售卖了1万条至70万条不等的公民个人信息。 数据堂案件一审判决时,数据堂首席运营官柴银辉、营销产品部副总裁胡晓敏都被判有期徒刑三年,两人都不服,以“数据堂公司系单位犯罪”理由提起上诉,终被驳回。 之后,“数据堂”正常运行。 有些“铁打的营盘,流水的罪犯”的意思。 03 我曾陷于解这样一个谜,前一天我和朋友聊过的旅游想法,第二天就出现了微信底部的携程订票广告,我在私底下谈过的某款车,之后就出现在了短视频里。我想,究竟是谁走漏了风声? 像一个被扒光的人,却不知道如何被谁扒光了。而且越来越被扒得彻底。 以数据所构建出虚拟生活的我们,活在一个巨大的“圆形监狱”之中——所有囚室对着中央监视塔里的数据处理器,每一个囚室有一前一后两扇窗户,一扇朝着中央塔楼和所有人的监视,一扇背对着中央塔楼赢得短暂和半透明的自由。监视者可以观察到囚室里的罪犯的一举一动,囚徒却不知是否被监视以及何时被监视,时刻处于忧虑之中。 英国哲学家杰里米·边沁(Bentham)把圆形监狱描述为“一种新形式的通用力量 ”(a new mode of obtaining power of mind over mind, in a quantity hitherto without example)。 几个月前,马化腾喊出了“科技向善”,实在是有些牵强了,因为资本逐利,技术在资本手里,简直就是一个黑箱了。 别忘了,中国的互联网大公司,在数据上都有不光彩的过去, 蚂蚁金服闹过个人信息被默认勾选进《芝麻服务协议》事件;京东金融曾曝出留存用户图片缓存和10G数据外泄事件,至于抨击百度作恶,已成了政治正确了。 这两年,我们已几乎走进科幻电影中的现实。 2002年上映的科幻惊悚电影《少数派报告》,曾出现这样一幕(大意):汤姆克鲁斯扮演的约翰·安德顿进入商场,大屏幕上出现一个个定制给他个人的广告,并推销给他说:约翰·安德顿先生,您上一次买夹克已经过去3年了,您要买一件新的皮夹克吗? 我们的个人信息,大抵如是。 个人信息、隐私,在电脑算法、机器学习的挟持下,输出给个人的广告或信息,都是经过数据精心算计的结果。 在算法的挟持下,放贷公司的广告会给出令你心花怒放的说辞,也会在你申请贷款时,给你滴水不漏的贷款价格。这背后,是批量放贷的大数据信审和不可琢磨的技术黑箱。 04 这些年,数据黑箱现象隐而不发,但蔚为大观。 消费金融公司虽然给了你一笔利率不错的贷款,但你无法知电脑算法在审贷决策过程中,是否出现程序错误,是不是对你有算法歧视,是不是将学历、种族、户籍信息作为风险定价的依据,你的社交行为数据、朋友圈层次在多大程度上作为你利率定价的依据?这就是数据黑箱,看不见摸不着,却决定着对你的信贷定价。 法学教授弗兰克·帕特洛伊(Frank Partnoy)和普利策奖获得者杰西·艾辛格(Jesse Eisinger)曾于2013年年初共同研究过”美国银行的内幕“,他们在报告中把银行描述为“掩盖了巨大风险的‘黑箱’,这些风险可能会再次击垮经济”,因为黑箱不可捉摸,不可明察。 金融科技化之后,越来越多的黑箱产生,并未使得金融科技更加透明。 黑箱的种子与土壤到处都是,如黑产军团、数据倒卖行为、大数据信审、人工智能深度学习、机器决策… 金融科技的技术和数据黑箱使得监管越来越难。 一家借贷平台在他的大数据风控的系统中输入一个人用户数以千计的社交数据、搜索数据、浏览数据、交易数据等,经过深度学习和决策模型的计算,最终可能将一个人的信用定为不及格,但这其中的具体决策过程是什么,企业不会告知你。 更甚至于,这个决策过程中出现程序错误、算法歧视时,电脑试图向程序员解释时,程序员也无法明白。 哥伦比亚大学的机器人学家 Hod Lipson曾说:“这就像是向一条狗解释莎士比亚是谁。” 被问及Google公司如何对数据进行私下操作时,前首席执行官埃里克·施密特(Eric Schmidt)曾经回答:“Google的政策就是和警戒线打擦边球。” 05 2018年,欧盟颁布了一道了不起的法令——《一般数据保护条例》(GDPR)》。 它未被国人重视的严重性,正如它深远、前瞻的伟大性一样不可忽视。 这则法令最重要的两个原则在于: 1、最大限度的保护个人隐私,严格限定企业、政府对个人信息数据的使用条件。将科技、人工智能、数据渗透阻挡于个人隐私之外。 2、要求人工审查重要的人工智能中的算法决策,提供个别算法决策的详细解释或关于算法如何做出决定的一般信息。这一条款将大大降低技术黑箱问题的存在。 通俗并且简而言之,这两个原则,试图保护人类个体不受愈发失控的数据或技术黑箱之侵害。 如果不受限制,数据乱象将导致怎样的后果? 国内大数据企业常挂在嘴上的打击黑产、打击撸贷大军、欺诈军团,可实际上,数据产业有目前最大之一的黑产军团。 2014年,曾有过诈骗、敲诈勒索两次犯罪经历的“王成予”创办了一家名为“巧达科技”的数据公司。仅仅一年多时间后,王成予的巧达科技掌握了1.6亿中国人求职简历。 巧达科技利用这些数据发布了这款全称叫“爱伙伴员工离职预报”的产品,能发现90%以上员工离职前的动态信息,最快30分钟内向企业管理者发出预报通知。 巧达科技和企业、猎头们在做的是一项拿产品换数据的勾当,交易着你我的简历,而将你我排除在外。 2019年3月24日,大数据行业盛传巧达科技被警方“一锅端”,原因或涉及未经授权收集公民个人信息。 我们回过头来再看,GDPR有它了不起的地方。 欧盟GDPR了不起的地方在于无视利益集团、牺牲科技革新的速度,将科技进步控制在可理解的天花板里,而非放任在失控的黑箱中。 一百年前,路易斯·布兰戴斯(Louis Brandeis)曾经发表言论“阳光是最好的消毒剂”。 在数据黑箱的失控下,蚂蚁金服或腾讯、百度们,甚至于美团、携程们,有可能成为金融科技领域的新权威者。 曾经我们舟船往来、书信有无,一封家书私藏50年,打听一个人的私密要聊很久的八卦。如今数据通了信息高速,但我还是发愿:个人不裸体示人,我愿隐姓埋名,国家就对我一无所知,BAT们不能左右。[详情]
原标题:信用管家或因数据原因被查 与爬虫业务无关人员已被释放 网贷之家 9月19日,多家媒体报道,杭州头部贷超平台信用管家被警察带走调查,下午,据知情人透露,被查原因或与爬虫、数据等相关,与爬虫业务无关人员已被释放。 信用管家的贷超业务尤为出名,曾多次被曝为“714高炮”导流,在第三方投诉榜上排名前列。 而信用管家运营主体杭州信牛网络科技有限公司(以下简称:信牛)业务繁多,据官网介绍,信牛成立于2015年,是国内领先的信用资产管理和金融大数据服务平台。 信牛全资控股海南任人信征信服务有限公司,据该公司官网介绍,其主要通过记录个人企业之间产生的借贷履约状态,建立民间信用体系。 除了信用管家,信牛旗下包括现金贷款、91公积金、91社保贷、无忧卡宝等业务,积累近1亿用户大数据,并与800多家金融机构和互金平台达成合作。 目前,信用管家官方网站“贷款”一栏无法打开,微信端51好信的菜单栏“信用检测”、“被拒分析”均无法打开。 (微信公众号:51好信) 我们打开服务中心的“查询工具”页面后,发现与信用或征信相关的查询小工具,如信用检测、被拒分析、查老赖、查社保、查公积金等均无法打开。 (51好信工具页面) 而打开“匹配贷款”工具,按照自由职业者、5000元以内、550以下或没有芝麻信用分、有信用卡且有逾期记录等条件点选,可匹配到24家贷款产品,其中多半为超利贷产品。 (匹配贷款工具页面) 自9月6日起,魔蝎科技、新颜科技、公信宝、快钱等平台分别有人被警方带走调查,同时,多家大数据风控平台暂停部分服务。业内猜测,被调查原因或为这些公司的爬虫业务侵犯用户隐私,敏感数据泄露,成为暴力催收的助力。 如果以魔蝎科技被查作为开端,行业震荡已持续2周时间,而这场“严打之风”,恐怕还要再吹一段时间。[详情]
原标题:互金大数据平台被查背后 网络爬虫侵犯隐私产业链整肃 来源:北京商报 作者:岳品瑜 吴限 大数据风控行业迎来多事之秋。继魔蝎科技、新颜科技遭遇警方调查之后,公信宝运营主体——杭州存信数据科技有限公司(以下简称“存信数据”)近日也被杭州市公安局西湖分局古荡派出所查封。同时,多家企业收紧或者喊停数据服务。这些操作的背后或与大数据公司涉嫌利用网络爬虫技术侵犯个人隐私有关联。分析人士指出,对没有合规经营的公司进行调查,有助于加速清退劣质企业。 多家大数据公司被查 同盾子公司已停止相关服务 9月11日晚上,关于公信宝运营主体——存信数据已被贴了封条,封条上印着“古荡派出所封”字样的消息在网上流出。北京商报记者9月15日电话联系了杭州市公安局西湖区分局古荡派出所,对方表示,此事属实。对于被查封的原因,对方表示不方便透露。 针对被调查一事,北京商报记者多次联系存信数据天眼查中预留的电话,但该电话一直提示关机。目前,存信数据官方还未正式对外回应被查封具体原因。其股东之一李笑来近日发布微博称,“做天使投资真的不是容易的事儿啊”,疑似回应“公信宝事件”。 资料显示,存信数据成立于2016年,是一家以区块链为核心技术的数据科技公司,旨在提供企业间、个人间、企业与个人之间的数据交换服务。目前,该公司已为200家互金企业提供基于区块链技术的数据交易/交换服务,官网披露的合作商户包括现金巴士、PPmoney等。 除了公信宝外,魔蝎科技、新颜科技等多家数据爬虫类企业近期也遭遇了警方调查。某知情人士对北京商报记者表示,近期被调查的大数据公司基本都是涉嫌利用网络爬虫技术侵犯个人隐私,或与助力暴力催收有关联。 北京商报记者注意到,部分同类机构也开始收紧或者喊停数据服务。例如,一家大数据采集服务商极光爬虫代理客服人员对记者表示,目前只能爬取现金贷平台的公开信息,客户隐私信息没法爬取。 值得一提的是,知名第三方大数据风控平台同盾科技近期也被卷入大数据风波潮,有消息称,同盾科技旗下子公司数聚魔盒目前网页已打不开。公开信息显示,数聚魔盒主要涉及数据采集流程,支持爬取数据用作信用评估。 同盾科技相关负责人在接受北京商报记者采访时表示,该公司没有运营爬虫技术的相关服务,主营业务是智能风控与分析决策服务。针对数聚魔盒,该相关负责人回应,数聚魔盒为同盾子公司杭州信川科技有限公司旗下的产品,该服务对适用条件与场景有严格的授权要求与限制,为更加严格地保护用户合法权益,避免个人信息被误用,并积极响应国家关于个人信息保护的相关政策,杭州信川科技有限公司自2018年开始已逐步调整业务,截至目前已全部停止相关服务。 苏宁金融研究院金融科技中心主任孙扬表示,目前对于大数据公司的整顿是“进一步做好互联网金融风险专项整治”的延续和深入,整顿进入深水区。这也表明监管层已经下定决心要互联网金融和个人隐私保护两手都要抓,抓出典型,抓出实效。 爬虫技术被推向台前 侵犯隐私产业链渐现 在互联网金融浪潮中,大数据服务供应商一直扮演着关键角色。而短短数日3家公司接连被查则将数据风控服务背后的网络爬虫技术推向台前。 据了解,爬虫是一项计算机技术,其作用是搜集网页上的信息或数据,然后把搜集到的数据搬运到自身数据库里。用户授权后,风控数据供应商通过后台“爬虫”搜集信息,将通话信息、消费数据等互联网信息进行整合,最终形成对借款人的综合评估,供金融机构做相应的后续决策。 一位不愿具名的行业内部人士介绍称,爬虫技术的数据采集主要包括:公开的第三方数据;抓取用户主动授权的个人基本信息、联系人信息、银行卡信息等数据;授权抓取数据,如设备号、IP地址、运营商/电商等用户授权后合规采集数据;经授权的平台数据,如用户在平台的历史借款、还款情况等用户已在注册协议或隐私协议中授权业务方进行分析的数据。 值得一提的是,在现金贷产业链条中,运营商数据是一个非常重要的风控维度。某知情人士指出,大数据公司在用户授权情况下,会抓取一些手机卡过往使用情况的信息,包括使用时长、常用联系人等。 对此,中国银行法学研究会理事肖飒表示,在大数据公司产业链中,运营商的责任有以下几点:首先,互相勾结情形,即在没有征得用户授权的情形下,和爬虫公司合作,这种情形是有责任的。其次是不知情的情形,运营商没有责任,甚至也是受害者。比较复杂的是,在运营商得到用户授权的情形下,运营商的责任主要体现在如何合法归置这些数据。 伴随着爬虫而来的还有“是否经过用户授权,是否存在过度爬取信息,爬取到的信息用途不明”等诸多争议。中国社会科学院金融研究所法与金融研究室副主任尹振涛表示,大数据公司采集的数据存在是否获得授权、爬取是否合法合规的问题。一方面公共数据的爬取是不允许商业利用的,并不是说互联网的数据可以随便爬取。另一方面有些客户提供淘宝号,甚至密码授权爬取,在爬取时就侵入了对方的计算机,这其实也是一种犯罪行为,叫作侵入计算机犯罪。 那么如何界定爬虫的合法性?5月28日,国家互联网信息办公室发布的《数据安全管理办法(征求意见稿)》明确规定,网络运营者通过网站、应用程序等产品收集使用个人信息,应当分别制定并公开收集使用规则;网络运营者以经营为目的收集重要数据或个人敏感信息的,应向所在地网信部门报备收集使用规则、使用目的和保存期限等。 行业冲击潮持续 加速清退劣质企业 当前,大数据风控行业对个人隐私缺乏保护,存在广泛的数据滥用问题。随着监管信号的不断释放,野蛮生长的大数据收集时代进入冷静期。孙扬认为,未来很多风控公司、征信公司以及金融大数据公司都会受到深远的影响,很多现金贷、网络贷款业务也会受到影响。 同盾科技相关负责人向北京商报记者表示,严格监管对于行业的长远发展起到了积极作用,当前监管机构并不是采取了所谓一刀切的态度和做法,而且依法对于没有合规经营、侵犯个人隐私的企业进行调查,对于加速清退劣质企业、保护用户权益、促进优质企业发展有重要意义。 “长久来看,随着金融机构第一方数据积累以及第三方数据源壁垒降低,输出数据分析能力将成为风控公司更好的商业模式,提供标准评分卡产品+数据科学家咨询能力,将成为更有竞争力的商业模式。”上述负责人说道。 如何整肃现金贷爬虫技术涉嫌侵犯隐私的产业链?肖飒分析称,没有授权的爬虫就一定是违法的,需要重点整治。现在的关键是如何面对这些看似“合法”的爬虫,重中之重就是运营商做到用户授权链的完整,明晰完整的授权链,做到源头控制。总的来说,应当尽快制定完善针对网络爬虫的数据安全法律法规,将网络爬虫引向合法轨道。若是违法进行网络爬虫,就要重拳出击,加大惩罚力度和侦查力度,涉及刑事犯罪的要重点处理。 在金融科技方面,孙扬直言,监管层面要尽快出台金融科技监管的条例,出台金融科技的具体监管规则,向监管金融业务一样监管金融科技公司,促进大数据风控行业的合规、有序、健康发展。[详情]
原标题:爬虫技术公司被查引行业反思 消费金融平台风控再造 跨境支付反洗钱核查面临新命题 “其间我们也考虑过自建借款人数据获取的渠道与技术系统,但我们发现当前擅长借款人行为特征大数据分析与AI建模的人才相当稀缺,即便平台愿意给出高薪也未必能请来。” “城门失火,殃及池鱼。”一位互联网消费金融平台风控总监李诚(化名)感慨。 随着近日多家通过爬虫技术开展大数据信贷风控的公司被查,他所在的平台迅速决定暂停与外部大数据信贷风控公司的所有合作,以免“惹祸上身”。 然而,平台为此付出的代价也不小。 “这几天我们发现黑中介与老赖美化个人财务报表套取资金的现象又明显增加。因为他们觉得消费金融平台缺乏外部大数据风控支持,又让他们有机可乘。”他指出,对此,平台内部只能进一步收紧信贷审批门槛,以牺牲部分业务机会为代价避免“踩雷”。 但他承认,光靠持续收紧信贷审批门槛治标不治本。要在缺乏外部大数据风控支持的情况下防范黑中介与老赖“袭扰”,最根本的解决方法就是将原先外包的大数据风控业务转为“自主研发”。 “其实,近日多家通过爬虫技术开展大数据信贷风控的公司被查,主要原因是他们涉嫌采取违规手段过度获取用户大量隐私信息,并将这些数据信息转卖给其他机构获利。若互联网消费金融平台自己能通过合规方式获取这些数据,并仅限于自身风控用途,是可操作的。”一位国内大型P2P平台风控主管表示。 21世纪经济报道记者多方了解到,也正因此,不少互联网消费金融平台正着手自建借款人数据获取渠道、并完善大数据风控体系,而不再向第三方风控技术输出平台采购“数据”。 “但这可能是一项苦差事。”一家正在着手自建借款人数据获取渠道的P2P平台负责人向记者坦言,究其原因,他所在的P2P平台缺乏大数据分析与AI建模人才,将这些借款人数据转化成成熟有效的风控模型。 在业内人士看来,这势必加速整个消费金融行业的优胜劣汰进程,越来越多缺乏自主获取借款人数据渠道以及持续优化风控体系能力的平台将以“更快的速度”离场。 “多家依托爬虫技术开展大数据风控的公司被查,第三方支付公司也可能是下一个波及者。”一位金融科技公司合规部主管认为。 风控外包时代终结 李诚告诉记者,此前不少互联网消费金融平台的风控体系,都相当依赖这些借助爬虫技术提供大数据信贷风控的机构。 比如,这些机构会通过爬虫技术,了解到借款人手机是否下载了多个消费借款APP(存在多头借贷风险),手机通讯记录里是否存在黑中介联系方式与通话记录(存在欺诈风险),是否每天夜晚花费大量时间浏览各类网站(工作未必稳定),是否经常搜索“借款”等字眼(个人借务问题可能恶化需要借新还旧)等,以此作为互联网消费金融平台决定是否给予贷款的重要参考依据。 他承认,其中不少借款人信息超过了他们所允许的范畴,但它的确对平台风控体系优化起到一定促进作用,因此每个月平台都会花费数十万元资金采购上述机构提供的,基于爬虫技术所获取的各类借款人隐私数据信息。 李诚坦言,近期他们发现一些老赖之所以能通过美化个人财务报表成功套取贷款资金,主要原因是平台风控体系缺少外部第三方数据“支持”,无法判断这些“借款人”是否与黑中介存在微信联系,让他们有机可乘。 因此,他所在的平台决定收紧借款人审核门槛以降低信贷坏账风险。但此举很快招致业务部门的反对,甚至业务部门主管直接找到平台负责人抱怨“业务规模没增长,大家吃不饱(收入减少)闹情绪。” 上述国内大型P2P平台风控主管也坦言,在多家通过爬虫技术开展大数据信贷风控的公司被查后,当前互联网消费金融行业正呈现两极分化趋势。 一方面,将风控外包的平台面临较多风控漏洞盲点,不得不压缩业务规模抬高信贷审核门槛规避坏账风险。另一方面,不少自建借款人信息获取渠道并实现大数据风控的平台依然在快速扩张业务规模。 “其间我们也考虑过自建借款人数据获取的渠道与技术系统,但我们发现当前擅长借款人行为特征大数据分析与AI建模的人才相当稀缺,即便平台愿意给出高薪也未必能请来。”李诚透露。因此平台正打算收购一家大数据风控公司部分股权“替代”,但前提是这家公司必须完成爬虫技术整改确保合规操作。 跨境支付反洗钱审查新压力 值得注意的是,多家通过爬虫技术开展大数据信贷风控的公司被查,也悄然波及第三方支付机构。 一位从事跨境支付业务的第三方支付机构风控主管向记者透露,当前他们已不大敢获取电商平台提供爬虫技术所提供的消费者各类隐私数据信息,担心此举同样“不合法”。 “以往,我们之所以要通过合作电商平台获取消费者隐私数据,主要目的是核查他们是否存在洗钱行为。比如当某个消费者有规律地在固定时间反复溢价购买特定的贵重商品,或者频繁变更自己银行账号进行跨境付款,我们就会怀疑他可能存在洗钱行为,并因此加大反洗钱监管。”这位第三方支付机构风控主管告诉记者,若缺乏这些隐私数据,他们对用户洗钱行为的判断能力可能会减弱,反而会遭遇金融监管部门的警告与处罚。 因此他所在的第三方支付平台也专门讨论了相应的解决方案,一是加大投入购买更多的反洗钱黑名单资料。二是要求合作电商平台明确告知消费者用户,电商平台通过爬虫技术所获取的用户某些隐私信息将被用于跨境支付反洗钱审查。 “听说还有个别第三方支付机构干脆借鉴去年5月欧盟出台的《通用数据保护条例》(简称GDPR)做法,即要求电商平台在用户每次跨境购物付款时,都要获得用户相应的数据授权协议,允许第三方支付机构使用用户部分隐私数据用于反洗钱审查。”前述风控主管指出,但此举一方面会导致用户消费体验下降,另一方面会令整个合规操作成本大幅提升,在当前跨境支付市场竞争趋于激烈的情况下,其盈利周期又被大幅拉长。[详情]
原标题:突发!又一家爬虫供应商被警方一锅端 来源:开放财经 知情人士向开放财经透露,杭州存信数据科技有限公司(简称“存信数据”)被杭州市公安局西湖分局古荡派出所查封。存信数据,运营平台公信宝。 工商信息显示,存信数据,注册于2016年10月28日,注册资本750万元,法定代表人、执行董事兼总经理为黄敏强。该公司出资结构为:黄敏强,66.5%;涂国君,18.5%;李笑来,7.5%;天津真格天弘资产管理合伙企业(有限合伙),7.5%。 业内人士向开放财经透露,存信数据的平台公信宝主要业务除了爬虫,还有区块链,其在爬虫方面的优势是电商类做得比较好。 在一份2018年的产品价格服务表中,公信宝介绍了其爬虫类数据类型涵盖社保、学信网、京东、电信、移动、联通、智联招聘、芝麻信用分、微信、支付宝,甚至是人行征信数据,等等。 在公信宝官网的宣传视频中,公信宝介绍其数据经过用户授权,并将私钥交给用户管理,只有用户能掌握其数据,且使用数据需要用户授权。[详情]
原标题:大数据风控行业风波发酵:多家公司停止运营商爬虫服务 近日,魔蝎科技、新颜科技等多家大数据风控公司迎来风波。 详见:9月9日《两家智能风控公司被查?魔蝎创始人失联,新颜称没收到通知》 21世纪经济报道记者采访了解到,上述两家公司受此风波影响,或与运营商爬虫业务有关。 多家机构停止运营商爬虫服务 21世纪经济报道记者继续追踪,9月10日,记者拨打魔蝎科技创始人周江翔电话,依然无人接听。 华北一家网贷平台人士表示:“跟魔蝎科技有合作,它提供反欺诈服务,不过,上周末魔蝎科技便停止了合作,也联系不上对方,网贷平台新客户申请受到影响。” 9月10日,21世纪经济报道记者联系新颜科技客服,对方表示:“没有接到相关通知,业务正常开展。” 一家与新颜科技有合作的公司高管告诉21世纪经济报道记者:“新颜科技应该是把运营商爬虫业务停了,我们一直没有使用过这个功能。我们使用他们的多头借贷查询功能,还在正常运营。” 另一家与新颜科技有合作的网贷平台人士也称,运营商爬虫业务停了,其他业务正常进行。 还有一家合作方表示,看到新颜出事的消息后,随即主动停止了合作,并更新了风控模型。 记者再次询问新颜科技客服是否停了运营商爬虫业务,并提出采访,不过,截至记者发稿,尚未收到明确回复。 值得一提的是,启信宝显示,新颜科技法定代表人是郑炳敏,穿透以后,实际控制人也是郑炳敏。记者了解到,郑炳敏也是宝付支付的法定代表人。 除了魔蝎科技、新颜科技,又传出聚信立业务调整的消息。 近日,聚信立曾向商户下发通知称,为积极迎合国家日益收紧的监管政策,保证所有商户业务运作的合法合规,聚信立将对现有的业务板块作出如下调整:2019年9月6日23时起,聚信立将暂停对外提供用户授权的运营商爬虫服务。 对此,21世纪经济报道记者联系聚信立方面,对方仅称“这是行业趋势”。 一家网贷平台人士表示,9月6日晚上,聚信立确实停止了相关合作。 聚信立官网显示,上海诚数信息科技有限公司(聚信立)成立于2013年7月,是国内最早专注大数据智能解决方案的服务商之一。截至目前,已有超过2900家的企业客户选择了聚信立的产品和服务。短短数年的运营时间,聚信立先后获得了由京东金融、竑观资产、领沨投资领投的两轮共计1.3亿元的融资。 同盾科技称“已全部停止数聚魔盒业务” 近年来,以同盾科技为代表的大数据风控公司兴起,服务网贷、消费金融等行业,此次风波对同盾科技有何影响? 9月10日,同盾科技相关人士回复21世纪经济报道记者称,数聚魔盒业务为同盾科技旗下信川科技有限公司产品,这项服务对适用条件与场景有严格授权要求与限制,为更加严格的保护用户合法权益避免误用,主动积极配合保护个人信息的相关法律规定与政策,信川科技自2018开始就已逐步调整压缩,截止目前已全部停止相应服务。 数聚魔盒业务宣传材料显示,2018年7月,“数聚魔盒”曾宣布启动品牌升级,此次推出的全新产品“万象”系列,与之前的魔方系列、百川平台共同形成了一个完善的产品及服务体系。在本次产品升级中,“魔方”产品覆盖的数据源有了质的飞跃,数据服务涵盖运营商、电商消费、资产信息、身份职业、社交关系、生活服务等多个领域,支持超过800个数据来源,服务地区从国内延伸到东南亚多个国家。 数聚魔盒能够满足不同业务场景的需求,已经为银行、保险、汽车金融、小微企业、非银行信贷、消费金融、电商等多个行业客户提供基于大数据的智能决策服务。 以消费分期为例,运用电商消费数据能够有效评估申请人的消费水平,还款能力以及资信情况,同时精准地刻画用户消费偏好,能够支撑精准营销等业务。业务端对接魔方数据的SDK,保证了良好的用户体验,也避免了申请人信息的伪造可能。 收集、使用信息需经授权,不能买卖数据 上述与新颜科技有合作的公司高管解释,所谓运营商爬虫服务,是在用户授权账号的前提下,登录用户的运营商账户,抓取一些手机卡过往使用情况的信息,包括使用时长、常用联系人、套餐信息等,以此验证机主的真实性来做风控,主要用于反欺诈。 “大数据风控公司保护好用户隐私,是没有问题的;如果对外售卖用户隐私信息,就有问题了。”上述高管表示。 一家大数据风控公司负责人告诉21世纪经济报道记者:“已有相关法律,只要合法经营,就不会有问题。关键在于,收集、使用信息必须经被收集者同意,不能买卖数据。不法的数据服务或者数据从业机构可能毁灭大数据风控这个行业。” 早在2017年6月1日,《网络安全法》正式施行,比如第四十一条规定,网络运营者收集、使用个人信息,应当遵循合法、正当、必要的原则,公开收集、使用规则,明示收集、使用信息的目的、方式和范围,并经被收集者同意;第四十四条规定,任何个人和组织不得窃取或者以其他非法方式获取个人信息,不得非法出售或者非法向他人提供个人信息。[详情]
专题评论加载中...
Copyright © 1996-2019 SINA Corporation, All Rights Reserved
新浪公司 版权所有