主持人(修奇):欢迎回来,这里依然是修奇陪伴各位的国家应急广播高速加油站,进入我们今天的第一现场,此前51信用卡被查事件让本就处在风口浪尖的大数据风控领域再添一把火,业内人士透露,在隐私保护薄弱、数据安全存在漏洞的国内互联网环境中,爬虫技术往往与信息来源违法,滥用这些问题交织在一起,近期不断发酵的大数据风控领域的热点事件中,爬虫技术在其中扮演了什么样的角色?未来又该如何规范呢?我们来听央广记者李行健的报道。
记者:近一段时间,杭州,深圳等地多家大数据风控公司被曝出遭警方调查的消息,杭州警方发布的微博,今年9月以来,杭州警方接上级部门线索传递,结合日常工作发现51信用卡涉及大量各地异常投诉信息,警方针对其委托外包催收公司涉嫌寻衅滋事等犯罪行为展开调查,51信用卡公司CEO孙海涛在接受媒体采访时表示,根据一些用户的投诉,公司已检测到一些公司存在暴力催收情况,并对第三方公司进行了罚款处分,但收效甚微。
我们在今年的五六七月份逐渐的把所有的催收业务都停掉了,转化成我们自己直营的,直营的话有个好处,所有的环节你都可以按照你认为比较规范的策略要求去做,让这些业务尽可能合规。
记者:51信用卡公司是否存在暴力催收等问题仍在调查中,不过此次事件也使得整个大数据风控行业和其背后的爬虫技术,再一次引发了舆论的广泛关注,所谓网络爬虫是一种按照一定规则自动抓取互联网信息的程序,业内人士透露,在大数据风控行业中,以网络爬虫获取信息数据的做法最为盛行,而违规使用买卖爬虫得来的数据则是导致数据泄漏,隐私泄漏等一系列问题的根源,中国政法大学传播法学研究中心副主任朱威表示。
爬虫技术本身是没有法律性可言的,它纯技术的这么一个手段,但是如果把爬虫技术能运用到侵害公民个人信息,特别是关于定位,关于你其他的在互联网上出现的隐私,把它拼起来,拼成一个可识别到个人的身份信息的时候,这个技术就是被滥用的范围内,这涉及到一个侵害公民个人信息犯罪的一个范围。
记者:据了解,爬虫技术主要分为两类,一类是公开爬虫,另一类是授权爬虫,前者是指只能扒取公开发布的数据信息,比如企业的工商信息,公开社交平台信息等,而授权爬虫则是指要求用户提前授权,从而扒取到用户个人的通讯录,邮箱,司法信息,APP使用,电商平台等隐私数据,授权不授权理应自己说了算,而在公民的生活场景中,很多软件和平台服务能够使用的先决条件就是用户点击确认完成授权,这也使得授权不授权在实践中未必由用户说了算。
点我同意是信息采集的一个必经通道,如果不点我同意,就是没有授权,那么拿到的信息肯定是违法的,但是如果点了我同意之后,到底哪些信息把它拿出去的?怎么使用?期限是什么?有没有交给用户自己控制权利?这个就是我们所说的合法性正当性和必要性中的必要性范围。
记者:业内人士透露,部分大数据公司还存在在授权的界线之外扒数据的现象,这些信息未必直接被摆上货架,但却往往待价而沽,成了数据公司自家后院的蓄水池,而这些大数据公司往往与P2P金融服务等挂钩,继而滋生了灰色的数据生意,财经评论员叶谭。
他用了爬虫技术,他把这个数据出售给别的企业,随之而来的是一个信用风控体系这个模型建立问题,风控体系是比较行之有效的,各家都把自己的数据看的比较贵重,所以得到数据,其实我们虽然是大数据时代,但是处于一个个数据孤岛上,那爬虫技术现在又受到质疑,所以边界在哪里?怎么样分享技术?怎么样来保护隐私?保护权力?这个是接下来要重点探讨的问题。