由于中国的消费金融需求旺盛但服务相对落后的行业特点,导致行业内数据滥用现象严重。
此前,人民银行征信中心副主任汪路在公开场合表示,在当前征信体系已经严重滞后于经济、金融发展需求的情况下,这些弊端应当受到高度重视并有效解决,以促进征信体系建设的顺利推进,降低经济和金融风险。
滥用数据现象体现了行业对个人征信市场的迫切需求,而随着百行征信的设立以及监管的重拳整治,野蛮生长了几年的大数据征信行业,进入洗牌期。
搭建个人征信体系需求迫切
“爬虫技术对个人隐私、数据滥用有推波助澜的作用。但这也从另一个角度体现了市场对于个人征信数据的一个需求。”北京大学金融智能研究中心研究员刘新海对第一财经记者表示。
目前,行业内滥用数据现象严重。刘新海认为数据滥用现象,主要可归纳为三类,一是采集数据过多,并未经过消费者本人同意;二是非法购买、数据倒卖;三是爬虫技术获取。
此前,消费金融领域一直是信息泄露的重灾区,倒卖数据现象比较严重。例如,用户在互金平台申请贷款时,需要填写电话号码、身份信息、银行卡等信息外,还要填写信用卡、车辆、公积金、甚至淘宝等网购平台的消费账单等,这些数据常常被数据供应商拿来倒卖。
在互金行业内,互金公司获取消费者的数据成本在运营成本中占比较高,造成了很多p2p等新兴借贷平台在购买数据防欺诈、降风险方面耗费了太多成本。 又由于市场数据分散,互金公司在购买数据时,往往批量购买,后由互金公司整合构成自己的一个征信数据来源。
“去年国家安全法以及两高的司法解释出台后,倒卖倒买个人数据现象得到了一定的缓解。”刘新海称。
《中华人民共和国网络安全法》作为我国网络领域的基础性法律,明确加强对个人信息保护,打击网络诈骗,重拳整治行业乱象。法律规定任何个人和组织不得窃取或者以其他非法方式获取个人信息,不得非法出售或者非法向他人提供个人信息,并规定了相应法律责任。
在爬虫技术方面,刘新海认为,爬虫技术之所以在互联网金融行业应用普遍,主要是源于p2p等互联网金融公司急需对借款人做信用评估,以防止欺诈行为。
“网络爬虫是互金平台获取借贷人信息数据的一种技术,但这种行为有时并不合规,例如现金贷行业出现一种‘同业爬虫’产品,可以直接将其他现金贷平台的放款额和风控数据爬出来,相当于其他的平台帮助你做了风控。”
刘新海表示,真正的风控技术需要投入人与时间,需要付出一定的代价买教训。从目前来看,很多公司都表示已加大投研力度,提升风控水平,但其实从行业、技术角度出发来看,互金行业的风控技术总体来说还比较落后,主要问题是消费金融服务需求太过迫切。
“只要公司做好营销,解决欺诈及获客问题,就可以挣钱,那么为什么还要花大量时间去做风控呢?这是行业矛盾的地方。根据互金行业的实际情况,过去一段时间,风控对于互金公司(特别是现金贷公司)的盈利能力而言并没有起到关键作用。”
用技术助推征信体系建设
征信体系与技术联系非常紧密,在大数据、人工智能技术迅猛发展的背景下,如何将用技术助推征信体系的建设,也是目前我国征信市场面对的一个挑战。
根据刘新海介绍,征信对我国而言本来就是“舶来品”,并且市场化公司参与多、发展渠道多。欧美发达国家是征信基础设施和金融体系循序渐进、同步发展,而我国则是经济发展倒逼征信体系发展,是跨越式发展。另一方面,单一的征信模式已无法满足消费经济活跃、需求旺盛的市场现状,因此需要通过其他的渠道来解决这个需求,所以一些市场化的互联网公司、大数据公司也想参与征信体系的基础设施建设。
相比移动支付,互联网时代的个人信用体系建设将给市场经济带来更深变革。对于互联网巨头而言,个人信用体系的建设可以成为一个新的经济形态的入口,在此背景下一些互联网公司纷纷推出信用分业务。巨头参与征信基础设施建设,如何在过程中保证公平正义、保护消费者隐私,是征信体系建设过程的一个重要的问题。
2月22日,央行下发了首张个人征信牌照,百行征信有限公司申请设立个人征信机构已获得许可,个人征信牌照有效期为3年。这一平台成立的主要目的,是把央行征信中心未能覆盖到的个人客户信用数据纳入,构建一个国家级的基础数据库,实现行业的信息共享,以有效降低风险成本。
此前,唯品金融副总经理汤磊对第一财经记者表示,目前整个行业发展过程中存在的突出问题,首先是信息的碎片化,出现“信息孤岛”,各家机构均把信息看成自己的核心资产,不愿拿出来共享或拿出来共享的信息数据失真,导致个人多头借贷、过度借贷、骗贷等行为不断出现;第二,随着大数据征信的概念炒得比较热,存在利用个人征信之名,过度采集或未经授权采集个人信息的情况。
百行征信的设立或许能够有效解决消费金融领域的数据孤岛问题,也能清理数据买卖的乱象。但业内对于“老八家”入股百行征信之后是否愿意共享数据存疑。那么,如何打造一个有效打破数据壁垒的信息共享平台?
“我认为互金协会的信用信息共享平台将成为百行征信未来主要的征信数据来源。百行征信最后也许不需要8家征信公司的数据,因为有的数据它们不想拿,也拿不出来。”一位接近央行人士此前对第一财经记者表示。
他指出,征信数据是有囊括标准的,在一定维度内的数据将被纳入征信数据。例如,个人的信贷历史,征信数据需要匹配到每个人,需要个人的标识信息,需要一个清晰的边界。但此前央行批复的“筹备成立”个人征信业务的8家机构,由于数据维度太广,并没有局限于传统的征信数据维度。因此,一旦按照征信数据标准收窄维度,会影响机构的金融生态体系。
从技术的角度来看,区块链技术或许可以解决机构间不信任的问题。中国信息通信研究院云计算与大数据研究所主任韩涵表示:“信用领域是区块链的应用场景之一,用区块链共享信息,一方面信息共享透明,机构之间可相互看到彼此都共享了哪些信息,比较放心;另一方面,通过区块链的技术来精准地记录你所共享的信用,把市场本身进行记账,同时设置不同的激励机制和运营模式,来实现信息的共享。”
另外,在防止数据泄漏方面,刘新海认为,区块链分布式、多约束的特点对于黑客来说挑战比较大。“身份信息用区块链存储是分布式的,系统的安全性会加强。同时,由于所有行为都在链上体现,对数据质量、真实性也有了保证。区块链技术可能是未来新一代征信系统的底层架构的一种选择。”但他同时指出,如何提高对海量征信数据的处理效率,也是区块链技术在实际应用中存在的一个问题。