温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
2023
数据
时代
中国
机遇
挑战
天道酬勤
大数据时代中国征信的机遇与挑战
卢芮欣
:大数据时代的到来在各个领域都开启了一场革命,让所有行业都逃不过互联网思维和大数据时代背景。征信业与大数据天然契合,在我国征信业进入快速开展期时,抓住大数据的时代契机乘势而上,将会实现我国征信业开展的大跨越。但面对越来越大的海量数据资源,大数据不仅是征信业转型升级的历史机遇,也带来前所未有的巨大挑战。我国征信业开展应基于大数据时代特征从技术和业务模式、监管和保障机制等方面进行完善。
关键词:大数据;征信业;云计算
文章编号:1003-4625〔2023〕02-0103-05
中图分类号:F820.4
文献标志码:A
一、我国征信体系开展现状
我国征信业起步较晚,改革开放后才开始建设征信业,但开展成效颇为显著。30多年来,征信业发腱已经初具形态和规模,并逐步走向标准化。征信市场初步形成以央行的个人和企业金融信用信息根底数据库为根底,以政府背景的征信机构为主导,各类社会征信机构快速开展的多元化格局,和以信用登记、信用评级、信用调查等根底业务为主体,信用风险管理、信用培训、信用咨询等创新性增值业务快速开展的多层次产品格局,以及涵盖信贷、企业和个人信用、债券等多方面,涉及企业、个人、机构等多主体的全方位征信效劳市场。征信法制建设形成以征信业管理条例和政府信息公开条例为根本法律框架,以征信机构管理方法个人信用信息根底数据库管理暂行方法银行信贷登记咨询管理方法〔试行〕等部门规章和中国人民银行信用评级管理指导意见等标准性文件为辅助的多层次制度体系。按照2023年征信业管理条例和征信机构管理方法,我国开放了个人征信业务,允许取得牌照的市场化机构从事个人征信,未来百花齐放的市场格局将成为央行征信系统的有力补充。同时,社会信用体系建设逐步推进,国家层面的征信体系规划已经出台,地方性社会信用体系建设机制也有多地建立,行业信用建设有效开展,中小企业信用体系和农村信用体系建设逐步推进,征信宣传成效显著,全民信用意识逐渐提高。
2023年6月27日,社会信用体系建设规划纲要〔2023-2023年〕公布,政务诚信、商务诚信、社会诚信和·司法诚信成为重点建设领域。经济快速开展和全社会信用意识提高带来巨大的征信市场需求,我国征信业进入快速开展期。
二、大数据与征信业
大数据〔Big Data〕是如今最火的话题,无论是否已经了解和做好准备,大数据时代已经强势到来,并在各个领域都开启了一场革命。大数据尚无公认的定义,麦肯锡2023年发布报告大数据:创新、竞争和生产力的下一个前沿认为,大数据指规模远超传统数据库处理能力的海量数据集合。就数据量来说,一般指1000T以上的数据,相当于400至500台一般配置的容量。大数据并非单指容量大〔 Volume〕,更意味着数据多样〔Variety〕、经挖掘后价值高〔 Value〕、数据创立和处理速度快〔Velocity〕,此即大数据的4V特性。后来,大数据被引申为一种数据处理模式,即通过收集海量而全面的数据,并通过实验、算法和模型分析,挖掘规律、获得有价值信息。实际上,大数据并非新鲜事物,根据IDC〔Inter-national Documentation Centre,国际文献资料中心〕201 1年数字宇宙研究报告从混沌中提取价值,单就数据量而言,2023年起全球就已跨入ZB时代展运用仍处于初期,只因以往计算机联网水平、处理水平、信息积累能力等其他条件滞后限制了大数据产业的开展。
云计算〔Cloud Computing〕是基于互联网的分布式计算技术,更是一种资源的交付和使用模式,指通过网络以按需的、易扩展的方式获得所需资源〔包括软件、硬件、平台〕,它意味着计算能力也可以作为一种商品通过互联网按需购置和使用。云是互联网的比喻说法。透过云计算技术,网络效劳提供者可以在数秒内到达和超级计算机同样强大效能的信息处理效劳。最简单的云计算技术如搜索引擎、网络信箱等已随处可见。云计算与大数据是相辅相成的,二者都为数据存储和处理效劳,就如硬币的两面,有了云计算的有力工具,大数据技术才成为可能;有了大数据的业务需求,云计算才有用武之地。
现在,所有行业都逃不过互联网思维和大数据时代背景。征信业天生和大数据联系在一起。大数据是采集数据并挖掘分析其背后的信息以供决策参考,而征信的本质就是采集和记录信用信息并整理加工后提供应决策者,只不过在大数据时代,一切数据都可以成为信用数据,经分析后用于证明一个人或企业的信用状况。因此,征信业内在具有优化数据处理、降低信用信息加工本钱的动机,与大数据天然契合。当前,大数据的经济价值逐渐开始显现,抓住大数据的时代契机、乘势而上,将会实现我国征信业开展的大跨越。但面对越来越大的海量数据资源,不仅是征信业转型升级的历史机遇,也带来前所未有的巨大挑战。
三、大数据时代我国征信业的新机遇
〔一〕大数据能有效扩大征信业务的覆盖范围
互联网金融对于推动征信业的开展和大数据在征信业的应用起到了不可无视的作用。许多互联网金融企业已经意识到,信用风险控制技术才是互联网金融未来成功的核心。这一观念引发的大量征信需求并不能被原有的征信系统和产品效劳满足,因为央行征信系统不对互联金融公司和其他征信机构开放,即使开放,央行征信系统建立档案的8.4亿人中,也只有3亿多人有过金融机构借贷记录,作为现代征信主体的信贷征信此时几乎无能为力,但大量没有信贷记录的个人却可能在互联网金融公司或其他机构有信贷记录,更可能在网络上留下大量如lP地址等行为记录信息。大数据的应用就能有效解决这些未能被传统征信体系很好覆盖的众多长尾客户。因此,许多企业嗅到了巨大商机,这其中大多是互联网金融企业和纯IT效劳企业,真正的征信机构尤其是内资征信机构寥寥无几。这些企业凭借自身的IT技术优势和所拥有的大数据资源,自发地开展信用风险管理和控制,对其顾客做出更有根据的信贷决策,并逐渐掌握了不依赖央行征信系统的风控技术。如:阿里小贷通过企业行为分析企业信用状况,企业行为不仅包括信用记录、成交数额等结构化数据和用户评论等非结构化数据,也包括水电煤缴费等生活信息;美国的Lending Club是利用社交网站关系大数据进行网络借贷信用管理的典型,通过在facebook上镶嵌一款应用搭建借贷平台,借款人被分为假设干信用等级,却不必公布自己的信用历史。互联网金融对信用产业的渗透为我国私营征信业务的开展做出了开创性的奉献,并为公共征信系统的建设和整个征信体系的构建提供了新思路。
〔二〕大数据能极大拓展信用信息的来源和范围
信息革命带来数据的爆炸式增长,移动互联网的应用进一步加速数据的产生速度,社交网络、电子商务等让将人们的日常生活搬上网络,互联网上的数据每18个月就翻一番。这为征信数据采集源自日常生活,而非仅仅源于特定领域提供了可能。其实,万事万物及其变化皆为数据,而一切数据皆是信用数据,大到城市交通信息、经济运行数据,小到一个人的心率、脉搏、脑电、性格倾向和网上行为等都可以是信用数据。只是大局部数据仍处于线下,但随着物联网兴起,未来将实现线下信息全部线上化。目前互联网金融用于信用分析的大数据主要有电商类网站大数据,信用卡类网站的大数据,社交网站的关系大数据,小贷类网站的信贷大数据,第三方支付类平台的消费大数据,生活效劳类网站如水、电、、网络费等交纳情况的大数据等。IT技术开展实现了便利的海量数据收集和存储,极大地拓展了信用信息的来源和范围,也颠覆了以往征信中只将信贷等特定的、真实的数据视为有效信用数据的观念。美国Turbo Financial Group在其大数据信用分析中主张所有信息看关联不看因果,IP地址、品牌、是否玩游戏等信息在信用评价中都很重要,甚至在美国申请信用卡时姓名的大小写也反映出一个人的信用指数,而且认为用户给的所有信息都是有用信息,甚至是说谎、隐瞒、写错的信息都可以是反映一个人的关键信息。再如,北京百分点信息科技根据年龄、性别、工作、学历、兴趣爱好等个人根本属性数据,和搬家及更换通讯号码的次数、购物风格、汽车和电子产品品牌、互联网标签,甚至浏览网站的次数和时长、观看的文章及篇数等各类信息构成的行为属性数据一起,对用户进行画像分析,输出统计学特征,用以评估风险、信用状况、预测信贷需求等。
〔三〕大数据和云计算为信用信息平安存储和全面共享奠定了根底
随着信息和数据量以几何级数增长,信息的管理难度越来越大,对数据存储容量和可靠性也提出了更高的要求。大数据和云计算的出现让海量信用数据的存储、处理和共享成为可能。一是云计算在云端提供大型效劳器集群、无限容量的虚拟化分布式计算与存储性能、各类应用软件和信息共享平台等虚拟资源,能够有效降低征信系统建设的根底设施本钱,增强系统数据的可靠性和存储能力,通过云端平台实现信用数据的全面共享,为征信系统的建没提供强有力的技术支撑。二是云计算技术能够在发生不可抗力事件时将数据平安迅速地转移到云内的其他效劳器保存,不会因为个别终端或效劳器出现问题导致资料散失,提高征信系统应对不可抗力事件的能力。三是云计算对数据进行多层平安机制保护,集中存储、统一管理的数据更容易实现平安实时监测,一旦发现某个终端遭遇入侵攻击,该终端会将入侵程序的相关信息发送至云端,云端效劳器会对云内所有其他节点的计算机发出相应质询请求,实施同步检测和平安防御。四是云效劳提供商对网络资源进行集中布置,可以有效防止内部人员泄密的风险。2023年的国务院机构改革和职能转变方案提出建立以公民身份证号码和组织机构代码为根底的统一社会信用代码制度。国家发改委和中国人民银行拟牵头建立国家数据交换平台,实现央行、工商总局、税务总局等各部门的数据库整合。在未来,这些都离不开大数据和云计算的技术支撑。
〔四〕大数据技术和云计算为信用信息处理提供强大的技术支持
大数据最重要的不是“大〞和“数据〞,而在于价值。大数据并非仅停留在海量数据会聚的层面,处理后的数据所能带来的经济价值是大数据的终极意义所在,因此,数据的价值含量和挖掘本钱比数量更为重要。如何驾驭和用好大数据,从海量数据中快速提取出有价值的信息为信用决策效劳,未来要依靠云计算和数据挖掘处理技术的结合运用。第一,云计算的超强计算性能配合大数据技术,可以实现对所有掌握的数据——而非随机抽样——迅速进行专业化存储、分析、处理和挖掘,大大增强信息处理能力。Turbo Financial Group正在致力于在信用计算中将离散数据信息变成是连续、实时的动态信息,最大限度消除信息时滞,全面提高征信效劳的时效性。第二,当前,80%以上的信息都是复杂的非结构化数据,包括纸质信息和图片、音频、视频等数字信息,仅对少数结构化数据的分析已经无法适应开展的要求。碎片化的海量非结构化数据极为重要,但这在以前很难以利用,因为大量纸质信息难以转化为数字信息,即便消耗大量人力逐一录入,格式多样的信息之间相互也不兼容。多样的数据要求更高的数据处理能力,而数据多样化正是大数据的特征之一,大数据就是解决传统数据仓库所不能解决的问题,实现一切皆可数据化、一切皆可量化。这为将来收集大量非结构化数据用作征信分析提供了技术根底,而这正是未来信用数据收集和分析的方向。
〔五〕大数据和云计算能有效提升信用数据的挖掘深度
数据运用是否有效决定了它的价值,大数据更深层的意义在于它对数据处理的优势不仅是扩大样本量和提高速度,还能对所有数据进行深度挖掘,通过数据集成共享和交叉复用实现价值最大化。大数据意味着大资源,大数据平台将以往被分割的、零散的各类数据聚集起来处理,基于更广阔的时间尺度和更细级别的粗糙粒度,进行全维度分析,实现动态数据搜集和处理、更高程度的共享和无阻碍的数据间交叉使用和关联分析,其数据挖掘深度非传统技术可比。目前,大数据分析技术已有许多种,对非结构化数据的挖掘方法尚未形成体系,主要以描述量化、频数分析等量化思路为主,以及基于模型的多维聚类等。总体来说,大数据挖掘技术丰要为两类:一类是基于假设的模型,是传统模型方法的升级,是一种计算机辅助的人机综合系统;一类是不基于假设的