消费行为在个人信用风险识别中的

淘宝交易  时间:2021-01-25  阅读:()

信息含量研究*王正位周从意廖理张伟强内容提要:本文使用某现金贷平台的借款人数据,研究消费行为信息在个人信用风险评估中的信息含量.
研究发现,对于现金贷借款人这类信用记录不足的群体,传统征信信息往往不足以识别借款人的信用风险,而通过大数据技术引入更加高频的消费行为信息能够有效补充额外的信息含量,提高对信用信息薄弱人群的风险识别效率.
传统征信信息和消费行为信息提供的信息含量互不相同,不能相互替代.
因此金融科技创新对传统征信系统以外信息的利用有助于降低消费信贷市场的信息不对称.
本文创新性地利用真实的微观信贷数据对不同信息的信息含量进行了比较,对消费金融的理论和实践都具有重要价值.
关键词:消费行为风险识别征信信息消费信贷*王正位、周从意、廖理、张伟强,清华大学五道口金融学院,邮政编码:100083,电子信箱:wangzhw@pbcsf.
tsinghua.
edu.
cn,zhoucy@pbcsf.
tsinghua.
edu.
cn,liaol@pbcsf.
tsinghua.
edu.
cn,zhangwq@pbcsf.
tsinghua.
edu.
cn.
本研究得到国家自然科学基金项目(71472100,71790591,71790605)的资助,作者感谢匿名审稿专家的宝贵意见,文责自负.
①数据来源:中国人民银行、中国支付清算协会.
一、引言随着金融科技的发展,金融市场中的海量信息能够被高速处理,新的信息来源和信息加工方式在一定程度上改变了传统金融服务的运作模式.
信息处理技术加速了金融交易信息与其他类型信息的融合,在个人消费信贷市场中,用于个人信用风险评估的信息呈现出越来越多元化的趋势.
作为一种金融工具,消费信贷使消费者能够实现更加平滑的跨期消费.
但在传统的征信环节中,却较少使用消费行为信息对消费者的信用风险进行评估.
消费行为信息是否能为个人信用风险的评估提供有效的信息含量本文使用消费信贷市场的微观数据对这一问题进行探究.
个人消费信贷市场是金融科技最早进入的领域之一.
消费信贷市场上存在较严重的信息不对称,传统金融的服务范围有限,我国居民长期面临着严重的信贷约束.
根据中国人民银行的统计数据,截至2018年底我国居民人均持有信用卡0.
49张,远低于欧美国家的水平.
而家庭和个人的消费信贷需求旺盛,2018年底我国居民消费性贷款余额为12.
05万亿元(不包括房贷),其中信用卡贷款余额6.
85万亿元.
从2013年到2018年,消费性贷款余额年均增速为30.
53%.
①随着金融科技的发展,大量电商平台、网贷平台等非传统金融机构纷纷向消费者提供各种消费信贷服务,包括先消费后还款的"类信用卡"、消费分期和现金贷等,丰富了我国的消费信贷市场.
消费信贷面向广大居民家庭和个人,通常具有小额、分散、无抵押的特征,难以通过贷后监督的方式降低借款人道德风险,因此贷前审查成为消费信贷市场应对信息不对称的重要环节.
在个人征信体系较成熟的国家,个人信用评分是金融机构发放消费信贷的重要决策依据.
美国的FICO评分由五方面的信息构成:历史信用偿还表现、信用账户数、信用历史年限、持有的信用账户类型和9412020年第1期新开立的信用账户.
①在我国,中国人民银行征信中心出具的个人信用报告是最重要的信用信息来源,主要内容包括个人在银行等传统金融机构的借贷和还款情况,以及信用报告被查询的记录,包括是否有欠税、民事判决、行政处罚等个人信息.
2018年5月,我国第一家市场化个人征信机构"百行征信"正式开始营业,百行征信的主要业务是在传统金融机构以外的借贷领域开展个人征信活动,搜集个人在P2P网贷、现金贷等平台的信贷服务使用情况,与征信中心的个人征信报告形成信息互补.
长期以来,个人征信结果高度依赖于信用历史.
无论是FICO评分,还是人民银行征信报告,使用的核心信息都是消费者的借贷历史和还款表现,这类信息与借款人未来的还款行为高度相关,对个人信用风险的预测能力较强.
但我国消费信贷市场近年来才迎来大规模的发展,个人征信活动起步较晚,大量没有银行借贷历史的消费者无法建立有效的信用记录.
根据中国人民银行征信中心的报告,在央行征信系统覆盖的8.
6亿消费者中,只有3.
5亿有借贷历史.
对于没有借贷历史和信用信息不足的群体,如何判断其信用风险并做出合理的授信决策是实践中的重要问题.
在个人征信体系尚未建立完善的现实情况下,金融科技的发展使消费信贷中的个人信用风险评估方法呈现出一定分化.
银行的信用卡和大型电商平台推出的先消费后还款的"类信用卡"属于同质的消费信贷服务,但在授信决策环节,商业银行更注重对传统征信信息的使用,例如重点采集工作和收入信息,以判断信用卡申请人是否具有稳定的收入来源和还款能力,而非传统金融机构更加依赖于网上消费行为、浏览痕迹等外部数据.
与传统征信信息相比,个人的消费行为信息在移动互联网时代具有更高频、更易获取的特征,但无法直接表明消费者的还款能力和还款意愿.
因此,消费行为信息在个人信用评估中提供的信息含量值得探讨.
国内外已有很多关于个人信用风险影响因素的讨论(Bergetal.
,2019;Duarteetal.
,2012;李焰等,2014;廖理等,2015),但关于消费行为信息在个人信用风险识别中的作用,尚未有研究提供直接的证据.
我国当前消费信贷市场丰富的商业模式为研究这一问题提供了适宜的环境,通过对比基于不同信息的信用评估结果对信用风险的预测作用,能够对不同信息的信息含量做出识别和比较.
本文使用某现金贷平台的借款数据,评估了消费行为信息在个人信用风险识别中的作用.
现金贷借款人由于受到严重的信贷约束而同时使用信用卡、"花呗"等多种渠道的消费信贷服务,以信用卡和"花呗"的授信结果分别衡量基于传统征信信息和消费行为信息评估的借款人信用风险.
本文发现,两种信息为借款人信用风险的识别提供了不同的信息含量.
在传统征信信息有效性不足的情况下,消费行为信息能够显著提升对借款人信用风险的识别能力.
消费行为信息为传统征信方法补充了额外的信息含量,因此将消费行为信息纳入信用评估体系能够在一定程度上降低消费信贷市场的信息不对称,对于扩大消费信贷市场服务群体,建立覆盖面更全的个人征信体系具有重要意义.
本文的结构安排如下:第二部分对现有的文献进行回顾;第三部分提出研究假说和实证设计;第四部分描述样本和变量;第五部分展示实证结果;第六部分是结论.
二、文献综述借贷市场中借贷双方的信息不对称是学术界长期关注的重要问题.
Stiglitz&Weiss(1981)首先指出信息不对称会导致信贷配给.
一方面,当出借人无法区分高风险的借款人和低风险的借款人时,给出的平均利率会吸引更多的高风险借款人,一部分低风险借款人被挤出市场;另一方面,高风险借款人通过隐藏信息得到了较低利率的借款,出借人承担的风险和收益并不匹配.
因此,信贷051王正位等:消费行为在个人信用风险识别中的信息含量研究①参见https://www.
myfico.
com/credit-education/whats-in-your-credit-score/.
市场的信息不对称严重降低了市场效率.
为了减轻信息不对称带来的逆向选择和道德风险问题,一些学者讨论了出借人之间共享信息的机制和以独立第三方形式存在的信息中介(Pagano&Jappelli,1993;Padilla&Pagano,1997).
Jappelli&Pagano(2002)最早对信息共享及信息中介在借贷市场中的作用开展实证研究,发现有信用评估中介和信息共享机制的国家,其银行借贷的市场规模更大,违约情况更少.
目前已有大量研究表明,信息中介的存在提高了资金配置效率,降低了市场风险(Doblas-Madrid&Minetti,2013;Giannetti&Jentzsch,2013).
现有的个人信用评分体系以历史借贷记录为核心信息.
Barron(2003)针对不同信用评分体系的研究指出,将账户余额、还款历史等信息纳入信用报告可以使信用评估模型的输出结果更加准确,相对于只记录负面信息的信用报告而言,关于借贷行为的正面信息提高了评估效率.
目前被广泛采纳的个人信用评分模式从多个维度关注信用账户的使用行为,国内外学者对此进行了研究.
我国商业银行采用的信用评分模型与国外并不完全相同,但同样重点关注已有的金融账户和信用服务的使用情况(石庆焱和靳云汇,2004;方匡南等,2010).
2008年国际金融危机之后,对主流征信体系的批判逐渐增加.
Garmaise&Natividad(2017)认为,以FICO评分为代表的主流信用评分体系虽然综合了还款记录、交易记录等多方面的信息,但过度关注以往的负面结果,这一机制本身对借款人造成了负面影响.
因为负面结果可能是由于经济危机等系统性风险或偶然因素导致的,并不一定能反映借款人没有还款意愿或还款能力,过度依赖信用报告的负面信息会导致借款人受到信用约束,不利于借款人后续的还款表现.
由于主流个人信用评分体系建立在历史借贷信息的基础上,对于不同群体的适用性值得讨论.
无法获得主流金融服务的群体面临着较大的信用约束,主要使用发薪日贷款、在线小额贷款等高成本的借贷产品.
次级信贷产品市场上的信息不对称问题尤为严重.
Karlan&Zinman(2009)在南非的小额借款人中开展了田野实验以区分信息不对称带来的道德风险和逆向选择问题,发现道德风险是借款人违约的主要因素,而Dobbie&Skiba(2013)发现发薪日贷款市场上的逆向选择问题更加严重.
Agarwaletal.
(2009)研究了发薪日贷款借款人的行为,认为对次级贷款信用风险的评估应该使用有别于主流的个人信用评分体系,Teletrack评分是主要针对次级信贷产品借款人的信用评分,作者发现Teletrack分数对现金贷借款人违约行为的预测能力远高于FICO评分.
针对互联网时代的新型借贷产品的一系列研究表明,传统信用评分模型之外的很多信息都能反映借款人风险(陈红梅,2015).
例如,在P2P网络借贷市场上,长相、学历、语言等都对还款结果有一定的预测作用,尤其在我国非市场化的利率环境中更为明显(Duarteetal.
,2012;李焰等,2014;廖理等,2014;廖理等,2015).
Bergetal.
(2019)基于电商用户的研究发现,仅仅使用"如何登陆网页的方式"、"使用哪种操作系统"这些易于获取的"电子足迹"就能达到FICO评分类似的预测能力.
以上研究表明,主流信用评分在传统金融服务的边缘群体中的风险识别能力有限,主流信用评分系统以外的信息能降低借贷市场的信息不对称,提高对借款人信用风险的识别能力.
但关于主流信用模型和外部信息在信用风险识别能力上的差异,尚未有文献进行直接对比和分析.
大多数研究单独讨论某一类信息对信用风险识别的作用,Agarwaletal.
(2009)对比了FICO评分与Teletrack评分的风险预测能力,但没有研究两者的差异来自于哪部分信息.
本文关注借款人的消费行为信息,与传统征信方法依赖的历史信用信息不同,消费行为信息具有发生频率高、及时性强的特征.
通过对比传统征信信息与消费行为信息在风险识别能力上的差异,本文试图回答消费行为信息是否为借款人信用风险的识别提供了有效信息含量,以及传统征信信息和消费行为信息分别在传统金融服务边缘群体的信用评估中起到怎样的作用.
1512020年第1期三、研究假设与实证设计(一)研究假设2016年下半年以来,我国消费信贷市场涌现出大量现金贷平台.
线上现金贷以无场景、小额短期、高息费、手续简便为特征,借款人只需在线注册,提交身份证号、银行卡号等基本的个人资料,就会获得平台评估给出的信用额度,得到额度范围内的循环贷款服务.
现金贷平台使用借款人提交的个人信息进行信用评估,通常会鼓励借款人提供其网购、社交等账户信息,通过整合借款人的网络行为数据加以分析,快速给出授信结果.
基于借款人提交的个人信息和授权使用的账户信息,现金贷平台可以观察到借款人在电商平台的消费行为和支付方式,例如借款人是否使用信用卡、"花呗"等消费信贷、电商平台的现金分期等.
信用卡和"花呗"是几乎同质的消费信贷产品,但两者在信用风险评估过程中使用的核心信息存在较大差异,现金贷平台提供了真实的场景对借款人的信用风险进行衡量,以判断基于不同信息的信用评估方式如何影响对个人信用风险的识别效率.
商业银行在信用卡审批时采用基于历史违约率的评分卡模型.
评分卡模型使用多个维度的传统征信信息作为输入变量,依据个人征信报告和申请人提交的材料考察申请人是否具有稳定的收入来源和还款能力.
无论线下还是线上渠道申请信用卡,申请人都需要提交个人工作信息材料,还可提交储蓄账户流水、理财账户余额等证明个人还款能力的辅助材料.
因此,信用卡的授信决策主要依赖于个人信用历史、工作和收入信息等传统征信信息.
现金贷借款人通常面临严重的借贷约束,没有信用卡的现金贷申请人往往并非没有主动申请,而是由于信用资质较差或信用信息不充分而无法通过商业银行审核,对于持有信用卡的现金贷借款人,商业银行的授信结果能够较好地对个人信用风险进行判断.
根据以传统征信信息为核心的信用评估方式,持有信用卡比未持有信用卡的借款人信用风险更低,可能在现金贷平台上的还款表现更好.
假设1:持有信用卡的现金贷借款人信用风险更低,在现金贷平台的还款表现更好.
"花呗"是蚂蚁金服推出的一种基于支付宝使用的消费信贷产品,在功能上与信用卡较为同质,在线上线下消费场景中提供借贷服务.
与信用卡的申请过程相比,"花呗"服务的开通和使用无需用户提交工作和收入信息,而是取决于用户在淘宝和支付宝账户上的交易记录,也与蚂蚁金服的信用评估产品"芝麻信用"分数相关.
芝麻信用分综合了用户信用历史、行为偏好、履约能力、身份特质和人脉关系五方面的信息,其数据来源包括用户在淘宝、支付宝平台上发生的购物、支付、缴费等日常交易行为,以及用户自主提交的身份、学历、职业等认证信息.
虽然个人账户中可能也包含工作和收入相关信息,但根据官方资料,淘宝和支付宝交易是"花呗"和"芝麻信用"最重要的数据来源.
因此,信用卡与"花呗"的信用评估方式在对消费行为数据的使用上存在根本区别,前者以传统征信信息为核心,并未获取消费行为相关信息,而后者以消费行为信息为核心.
可以认为"花呗"的授信结果衡量了基于消费行为信息对个人信用风险的判断.
根据以消费行为信息为核心的信用评估方式,有"花呗"服务的借款人比没有"花呗"的借款人信用风险更低,可能在现金贷平台上的还款表现更好.
假设2:持有"花呗"的现金贷借款人信用风险更低,在现金贷平台的还款表现更好.
现金贷的借款成本远高于信用卡等其他消费信贷产品,使用现金贷的借款人通常由于缺乏信用记录或信用资质不足而面临严重的信贷约束,对于这类借款人,传统征信信息可能无法提供充分的信息含量识别其信用风险,消费行为信息是否引入了新的信息含量两类信息来自不同的数据维度,以工作和收入信息为核心的传统征信信息具有较高的收集和审核成本,与信用风险有高度相关性,而消费行为信息更高频易观察,但无法直接推断借款人的信用风险.
因此对于以现金贷借款251王正位等:消费行为在个人信用风险识别中的信息含量研究人为代表的信用记录不足群体的信用风险评估,两类信息在信息含量上可能互不相同.
假设3:预测现金贷借款人的还款表现时,传统征信信息和消费信息提供了不同的信息含量.
(二)实证设计根据以上思路,本文的实证研究分为两步.
首先分别验证基于不同信息的信用评估方法是否能有效预测现金贷借款人的信用风险,对应假设1和假设2.
采用Probit回归模型:Prob(Defaulti)=Φ(a+βwith_crediti+γXi+εi)(1)其中,Defaulti是现金贷借款人是否违约,with_crediti是现金贷借款人是否获得信用卡或"花呗"授信的哑变量,在假设1中对应信用卡授信,在假设2中对应"花呗"授信.
Xi是关于借款人的控制变量.
εi是回归误差项.
在以上回归的基础上,进一步研究消费行为信息在信用风险评估中是否提供了传统征信信息以外的信息含量,检验假设三.
采用Probit回归模型:Prob(Defaulti)=Φ(a+β1bank_crediti+β2huabei_crediti+γXi+εi)(2)同时引入不同渠道的消费信贷授信情况,能够在同一框架下比较不同信息的信息含量,即给定信用卡或"花呗"的授信结果,基于另一类信息的授信结果是否对借款人的信用风险有额外的预测作用.
需要说明的是,以上实证设计使用信用卡或"花呗"的授信结果衡量以传统征信信息或消费行为信息为核心的信用评估方法预测的个人信用风险水平,前提是授信结果能够真实反映使用相关个人的信用状况.
可能存在的一个问题是选择性偏误,观察到的信贷使用情况由供给和需求共同决定,没有得到授信不完全代表个人信用水平较差,也可能是由于借款人没有申请相应的信贷产品.
本文使用现金贷借款人为研究对象可以在很大程度上降低这一问题的影响.
选择接受高成本现金贷的借款人通常受到严重的信用约束,理性的借款人会优先尝试成本较低的借贷渠道,因此,现金贷借款人在低成本消费信贷产品的使用状态能够较为真实地反映信贷提供方的信用评估结果.
四、数据与变量描述(一)样本数据描述本文的数据来自于我国某大型现金贷平台,该平台提供循环授信模式的无场景消费信贷服务.
借款人向平台提交本人身份证号、手机号、储蓄卡号进行实名验证,平台基于个人用户画像做出信用额度的审批决策,获得额度的借款人可在额度范围内循环借款.
为了获得更高的借款额度,借款人可以主动提交各种形式的个人信息,包括授权平台查询自己的淘宝账户、京东账户、社交账号等,平台使用内部风险评估模型对借款人的信用风险进行判断,确定借款人可获得的授信额度.
本文不讨论现金贷平台自身使用的信用风险评估方法,而是通过对借款人在现金贷平台上的还款表现的观察,评估基于不同信息的信用评估方法对真实信用风险的预测能力.
该平台随机抽取了2014年9月到2017年7月在平台上活跃借款的10000个借款人,由于该平台在我国现金贷市场占有较大的市场份额,因此平台借款用户对整个现金贷市场借款人具有较好的代表性.
关于借款人的主要变量包括在该平台上的全部成功借款订单信息和还款情况,以及授权平台使用的个人账户信息.
在10000个样本中,有5428个借款人授权平台使用其支付宝账户信息.
支付宝是我国最大的第三方支付平台,在线上线下支付中广泛使用.
支付宝用户通常会绑定个人储蓄卡和信用卡用于消费和还款.
通过识别支付宝账户绑定的本人信用卡,可以对借款人持有商业银行信用卡的情况作出有效推断.
支付宝账户中还记录了借款人使用"花呗"消费信贷的情况.
本文使用有支付宝账户信息的借款人作为研究样本.
3512020年第1期借款人申请新的借款时,平台会重新审核借款人信息以更新风险评估结果.
因此,从支付宝账户观察到的信用卡、"花呗"等信息对应的是借款人最后一笔借款申请时的状态,本文使用的借款订单相关变量(金额、利率、期限、还款结果等)均对应每个借款人的最后一笔借款.
由于借款发生后需要一段时间才能观察到还款结果,我们将样本限定为2017年4月之前发生的借款,以防止观察期过短带来的生存偏差.
另外,由于"花呗"服务开始于2015年4月,本文将观察区间设定为2015年5月到2017年4月,研究样本为该期间借款的3814个借款人.
(二)变量描述按照本文的实证设计,实证研究涉及的核心变量包括:1.
还款表现当借款人超过约定还款日期60天仍未还款时,将该笔订单的还款结果记为违约(default=1),否则记为没有违约(default=0);根据逾期的天数(overduedays),构造一组虚拟变量,包括是否逾期(od)、是否有5天以上逾期(od5)、是否有30天以上逾期(od30)、是否有45天以上逾期(od45).
2.
基于传统征信的信用评估结果用信用卡授信结果衡量基于传统征信信息对借款人信用风险的评估结果.
根据支付宝账户绑定的本人信用卡数量(#creditcard),构造是否有信用卡的虚拟变量(creditcard),至少持有一张信用卡时,creditcard取1,否则取0.
3.
基于消费信息的信用评估结果用"花呗"授信结果衡量基于消费行为信息对借款人信用风险的评估.
根据"花呗"额度(hb_credit)构造是否有"花呗"授信的虚拟变量(hb),当额度大于0时取1,否则取0;4.
控制变量借款订单层面的控制变量有借款金额(amount)、借款期限(term)、借款利率(rate).
其中利率划分为10个等级的分类变量,在回归中用虚拟变量highrate加以控制,当利率高于所有借款人的平均利率时,highrate取1.
借款人个人特征层面的控制变量有性别(male)、年龄(age)、是否高风险(highrisk),根据平台给出的信用级别A-F划分为两组,信用等级为D-F时highrisk取1,以及两个关于地域的虚拟变量(一线城市tier1和二线城市tier2).
表1给出了以上变量的描述统计.
借款订单符合现金贷小额短期的特征,平均借款金额1371元,借款期限5个月.
79%的借款人为男性,平均年龄26岁,18%的借款人生活在一线城市,40%生活在二线城市.
53%的借款人持有至少1张信用卡,而65%的借款人有"花呗"信用额度.
现金贷借款人同时使用多种渠道信贷产品的行为与文献的结果一致(Agarwaletal.
,2009).
表1描述性统计变量名观测数均值标准差1%分位数25%分位数中位数75%分位数99%分位数default38140.
310.
4600011overduedays381427.
1927.
2800146060creditcard38140.
530.
500111#creditcard20203.
262.
48112511hb38140.
650.
4800111hb_credit24963097.
243230.
1818.
9210002000400014500amount38141370.
59110297.
45600100018005000term38145.
113.
8123612451王正位等:消费行为在个人信用风险识别中的信息含量研究续表1变量名观测数均值标准差1%分位数25%分位数中位数75%分位数99%分位数rate38075.
922.
49145810male38140.
790.
4101111age381426.
345.
371922252943highrisk38140.
40.
4900011tier138140.
180.
3900001tier238140.
40.
4900011五、实证结果通过观察现金贷平台上借款人信用风险的真实表现,本文以信用卡和"花呗"授信结果分别衡量基于传统征信信息和消费行为信息的信用风险评估,对两类信息在信用评估过程中的信息含量进行研究.
表2给出了按是否持有信用卡和"花呗"分组的借款人在该现金贷平台的违约率.
未考虑其他变量的影响时,持有信用卡的借款人与没有信用卡的借款人违约率没有明显差异,而拥有"花呗"信用额度的借款人违约率明显低于未获得"花呗"额度的借款人.
在没有信用卡的借款人中,有"花呗"的借款人比没有"花呗"的借款人违约率低7.
5个百分点,在有信用卡的借款人中,有"花呗"的借款人比没有"花呗"的借款人违约率低9.
6个百分点.
这一结果是否意味着基于消费行为信息的"花呗"授信方式在对现金贷借款人的信用风险识别上比基于传统征信信息的信用卡授信方式更准确以下通过回归模型进行实证分析.
表2按是否得到花呗和信用卡授信分组的违约率分组花呗信用卡观测数占比违约率组间差异违约率之差t值(1)007520.
200.
356(2)—(1)0.
0250.
96(2)015660.
150.
382(4)—(3)0.
0050.
26(3)1010420.
270.
281(3)—(1)-0.
075***-3.
41(4)1114540.
380.
286(4)—(2)-0.
096***-4.
17(一)传统征信信息与现金贷借款人信用风险以现金贷是否违约为因变量,是否获得信用卡为自变量,对样本数据进行(1)式的回归.
回归结果如表3所示.
表3信用卡授信与现金贷还款表现因变量:default(1)(2)(3)(4)(5)creditcard0.
000(0.
042)-0.
007(0.
046)#creditcard-0.
020**(0.
009)-0.
015(0.
010)creditcard_large-0.
127**(0.
052)5512020年第1期续表3因变量:default(1)(2)(3)(4)(5)creditcard_other0.
054(0.
051)log(amount)-0.
036(0.
026)-0.
035(0.
026)-0.
036(0.
026)term0.
042***(0.
007)0.
041***(0.
007)0.
042***(0.
007)highrate0.
078(0.
053)0.
080(0.
053)0.
081(0.
053)male0.
258***(0.
055)0.
257***(0.
056)0.
268***(0.
056)age0.
019***(0.
004)0.
021***(0.
004)0.
020***(0.
004)highrisk0.
510***(0.
046)0.
503***(0.
046)0.
505***(0.
046)tier1-0.
111*(0.
062)-0.
101(0.
062)-0.
113*(0.
062)tier2-0.
080*(0.
048)-0.
075(0.
048)-0.
085*(0.
048)constant-0.
488***(0.
031)-0.
453***(0.
026)-1.
362***(0.
211)-1.
392***(0.
212)-1.
390***(0.
212)观测数38143814381438143814伪R22.
46e-080.
001110.
05450.
05500.
0558注:***、**、*分别表示1%、5%、10%的显著性水平,下表同.
第一列"是否持有信用卡"的回归系数接近于0,即持有信用卡的现金贷借款人和未持有信用卡的现金贷借款人在违约率上没有显著差异.
第二列是借款人持有的信用卡数量,回归系数是-0.
02,在5%的显著性水平下显著,表明借款人持有的信用卡数量越多,其现金贷借款发生违约的可能性越低.
第三列和第四列对可能影响违约率的因素进行了控制,将借款人和借款订单的相关变量加入回归模型后,虚拟变量"是否持有信用卡"和"信用卡数量"在常规统计水平下都不显著.
总体来看,以信用卡授信结果衡量的基于传统征信信息的信用评估结果几乎不能解释现金贷借款人的信用风险.
为了进一步识别信用卡授信结果的信息强度,参照银保监会的分类将信用卡发卡行分为大型商业银行和其他商业银行.
定义持有大型商业银行发放的信用卡为creditcard_large,当借款人持有的信用卡发卡行是中国工商银行、中国农业银行、中国银行、中国建设银行或交通银行,①取值为1,否则为0;定义持有其他商业银行发放的信用卡为creditcard_other,当借款人持有的信用卡来651王正位等:消费行为在个人信用风险识别中的信息含量研究①邮储银行自2019年起纳入大型商业银行统计口径,稳健性检验表明,大型商业银行是否包括邮储银行不影响结果.
限于篇幅,未在正文展示.
自于以上五家银行以外的其他银行,取值为1,否则为0.
大型商业银行和其他银行信用卡的授信结果反映的传统征信信息的强度可能存在差异.
一方面,当信息报告无法提供关于个人信息风险的有效信息时,信用卡风险审核使用的核心信息主要来源于申请人自报的工作和收入等信息,而以上五家大型商业银行在工资账户的市场份额上具有明显优势,积累了大量的客户数据,因此对借款人工作和收入信息的验证能力更强;另一方面大型商业银行受到更强的监管约束,相对而言更保守,在信贷审批上更严格.
因此大型商业银行的授信代表了更强的传统征信信息认证.
表3第五列将传统征信信息强度的异质性纳入回归模型,展示了不同类型银行的授信结果对借款人还款行为的预测能力.
creditcard_large的回归系数为-0.
12,在5%的显著性水平下显著,而creditcard_other系数不显著,表明大型商业银行的授信结果能够有效预测借款人的信用风险.
在其他因素相同的情况下,持有大型银行信用卡的借款人更不容易违约.
这一结果支持了假设一,基于传统征信信息的现金贷借款人信用风险越低,其在现金贷平台的实际还款表现越好.
控制变量的回归系数反映了与还款结果有关的其他因素.
借款金额和借款利率的回归系数不显著,借款期限越长借款人越容易违约.
从借款人特征看,男性借款人的违约率更高.
平台给出的信用评级越好,借款人的违约率更低,说明平台的信用评级对借款人的信用风险有一定的识别能力.
地域虚拟变量的回归系数不显著,表明生活在不同发展水平城市的借款人在违约率上没有明显差异.
以上结论与已有文献的研究基本一致.
(二)消费行为信息与现金贷借款人信用风险类似地,我们以"花呗"授信衡量基于消费行为信息的信用风险评估,考察其与现金贷平台实际还款表现的关系.
表4第一列和第二列表明,在控制了各种可能影响还款结果的因素后,是否获得"花呗"消费贷款的系数在1%的水平下显著为负.
这一结果支持假设二,相对于没有获得"花呗"信用额度的借款人,获得"花呗"的借款人具有更低的违约风险,因此,"花呗"审批所依赖的消费行为信息有助于识别借款人的信用风险.
为了直观比较传统征信信息和消费行为信息的信息含量是否存在差异,我们将持有信用卡和持有"花呗"两类变量同时放入模型,进行(2)式的回归.
"花呗"和"信用卡"的简单相关系数为0.
15,不会引起严重的多重共线性.
回归结果如表4第三列至第五列所示.
控制信用卡授信状态时,"花呗"的系数始终在5%的水平下显著,表明在传统征信信息的基础上,消费行为信息为预测现金贷借款人的信用风险提供了额外的信息含量.
控制"花呗"的授信状态时,"持有大型商业银行信用卡"(creditcard_large)的回归系数显著为负,说明"花呗"和信用卡授信决策依赖的不同信息从互不相同的维度为借款人的信用风险提供了评估依据,起到互相补充的作用.
这一结果支持了假设三,表明信用卡审批依赖的传统征信信息和"花呗"关注的消费行为信息在现金贷借款人的信用评估中展现出不同的信息含量.
进一步引入"花呗"授信额度对消费行为的信息强度进行度量,考察是否基于消费信息的信用评估结果越好,现金贷借款人的违约风险越低.
以借款人得到的"花呗"额度为核心解释变量,仍进行(2)式回归,结果如表5.
花呗额度的估计系数为-0.
022,在1%的显著水平下显著.
这一结果进一步验证了假设二,表明消费行为信息为识别现金贷借款人的信用风险提供了较高的区分度,基于消费行为信息识别的信用风险越低,借款人在现金贷上的违约概率也越低.
当同时比较不同强度的两类信息时,花呗额度和大型银行信用卡授信的估计系数分别在1%和5%的水平下显著.
以上结果表明,在现金贷借款人这类信用记录不足的群体中,引入发生频率较高的消费行为信息一定程度上能够补充传统征信信息中缺乏的信息含量,但不能完全替代传统征信信息.
7512020年第1期表4花呗授信与现金贷还款表现因变量:default(1)(2)(3)(4)(5)hb-0.
232***(0.
044)-0.
121***(0.
046)-0.
122***(0.
046)-0.
114**(0.
046)-0.
113**(0.
046)creditcard0.
010(0.
047)#creditcard-0.
012(0.
010)creditcard_large-0.
116**(0.
052)creditcard_other0.
062(0.
051)log(amount)-0.
035(0.
026)-0.
035(0.
026)-0.
034(0.
026)-0.
034(0.
026)term0.
041***(0.
007)0.
041***(0.
007)0.
041***(0.
007)0.
041***(0.
007)highrate0.
078(0.
053)0.
078(0.
053)0.
080(0.
053)0.
081(0.
053)male0.
255***(0.
055)0.
255***(0.
055)0.
255***(0.
055)0.
265***(0.
056)age0.
019***(0.
004)0.
018***(0.
004)0.
020***(0.
004)0.
020***(0.
004)highrisk0.
492***(0.
047)0.
492***(0.
047)0.
487***(0.
047)0.
489***(0.
047)tier1-0.
104*(0.
062)-0.
105*(0.
062)-0.
096(0.
062)-0.
108*(0.
062)tier2-0.
073(0.
048)-0.
074(0.
048)-0.
070(0.
048)-0.
080*(0.
049)constant-0.
339***(0.
035)-1.
286***(0.
212)-1.
282***(0.
213)-1.
316***(0.
214)-1.
314***(0.
213)观测数38143814381438143814伪R20.
005780.
05590.
05590.
05620.
0570在以上分析中,我们讨论了以信用卡授信结果衡量基于传统征信信息预测的信用风险、以"花呗"授信结果衡量基于消费行为信息预测信用风险的合理性.
一个可能的问题是,"花呗"依托于第三方支付平台"支付宝",平台上可能留存用户收入流水等传统征信过程使用的核心信息,"花呗"展现出的信息优势是否因为这部分信息更加丰富而非消费行为引入的新信息呢我们试图以借款人淘宝账户的交易记录直接衡量"花呗"授信过程中的消费行为信息.
根据平台抓取的借款人淘宝历史交易记录,从三个维度对借款人的淘宝账户使用情况进行观察:平均每月消费金额、历史交易次数和交易历史时长.
表6展示了以上三个变量的描述性统计,样本中有3715位借款人授权平台查看其淘宝账户信息,平均每月交易金额720元,历史总交易次数平851王正位等:消费行为在个人信用风险识别中的信息含量研究均217次,平均账户使用时长超过2年.
按照中位数对样本进行划分,每个维度上低于中位数的属于淘宝信息含量较低的一组,而高于中位数的能提供较多消费行为信息.
由此进一步区分了"花呗"授信使用的消费信息含量,各组子样本的回归结果如表7.
在平均消费较低、次数较少、历史较短的子样本中,淘宝交易记录提供的消费行为信息有限,"花呗"授信结果不能预测现金贷借款人的违约行为,而在淘宝交易记录更加丰富的样本中,"花呗"授信结果能够显著预测现金贷借款人的违约行为.
表7验证了消费行为信息能为现金贷借款人的信用风险识别提供重要的信息含量.
表5花呗额度与现金贷还款表现因变量:default(1)(2)(3)(4)log(hb_credit)-0.
038***(0.
006)-0.
023***(0.
006)-0.
022***(0.
006)-0.
022***(0.
006)creditcard0.
024(0.
047)#creditcard-0.
009(0.
010)creditcard_large-0.
105**(0.
053)creditcard_other0.
069(0.
052)log(amount)-0.
033(0.
026)-0.
033(0.
026)-0.
033(0.
026)term0.
041***(0.
007)0.
041***(0.
007)0.
041***(0.
007)highrate0.
078(0.
053)0.
080(0.
053)0.
081(0.
053)male0.
253***(0.
055)0.
252***(0.
055)0.
262***(0.
056)age0.
019***(0.
004)0.
020***(0.
004)0.
020***(0.
004)highrisk0.
479***(0.
047)0.
475***(0.
047)0.
477***(0.
047)tier1-0.
101(0.
062)-0.
093(0.
062)-0.
103*(0.
062)tier2-0.
072(0.
048)-0.
068(0.
048)-0.
077(0.
049)constant-0.
305***(0.
034)-1.
264***(0.
212)-1.
297***(0.
214)-1.
295***(0.
213)观测数3814381438143814伪R20.
009310.
05760.
05770.
05849512020年第1期表6淘宝账户使用情况观测数均值标准差中位数平均每月淘宝金额(元)3715720.
571609.
95450.
65淘宝交易次数3715216.
99265.
35148淘宝交易历史(月)371527.
4418.
9324表7按淘宝信息含量分组:花呗授信与现金贷还款表现因变量:default(1)金额低(2)金额高(3)次数少(4)次数多(5)时间短(6)时间长花呗-0.
045(0.
064)-0.
196***(0.
068)-0.
060(0.
062)-0.
153***(0.
071)-0.
047(0.
061)-0.
136*(0.
074)信用卡0.
016(0.
067)0.
019(0.
067)0.
069(0.
065)0.
013(0.
070)0.
028(0.
064)0.
140*(0.
073)控制变量是是是是是是观测数185119631869194518911923伪R20.
05490.
05820.
04410.
04880.
03750.
0541(三)稳健性检验在以上实证分析中,还款结果"是否违约"来自于现金贷平台的定义,即认为逾期60天未还款是违约行为.
上述研究结果是否依赖于这一定义,需要进行稳健性检验.
我们将因变量"是否违约"拓展到不同的逾期程度,即采用"是否逾期"、"逾期5天以上"、"逾期30天以上"、"逾期45天以上"作为因变量.
表8分别展示了不同因变量的回归结果.
与主回归的结果一致,花呗授信能够显著解释现金贷借款人的逾期风险,而持有银行信用卡不具有明显的解释能力.
表8稳健性检验:花呗、信用卡授信与现金贷还款表现因变量odod5od30od45花呗-0.
288***(0.
052)-0.
247***(0.
047)-0.
224***(0.
045)-0.
174***(0.
046)信用卡0.
024(0.
051)-0.
024(0.
047)0.
034(0.
046)0.
038(0.
046)控制变量是是是是观测数3814381438143814伪R20.
1270.
1350.
08740.
0811因变量odod5od30od45log(花呗额度)-0.
041***(0.
007)-0.
038***(0.
006)-0.
036***(0.
006)-0.
029***(0.
006)信用卡0.
040(0.
051)-0.
008(0.
047)0.
050(0.
046)0.
052(0.
046)控制变量是是是是观测数3814381438143814伪R20.
1290.
1380.
08970.
0829061王正位等:消费行为在个人信用风险识别中的信息含量研究表9稳健性检验:白条、信用卡授信与现金贷还款表现因变量defaultodod5od30od45白条-0.
196***(0.
069)-0.
200***(0.
069)-0.
279***(0.
066)-0.
239***(0.
066)-0.
218***(0.
067)信用卡0.
010(0.
060)0.
005(0.
064)-0.
010(0.
060)0.
018(0.
058)0.
031(0.
059)控制变量是是是是是观测数23202320232023202320伪R20.
05510.
1080.
1200.
07040.
066因变量defaultodod5od30od45log(白条额度)-0.
025***(0.
008)-0.
025***(0.
008)-0.
035***(0.
008)-0.
029***(0.
008)-0.
027***(0.
008)信用卡0.
012(0.
060)0.
007(0.
064)-0.
007(0.
060)0.
020(0.
059)0.
033(0.
059)控制变量是是是是是观测数23202320232023202320伪R20.
05550.
1080.
1210.
07070.
0664另外,将"花呗"授信结果替换为提供同质消费信贷服务、也具有较大市场份额的京东"白条".
与蚂蚁金服不同,京东金融没有重点发展第三方支付业务,因此"白条"的授信更加依赖于平台上的消费行为信息.
以主动关联了京东账户的现金贷借款人为研究样本,将花呗授信的相关变量替换为京东白条的授信情况,也发现了一致的结论.
表9展示了回归结果.
在控制了信用卡授信状态和其他变量后,持有白条和白条额度的回归系数均在1%的水平下显著.
基于以上关于现金贷借款人使用信用卡、"花呗"和"白条"多种消费信贷产品的实证结果,可以认为消费行为信息的引入提高了出借机构对借款人的风险识别能力,在传统征信信息的基础上提供了额外的信息含量.
六、结论我国金融消费者长期以来面临较为严重的信贷约束,原因之一是在个人征信体系尚未完善的现实情况下,严重的信息不对称限制了消费信贷市场的发展.
近年来,随着金融科技的发展,我国消费信贷市场上涌现出大量互联网消费信贷产品,力图覆盖传统金融机构服务的边缘人群.
针对尚未积累充分信用记录的金融消费者,如何基于有限的信息准确评估其信用风险是实践中的重要问题.
与传统征信信息相比,个人的消费行为信息在移动互联网时代具有更高频、更易获取的特征,对消费行为信息在个人信用评估中提供的信息含量进行探讨具有重要的学术价值.

Megalayer 香港CN2优化线路VPS主机速度和性能综合评测

对于Megalayer云服务器提供商在之前也有对于他们家的美国服务器和香港服务器进行过评测和介绍,但是对于大部分网友来说需要独立服务器和站群服务器并不是特别的普及,我们很多网友使用较多的还是云服务器或者VPS主机比较多。在前面也有在"Megalayer新增香港VPS主机 1GB内存 50GB SSD 2M带宽 月59元"文章中有介绍到Megalayer商家有新增香港CN2优化VPS主机。那时候看这...

新版本Apache HTTP Server 2.4.51发布更新(有安全漏洞建议升级)

今天中午的时候看到群里网友在讨论新版本的Apache HTTP Server 2.4.51发布且建议更新升级,如果有服务器在使用较早版本的话可能需要升级安全,这次的版本中涉及到安全漏洞的问题。Apache HTTP 中2.4.50的修复补丁CVE-2021-41773 修复不完整,导致新的漏洞CVE-2021-42013。攻击者可以使用由类似别名的指令配置将URL映射到目录外的文件的遍历攻击。这里...

美国cera机房 2核4G 19.9元/月 宿主机 E5 2696v2x2 512G

美国特价云服务器 2核4G 19.9元杭州王小玉网络科技有限公司成立于2020是拥有IDC ISP资质的正规公司,这次推荐的美国云服务器也是商家主打产品,有点在于稳定 速度 数据安全。企业级数据安全保障,支持异地灾备,数据安全系数达到了100%安全级别,是国内唯一一家美国云服务器拥有这个安全级别的商家。E5 2696v2x2 2核 4G内存 20G系统盘 10G数据盘 20M带宽 100G流量 1...

淘宝交易为你推荐
百度空间首页百度空间在哪里登入?天玑1000plus和骁龙865哪个好麒麟985处理器和天玑1000处理器哪个更好?轿车和suv哪个好轿车和SUV 哪个开起来更舒适朱祁钰和朱祁镇哪个好朱高炽在位时间长还是朱祁钰在位时间长?ps软件哪个好PS哪一款软件比较好用呢手机管家哪个好手机管理软件哪个好用手机管家哪个好手机管家和腾讯手机管家哪个好用oppo和vivo哪个好vivo和oppo建议买哪个播放器哪个好哪个播放器比较好用qq网盘在哪里QQ网盘在哪里
uk2 mediafire 美国仿牌空间 evssl 华为云主机 南昌服务器托管 大容量存储器 空间论坛 hostker gspeed 七夕快乐英文 南通服务器 福建铁通 最好的qq空间 吉林铁通 免费的asp空间 美国盐湖城 注册阿里云邮箱 北京主机托管 hdsky 更多