【案例】恒丰银行——基于大数据技术的信用风险预警系统
恒丰银行基于大数据技术构建的信用风险预警系统,通过整合行内外数据形成统一的行业、地域、客户风险视图,加强风险监测、审查的全面性、准确性、及时性,强化风险预测能力,提高信贷资产质量。
本篇案例为数据猿推出的大型“金融大数据主题策划”活动(查看详情)第一部分的系列案例/征文;感谢 恒丰银行 的投递
作为整体活动的第二部分,2017年6月29日,由数据猿主办,互联网普惠金融研究院联合主办,上海金融行业信息协会、中国信息通信研究院、大数据发展促进委员会、上海大数据联盟、首席数据官联盟、中国大数据技术与应用联盟、上海张江发展战略研究院、人大人科创协办的《「数据猿·超声波」之金融科技·商业价值探索高峰论坛》还将在上海隆重举办【论坛详情】【上届回顾(点击阅读原文查看)】
在论坛现场,也将颁发“技术案例奖”、“应用案例奖”、“实践案例奖”、“优秀征文奖”四大类奖项
来源:数据猿丨投递:恒丰银行
本文长度为6300字,建议阅读13分钟
恒丰银行近年来陆续推出了信贷工厂、消费金融、供应链金融等一系列网贷、平台贷业务,为不同行业、不同规模的客户提供了丰富的信贷类产品。业务规模快速发展的同时,如何快速、全面识别、监测、防范客户信用风险,成为了全行风险管理领域最为重要的工作之一。
对此,恒丰银行积极筹划,在制度层面制定全面风险管理体系,明确各条线、各部门的风控职责,筑牢风险管理的三道防线之外,提出通过运用大数据技术构建信用风险预警系统,加强风险信息归集、监测、审查的准确性、及时性,强化风险预测能力。
本案例将分享恒丰银行在风险控制过程中如何利用大数据技术构建信用风险预警系统解决风控与成本约束、处理效率和用户体验间的矛盾,以及在系统建设过程中遇到的挑战、积累的经验及未来的规划。
周期/节奏
2015年9月,启动基于大数据技术的信用风险预警系统建设;
2016年5月,企贷风险防控体系初步建成,支撑恒信快贷业务开展;
2016年8月,个贷风险防控体系初步建成,支撑现金贷业务开展;
2016年11月,基于担保圈的客户违约预测模型投产上线,将贷后风险预警、防控前移;
2017年1月,在完善已接入的内外部数据基础上,进一步接入统计局数据、海关进出口数据、金融市场数据及企业资质、评级、税务,个人学历、车辆等外部数据,通过引入知识图谱、机器学习、自然语言处理等技术及专业化决策引擎工具构建丰富的风控模型,并打通与信贷系统、贷后系统、押品系统等的联动,构建完整的大数据风险防控体系。
客户名称/所属分类
恒丰银行/风控
任务/目标
针对恒丰银行的线上线下业务协同发展战略,风控部门提出通过大数据技术优先支持新发展的线上业务,待线上业务风控成熟后逐步应用于传统信贷业务;同时同步研究利用大数据技术做好风险分类研究、风险实时监测及风险预测等工作。
对于恒丰银行的线上业务风控,包括网贷和平台贷等,业务部门提出:
一、系统能够快速整合客户信息,全面、准确识别客户及所提供担保的风险,以快速响应提升用户体验;
二、客户风险全流程监测,包括贷前风险提示、贷中贷后风险监测及预警,拦截高风险客户,及时触发风险缓释工具的启用;
三、监测各主流新闻媒体、论坛、自媒体,运用文本分析技术监测、识别涉及我行客户负面舆情,及时、主动化解风险,促进业务良性发展;
四、支持风险防控体系的快速更新、快速部署,适应当前客户风险显现的多样性、易变性、复杂性;
五、支持风控模型的回测、验证,满足对历史风控模型的评价、新模型的验证及潜在客户风险批量评估、筛选。
挑战
大数据时代,风控被认为是大数据技术在银行业最有前景的应用场景之一。同大多数商业银行一样,恒丰银行也希望通过大数据技术加强信贷业务,尤其是线上信贷业务的风险防控,以满足平台贷等业务规模骤升过程中的自动化风险检测与审批需求。然而在具体实施过程中也依然遇到一系列的困难和挑战,包括观念的转变、资源的短缺等。
(一)业务模式的转变,新的风控理念尚未成熟
数字化银行业务是典型的适应互联网金融环境诞生的金融产品,其业务模式与传统业务有较大不同,且仍处于快速变化的状态,对应的内外部相关监管规则亦处于逐步完善之中。如何在快速推进新业务与严格遵守传统监管要求之间求得平衡,是业务经营方、监管方主要考虑的问题;大数据风控技术是逐步替代传统风控手段还只是作为增强手段,各方的风控理念尚未完全达成一致。业务模式的不确定、监管规则的不明晰,大数据风控的深入应用仍处于探索过程中。
(二)认知的偏见,大数据风控正名尚需时日
在银行传统风控人员的认知中,现有线下信贷业务风控手段相对比较成熟,业务使用广泛,已能够满足内外部监管的要求,只要严格遵守则基本无需承担风控不力的责任;而使用大数据技术风控,现有数据的完备性、准确性存在一定的不足,风控模型效力仍有待时间验证,亦存在风险遗漏的情况,缺乏传统风控手段的“可靠性”,对大数据风控技术的使用持有一定的怀疑态度。
而事实上不管是传统风控手段,还是大数据风控技术都只能最大限度地降低风险而非杜绝风险,风控的效果指的是概率上的优劣。现如今互联网金融模式的快速发展,需要我们不断创新风控思路,在不断试错、不断改进过程中完善风控体系,而不能抱残守缺、墨守传统风控理念,停滞不前。此外,客户信息的完备性、准确性永远是一个相对概念,没有绝对完整、准确的客户数据,只能是多方位完善、选择性取舍。
(三)数据极度缺乏,数据接入困难超预期
当前金融产品日益多样化,客户准入门槛逐步下沉,商业银行对优质客户的争夺愈演愈烈;而另一面,客户对商业银行产品越来越挑剔,对授信金额、审批速度的要求也越来越高。为了能够在这场争夺战中占得先机,必须通过加强对客户行内外信息的整合,全面、快速、准确识别客户风险,迅速做出授信决策。客户行内数据在大数据平台构建过程中得到解决,而外部数据在接入过程中则遇到较大困难:
首先,外部数据质量参差不齐、数据效用较难评估,需要较长时间进行沟通、分析、确认;
其次,对于线上常见的平台贷等业务,由于银行不直接面对客户,传统的埋点等风控数据采集方法难以施行。
(四)案例库的缺少,大数据风控模型优势难以快速体现
对于很多中小型银行,因业务规模及信息系统建设滞后等原因,不良授信的案例库要么缺失、要么案例较少,尤其是对于线上的互金等新生业务,不良案例库更是少之又少。由于案例库的缺少,目前风头正劲的机器学习等新的风控技术难有用武之地,大数据风控技术、模型的效果难以得到充分的验证,目前基本只能通过对传统业务客户的历史逾欠情况进行分析,以此来评价风控模型效果。
实施过程/解决方案
恒丰银行信用风险预警系统主要分为基础数据层、基础技术服务层和应用层,其总体架构如图一所示。
(一)基础数据层:风控系统数据引入
基础数据层主要负责行内行外数据接入、存储,通过自建爬虫体系、购买外部服务数据API或文件批量推送服务实现各类数据的接入,形成风控专用的风险数据集市,如图二所示。根据获取权限不同,风控数据可分为四类:
第一类为行内数据,主要包括企业和个人的基础信息、授用信信息、还款信息、账户信息及各类黑、灰名单等,均为结构化数据,可直接从行内的大数据平台接入,数据准确、权威,但覆盖面相对较少;
第二类为用户授权数据,包括企信征信、个人征信、个人学历、个人车辆、电商交易记录等数据,主要通过第三方提供的API接口接入;
第三类为第三方公司数据,包括工商、司法、手机验真等,这部分数据主要以API接口获取为主,以文本文件推送为辅;
第四类是来自于互联网的各类免费数据,包括企业的评级、资质、招聘、投融资、市场价格、新闻、突发等数据,个人的设备指纹、微博等数据,这类数据主要通过爬虫获取为主,文本文件推送、接口接入为辅。
图二 外部数据接入方式
在数据接入节奏方面,对于行内数据,主要以“数据驱动为主、业务驱动为辅”的方式,提前将可能用到的数据全部接入进来;对于行外数据,则在充分评估数据效用、接入周期、接入技术难度、更新频率等各种因素后,以“业务驱动为主、数据驱动为辅;急用先行、分步接入”的方式逐步接入。
(二)基础技术服务层:风控系统数据处理
基础技术服务层主要对基础数据层接入的数据进行深加工,而在基础数据层接入的数据以结构化数据为主,如授用信信息、工商信息等;以非结构化数据为辅,如财经新闻数据、微博数据等。
对于接入的这些数据,需要进行三个层次的整合加工,如图三所示:
一是将非结构化数据结构化并进行ETL处理,通过文本解析、正则表达式、语义网等技术抽取关注的要素信息,如互联网上政府、行业协会公示的企业资质信息,评级公司公开的企业评级信息等;
二是根据应用需要对文本信息进行分词、实体抽取、自动摘要、关键词提取、重复检测、正负面极性判断、语义分析、文本分类等标记及基础指标加工等处理,这是数据处理过程中最核心部分;
三是基于结构化、标记后文本及基础指标,借助文本挖掘、MIDAS、R等技术或工具构建形成客户统一风险视图,如客户授用信指标、还款情况、涉诉情况、经营情况、舆情信息,并通过关系图谱、投资图谱等各种数据的进一步关系强化,进而形成完整的企业/个人知识图谱等。
图三 数据处理流程
(三)应用服务层:风控系统价值展现
借助大数据平台接入及经过技术服务层深加工之后的各类数据,将通过应用服务层直接或与其他关联系统交互的方式发挥风险控制作用。
一是单笔业务的风险防控,涵盖授信业务的贷前、贷中、贷后全生命周期,主要由用户发起,属于被动式风控方式。
贷前阶段,在获取客户基本信息之后,风控平台将从基础数据及基础技术服务层获取客户的各类信息,包括各类黑名单命中情况、工商信息、财务信息、舆情信息、股东信息、投资情况等各类关系图谱、投资图谱等信息,形成一份完整的客户统一风险视图及风险扫描报告,客户经理可基于此进行贷前分析及报告撰写。图四为客户风险一键扫描视图。
贷中阶段,在获取客户授权以后,风控平台将接入征信、学历、车辆等各类数据,并结合基于大数据征信形成的A卡由决策引擎给定客户审批建议、核算建议授信额度等。
贷后阶段,根据贷后风控策略定期监测已授信客户风险信号,包括客户履约情况、担保情况、偿债能力变化情况等,协同贷后系统、风险缓释平台进行风险处置。
在单笔业务场景下,基于大数据技术的决策引擎,其规则的生成和配置与传统依据统计分析生成有所不同,在此背景下,组成规则的指标可引入机器学习等算法,通过特征工程选择关联性强的特征,同时考虑到风控面临的监管的严肃性、审慎性,一般选取解释性较好的特征加入风控规则。另外,基于大数据的风控体系,在授信的全生命周期均能审查客户的各类风险信息,能较好得规避因客户经理隐瞒客户不良信息的道德风险。
图四 客户风险综合视
二是批量业务的风险防控,主要应用于贷前调查和贷后风险监测、风险缓释。当银行研发一款新产品时,通常需要确定目标群体并评估该群体状况、市场规模及业务前景,此时可通过风控系统对目标客群进行批量风险扫描,快速评估目标客户风险状况,预测新业务发展前景,及时对新业务规划、目标进行相应调整;贷后阶段主要结合客户授信偿还情况、担保情况及其他风险因素变动情况触发贷后进行风险处置及押品系统、风险缓释系统进行担保物的核查、处置。
三是风险的监测、追踪、预警、预测,主要通过构建行业发展景气指数,并从行业、地域维度分析风险暴发情况,辅助业务规划及相关有权部门调整高风险行业和地域的贷款投向;通过持续追踪国家产业政策的变化,各部门、各地方政府相应细则的落实,协助分支机构紧盯国家、中央层面动向,合理安排信贷投向,如图五所示;通过监测各类突发事件,应用文本挖掘及知识图谱技术快速识别风险类别、风险主体、发生地域等,通知相关部门及时评估事发客户及下游客户风险,启动资产保全措施,及时挽回损失。在该类应用过程中,将对各类风险进行分类、分级,并根据应用系统及不同用户进行差异化消息推送服务,推送方式包括系统消息、邮件及短信等。
图五 重大/突发事件追踪
同时,基于海量文本舆情数据的全行客户负面舆情监测功能,更是为各级经营主体及风险管理部门主动应对突发事件,及时采取风险化解措施提供了有力的管理工具,本功能通过Kafka/Akka技术实现信息的推送和分发,如图六所示。
图六 实时舆情监测架构
结果/效果总结
恒丰银行信用风险预警系统自投产上线以来,经过模型的不断扩充完善、技术的不断升级、系统性能的不断优化,并经过多个平台贷、网贷业务系统近一年时间的检验,风控能力逐步提升,在客户风险识别效率、准确率、成本控制等方面较传统风控手段有了大幅提高。
(一)新增信贷资产质量大幅提升。以某平台贷为例,自风控系统启用以来,其新增授信业务逾欠率控制在1%以内,且呈逐渐降低态势,不良率更是大幅低于全行同类业务,效果十分显著;
(二)新增的网贷、平台贷授信业务发放效率显著提升。传统贷款类授信业务发放周期为数天至数周甚至更长时间,而在不降低风险防控水平的情况下,基于大数据风控技术的航信票贷、恒信快贷等业务产品却实现了24小时、8小时放款,即将投放市场的另一款零售产品将实现准实时放款,授信审批效率和客户体验同步大幅提升;
(三)新增业务的客户贷前调查成本大幅降低。在以往的风控模式下,客户经理逐一收集客户各类信息,逐一审核并编制调查报告,成本巨大,这也是众多银行开展传统小额贷款不积极、不主动的原因之一;而在大数据技术风控模式之下,新增信贷业务采取预先收集意向客户简要信息,经风控系统的黑名单及各类风险的排查后(不含需客户授权的人行征信等风控过滤),初步确立可进一步发展的客户名单。经对某平台贷的数据统计,风险预审过程可综合节约近80%的人力成本,同时基于该统计数据调整的业务发展规划更为科学、符合实际。
企业介绍:
恒丰银行股份有限公司是12家全国性股份制商业银行之一,注册地烟台。
近年来,恒丰银行稳健快速发展。截至2016年末,恒丰银行资产规模已突破1.2万亿元,是2013年末的1.6倍;各项存款余额7682亿元,各项贷款余额4252亿元,均比2013年末翻了一番。2014年至2016年累计利润总额312.17亿元,这三年的累计利润总额为以往26年的累计利润总额;服务组织架构不断完善,分支机构数306家,是2013年末的两倍。
近年来,恒丰银行屡获荣誉。在英国《银行家》杂志发布的“2016全球银行1000强”榜单中排名第143位;在香港中文大学发布的《亚洲银行竞争力研究报告》中位列亚洲银行业第5位;在中国银行业协会发布的“商业银行稳健发展能力‘陀螺(GYROSCOPE)评价体系’”中,综合能力排名位列全国性商业银行第7位,全国性股份制商业银行前三;荣获“2016老百姓最喜欢的股份制商业银行”第二名、“2016年互联网金融创新银行奖”、“2016年最佳网上银行安全奖”、“2016年度创新中国特别奖”等多项荣誉。
作为一家肇始于孔孟之乡山东的全国性股份制商业银行,恒丰银行秉承“恒必成 德致丰”的核心价值观,践行“1112·5556”工程,即:一个愿景(打造“精品银行、全能银行、百年银行”)、一个文化(打造“开放、创新、竞争、协同、守规、执行”的“狼兔文化”)、一个目标(五年目标是以客户为中心,以创新为驱动,高效协同,弯道超车,五年内进入全国性股份制商业银行第二方阵;十年目标是要打造一个国际金融控股集团)、两个策略(“植根鲁苏,深耕成渝,拓展中部六省和海西,进军京沪广深”的区域策略和“四轮驱动、两翼齐飞”的经营策略)、“五化”强行战略(国际化、信息化、精细化、科技化、人才化)、“五力”工作方针(忠诚力、执行力、目标力、风险经营力、恒久发展力)、五个引领(人才引领、科技引领、创新引领、效率引领、效益引领)、六大综合能力(价值分析能力、风险鉴别能力、定价能力、创新能力、调研能力、学习能力);大力实施“12345”行动纲领,即:“1”是做金融综合解决方案的提供商,“2”是金融云平台和大数据平台,“3”是数字银行、交易银行、银行的银行,“4”是龙头金融、平台金融、家庭金融、O2O金融等四大金融创新业务模式,“5”是投行、资管、平台、人才盘点和以“One Bank”为核心的绩效评价体系等五大战略落地工具,致力于做“知识和科技的传播者、渠道和平台的建设者、金融综合解决方案的提供者”,力求打造令人瞩目、受人尊敬的商业银行,为客户和社会提供效率最高、体验最佳的综合金融服务。
数据猿超声波
「2017金融科技商业价值探索高峰论坛」