百信银行多维分析体系建设实践

编辑整理:小屋 叮当惊喜社

出品平台:DataFunSummit

导读:大家好,我是百信银行大数据部BI团队的罗徽,很高兴今天有机会跟大家一起分享讨论。今天我分享的主题是百信银行多维分析体系建设实践。 主要围绕以下内容展开:① 百信银行业务背景;② 多维分析解决方案;③ 场景化阶梯式数据分析产品建设。

01
百信银行业务背景

第一部分百信银行的业务背景,主要介绍百信银行的业务模式及基于这种模式下多维分析的数据诉求。

1. 百信银行业务模式

百信银行,全称为“中信百信银行股份有限公司”,是2017年由国务院特批、银保监会主导、中信银行和百度联合发起成立的全国首家独立法人直销银行,也是首家国有控股的互联网银行,业务纯线上,可以在全国展开。

百信银行依托智能科技,广泛链接生态场景,业务聚焦于2C+2B普惠长尾客户群,以消费金融和产业金融为主赛道,依托股东生态,以开放银行模式链接生态场景。主要的业务包括消费金融、产业数字金融、财富管理及银行金融同业。百信银行与车生态、大健康、内容娱乐、新消费及现代农业等生态场景产生广泛的用户、数据、产品、服务交互,并与金融机构有同业交易。

作为一家纯线上的互联网银行,百信银行实现了百分之百的线上化运营,以及百分之百的线上账户能力和全功能账户体系。这种纯线上的运营模式更需要数据来提升运营及经营的决策效率。

官网:https://www.aibank.com/about.html

2.  多维分析数据诉求

根据与业务的沟通及数据方面的合作,我们将业务对多维分析的数据诉求抽象为三点:准、全、易。

准,首先要保证指标的业财口径统一,同时也要保证指标的业务分析及监管的审计数据口径统一。另外,准也包含了多维分析在交叉验证的可靠性和可解释性,数据准确是一切多维分析可以展开的基础。

全,从指标资产来说,业务方需要我们提供的指标能够覆盖核心场景,而核心场景需要覆盖全链路的分析过程。从分析体系来说,包含了框架的全面性和闭环迭代的全面性。

易,数据分析面向不同类型的分析使用者需要提供差异化的内容、粒度和展现形式。抽象出来的数据分析使用者大概有以下三大类:战略决策层、策略层及运营一线,包括产品、用户和活动运营。这三类不同的群体对分析的使用诉求、使用习惯及数据内容有不同的偏好。

接下来围绕准、全、易三点展开多维分析阶梯式服务设计思路:

最基本的解决“准”——作为大数据部的分析团队,我们起到承上启下的作用,采用以应用带治的思路在搭建指标体系的同时,联动数仓、数据工程团队和数据治理团队搭好基建,从底层保证准的供给。

针对“全”的诉求——第一,针对指标体系,以及围绕指标维度体系搭建,形成经营指标和画像指标两套体系,从数据资产的角度保证供给指标体系的全面性。第二,针对分析体系,围绕企业经营、产品和用户分析搭建全链路的分析体系。

针对“易”的诉求——从不同群体的使用角度,提供阶梯式的分析产品,包括:统一联动分析视图、自动化预警&归因及预置维度自助分析等。

02

多维分析解决方案 

第二部分进入多维分析解决方案,建设指标体系和分析体系。

1. 指标体系

以信贷场景经营分析指标体系的搭建为例:

首先回答“业务要什么”的问题——需要结合战略和策略,参与分析业务目标的拆解并进行结构化抽象。例如从经营角度分析,对核心指标:利息收入进行拆解,包括生息资产余额(主要是贷款余额),收益率和期限。接下来,围绕增加利息收入的手段进行拆解,分别是提升规模和损益,最后对前两者进行指标(群)的建构,引出下面“怎么做”的探索。

基于对业务目标和实现手段的拆解,进一步回答“怎么做”——即围绕着利息收入的统计和增加利息收入手段,进行问题的建构和解构。首先用杜邦分析法构建分析模块,将拆解出的规模类和损益类进行一级指标建构,规模类可进一步分为资产规模、资产质量和客户规模,损益类则拆解为成本子类、收入子类和回款子类。建立完度量集后,结合实际的业务场景构建维度。维度分为通用型和分析型,后面会详细介绍。

通过将分析度量模块(指标集)按照维度集打散成为分析原子集,重构支持分析原子集的场景,最终实现场景式自助分析及沉淀业务分析经验的可视化图谱。交付能力分两大类:一类是支持业务拖拉拽的自助分析,另一类是一目了然的自动化分析视图。

接下来介绍指标的分群、分层和维度建构。万变不离其宗,一定要以与业务深度合作为基础,基于业务分析的逻辑抽象拆解业务目标的过程及场景。以下以信贷经营分析场景为例展开介绍。

分群,核心指标分为规模和收益两大群体。分层,一级指标贴合业务最关心的KPI指标,定义规模类的为贷款余额;二级指标围绕贷款余额拆解成业务关联度最高的直接指标,涉及到放款类、还款类;三级指标下沉到业务的具体流程指标,例如信贷的通用流程:授信类-用信类-放款类-逾期类-不良类-核销类。

指标体系分为规模类、计数类和比率类等,根据分析的需要,需要关联维度。维度分为通用型和分析型。通用型维度是产品本身属性附带的,在常规分析中不可或缺的,如部门,渠道。分析型维度是随着运营的精细化,基于事先的分析去沉淀合理的高价值分析的标签维度,沉淀到通用型分析上,提高其解释性和问题识别度,如用户分群分层规则。

这一套指标维度构建思路对后续引导需求,发现分析的主线是非常重要的,也为后面的归因体系打下根基,可以保证问题的聚焦性及故事场景的连贯性,保证解答质的强相关及链路的闭环。在工作中会有各种各样的分析场景,有的分析场景非常聚焦,比如已经有明确的分析场景模块,场景模块内有明确的分析目标及分析主线,这种情况很有利于指标范围集和分析维度集的建立。但往往很多分析场景是不够聚焦的。

我们之前遇到过一个需求,业务提出200多个指标需求,但究竟想分析什么,需要先给到数据再探查。这样的需求对于资源的消耗及解答质的高效聚焦是有待优化的。当我们接到需求时,需要保证需求的合理性和高价值性,需要考虑结合业务场景梳理指标的范围层怎样建构,基于范围层怎样去实现与分析体系的高效联动性。首先,剥离指标修饰词和维度,挖掘出核心的原子指标,然后与业务深度沟通分析模型的主场景,根据场景对指标进行分群、分层。当对分群、分层清晰后进行探索性分析,寻找高价值的分析维度,并与业务保持高频交流,来探查终极目标是什么,以及围绕终极目标的一级目标和二级衍生目标是什么。经过这一轮分析聚焦的一级指标不到5个,围绕这些核心指标再进行二级、三级及四级的指标建构和维度建构,最终成功交付项目。

Tips:解答质:所谓解答质就是指目前可提供明确答案的程度。《麦肯锡教我的思考武器》这本书中所提到的,有价值的工作包含两个要素:一是议题度(找到该问题的答案必要性多高);二是解答质(对于该议题度目前可提供的明确答案的程度),议题度和解答质都高的工作也才是有价值的工作。

问答:

Q:经营分析指标体系,核心指标的使用过程中,例如通过评分卡或专家意见或一些机器学习发现哪些二级指标特别有价值?

A:对于核心指标的定义分两类:

一类是无争议的定义,比如KPI,是结合公司战略,跟业务团队充分沟通后定的。围绕着这些指标的二级指标定义更多是基于规则的下钻型分析指标。

另外一类是其他运营优化类的核心指标定义,对于这类指标的二级指标以及二级指标的关键参数,需要根据实际情况选择合适的实现方法。一般会考虑适配分析场景的核心分析维度群,评估核心场景中数据积累的量和质,及业务稳定性。具体来说,百信银行在3年的发展过程中,业务在非常灵活的迭代,适配于国家政策在不断进行创新性的尝试。所以,不一定采用机器学习法,目前更多的是统计分析加专家意见法。比如在设定产品盈利指标的参数,会根据过往历史表现从风险、复购两大维度,综合考虑产品类、损益类指标群的历史表现,结合行业发展分析提供从乐观到悲观预期的不同指标测算参数,再进行下一阶段的验证、迭代。

上述描述是从宏观角度进行阐述,具体根据实际情况分析确定。

接接下来结合业务场景,谈谈指标的维度建构。

例如金融业非常关心的提升ROA,通俗讲是“养大”客户,核心指标是“复贷率”。“复贷”客户无论从成本收益率、运营的难易程度,还是风险的控制角度,一般是表现更优的。下面以“复贷”为例,展开指标的维度建构。

(1)从时间维度分析,除了常用的统计时间外,以放款批次和MOB的时间维度分析也是信贷领域常用的。例如,以MOB看复贷的用户数,户均放款额,户均贷款余额,这是比较粗的看全盘的经营表现效果。当我们从统计时间的角度看,可以下钻到看累计LTD、QTD、MTD的表现。累计LTD更偏重经营分析、财务和战略层面,QTD更关注所持资金健康度,MTD是运营同学更关注的中短期活动效果和运营效果。

(2)从阶段维度分为未结清复贷和结清复贷。通过探索性分析发现,结清复贷在7天和30天有明显的表现差异,得出7天结清复贷和30天结清复贷两个时间窗口维度,锁定触达和运营客户的关键时间点。未结清复贷更偏重怎么去提高客户的粘滞度。

(3)通用维度即指标的自带属性,如产品、渠道、所属部门等。

Tips:MOB:Month On Book,在账月份,例如MOB0:放款日至当月月底,MOB1:放款后第二个完整月份。

现在分享横切的思路,以百信银行用户画像指标体系为例展开。采取的是抽象CRM的思路,对用户进行全生命周期的客户关怀,希望成为客户可靠友好的金融伙伴,在用户需要的时候进行触达,在用户不需要的时候不去打扰。

将用户生命周期拆解成AARRR模型:

A——获客阶段。从与用户建立第一次联系起,希望基于用户画像指标体系KYC进行差异化场景获客。结合用户意愿、价值、风险等采用差异化的内容、权益、节奏进行互动。

A——用户注册开户。根据画像来迭代风险模型,让风险和增长能更好地平衡。

R——用信。当用户进入授信未用信阶段,通过第一道风控流程后,我们希望在合适的时间、地点,以合适的内容和权益,按照用户本人的特征进行差异化的刺激,在用户需要时实现授信和用信。复用信,更强调对客户的理解及对客户不同周期的判断,提高客单价和用户粘性,同时兼顾风险控制。

R——进入休眠、流失和促活阶段。无论是因为个人原因,或银行费率、竞品等原因造成用户流失,我们都希望知道用户是出于什么原因流失,进而思考如何挽留,如何在用户需要时再次为用户提供服务。

R——生日/节日慰问。其他时候,我们希望为客户提供更人性化服务,提供节日、生日等的问候,从而真正实现千人千面的精细化运营。

Tips:KYC——Know your customer.

Q&A

Q:在经营分析中老师分析了从200+个指标缩减到不到5个指标,并精细化这5个指标的案例,更合理的引导业务构建了一套更合理的指标体系。那从用户画像角度,用户对产品使用偏好中,怎样更好地找到用户偏好?怎样增加用户对某一款产品的黏性?

A:用户画像的服务场景广泛。战略层面,例如品宣的定位、产品创设的定位及品牌投放的人群、位置及时间等。策略层面,先看清楚核心,经营用户画像,怎样合理的将用户分群、分层。运营层面,用户画像更强调千人千面,不同的人给不同权益及优化用户体验。

以围绕提升“复贷率”,提升ROA为例进行画像分析,选择哪些指标维度或者特征呢?通过预分析发现,7天和30天结清复贷是明显的两个节点。类似于根据思维主线-预分析-验证是否式合理的分析维度后,将具有明确业务区分度的维度作为维度标签放到大盘中进行对比分析,识别进一步差异化特征,如人口轮廓属性、行为偏好,风险偏好的差异,之后再用lookalike的方式寻找相似人群。

接下来以信贷为例分享如何建设用户/产品画像指标体系。

总体上讲,刚才是分享客户历程,但也贯穿了整个业务流程链。在搭建用户画像指标库时,一共分为两大类:静态属性画像库和动态属性画像库。

静态属性画像库围绕人口的基本轮廓属性,例性别、年龄、行业、收入水平等。

动态属性画像库对各类行为、业务表现和客户风险进行刻画。业务表现是以用户生命周期抽象出动态画像模块,按照前面讲到的指标体系搭建思路,将指标分群、分级并进行维度建构,描述用户不同阶段的表现。

用户画像和产品画像进行联动,希望达到互推荐的功能。产品画像主要围绕利率、期限、风险、用途及产品体验进行搭建。

2. 分析体系

当有了上面的资产后,可以结合不同发展阶段的分析思路进行场景建构。

第一阶段,采用描述性分析回答“发生了什么?”,例如支持业务看清大盘,进行核心指标的监测,并支持对比分析。

第二阶段,基于描述性分析进行诊断分析,回答“为什么会发生?”。当大盘和核心指标发生异动时,我们希望实现自动化监控预警,目前百信银行在逐步实现这一阶段。另外,基于业务逻辑沉淀和业务分析策略的沉淀,开始搭建场景化的自动化归因分析。

第三阶段,采用专家意见+算法的方式进行预测分析,回答“将会发生什么?”。对核心指标和用户偏好进行自动化预测。

第四阶段,采用细分人群差异化策略迭代,回答“什么正在发生?”。作为一家年轻的线上直销银行,迭代的业务需要灵活的数据分析支持。所以除了进行描述、诊断和预测分析,还需要支持业务进行细分人群的定位、细分人群的差异化策略及细分实验的效果比对和异动归因,进而判断什么事正在发生,并据此迭代核心指标,更准确描述大盘的现状和更有效支持运营动作。例如初期的用户核心指标为持仓客户数量,当业务发展到一定程度,我们发现持仓客户的分布中很高的比例是持仓低于某额度且不活跃的客户。结合业务分析和发展目标,把核心指标修改为在一定时间区间范围内符合某额度之上的客户数量。

第五阶段,通过数据资产运营阶段达到赋能决策的终极目标。希望围绕核心KPI逐层展开特定场景深度合作,从业务理解和数据分析上真正提高决策的效率和质量。

03
数据分析产品建设 

接下来结合百信银行数据产品建设实践,通过用户-产品-企业经营分析场景探讨上述分析思路的落地。

1. 用户-产品-企业经营分析场景抽象

我们将用户-产品-经营多维分析场景抽象为横向三层,纵向四块的立方体模型。

横切的三层按逐层递进的思路分为经营层、产品层、用户层。每层支持统一颗粒度的分析,各层间联动上下钻。例如在大盘上看到问题时,可以下钻到产品和渠道探查归因,再下钻一层探查用户与产品的互动表现,从而实现三层联动。

纵向分四块的抽象模式,借鉴了麦肯锡的分析思路:先通过大盘分析看全局,再看变化、构成和比较。结合上面提到的分层横切的思路,形成纵横切割的分析原子对象集。用这样的思路拆解场景,下钻产品和业务链路,乃至客群。

需要注意的是,这些不可能覆盖全量分析场景,我们服务的思路是去报表化,即尽量减少BI团队一事一议的定制化报表开发,而是抽象、整合需求,通过打散业务指标维度,赋能业务轻松自助建构分析场景,比如我行的方式是支持自助拖拉拽生成报表或图形。对于常规通用型分析场景,我们会抽象出分析故事线,通过图形可视化提高分析效率,并逐步实现自动化异常提示,并一键生成自动下钻的联动分析。数据资产方面,将指标口径、看板内容版本迭代信息都在门户页清晰呈现。

2. 阶梯式数据分析产品实践案例

下面分享一个经营-产品-用户多维分析实例。

首先看大盘。抽象为四大模块:整体经营状况、损益、风险和定价。每个分析模块锁定核心指标,搭配前面提到的通用维度,时间维度和分析维度,沉淀分析思路,形成一目了然的描述型分析仪表盘。

下钻到产品&合作方层级进行诊断分析。此处采用趋势分析,贡献度分析,识别并呈现环比正负向贡献及权重,便捷直观。

进一步下钻到用户层级。在这层拆分用户的行为链路,从进件-授信-用信-还款及各环节转化率,结合用户分层分群与产品、渠道进行联动分析。

最后回归大盘分析,实现局部分析和整体分析的闭环联动。将经营-产品-用户的上下钻自助的分析场景基于业务分析经验沉淀为自动化描述+诊断归因数据分析产品。

接下来分享一个财富场景的产品-用户运营联动的案例,目标是探索产品交叉营销策略。

首先还是看大盘,看趋势。当看到明显异常时,可下钻到产品分析。结合时间维度颗粒度收放(月-周-天-小时),探查不同颗粒度的趋势,得出部分产品非常典型的波动规律。之后分析资金流向行内还是行外,流向行内的比例和流向产品;若流向行外的话要结合外部情况进一步分析。基于此分析,业务优化了产品节假日的权益设计,收获了明显的AUM提升。

自下而上统一的数据供给和数据质量保障为数据分析保驾护航。通过公共数据层、数据萃取层和数据多维分析层逐层建构、融入公共维度和分析维度。同时完善质量校验规则库,从非空、逻辑、唯一性、码值等角度在调度任务中部署规则,在每个表生成时进行校验,进行数据质量保障。数据应用层则是沉淀业务分析规则库,实现自动化分析联动、预警及归因并支持自助分析。

上图展示的是自助分析场景,预置分析指标、维度,简单拖拉拽即可形成可视化的报表或图形。

前面探讨的是数据分析内容和产品的建构,按照项目管理的思路,交付之后转运维,一方面根据业务场景迭代数据分析内容,另一方面引入数据治理团队,专注于指标资产化运维,基于合理权限设置将指标和维度进行规范化管理。

3. 总结&思考

最后,以数据的“广度”和“深度”为横纵轴,将多维分析阶梯式数据服务方案抽象为金字塔+五边形的组合。横轴“广度”即数据覆盖度,纵轴“深度”即数据与业务,与智能科技的融合度。

金字塔最底层是数据模型+资产化,是实现数据口径统一化的基础。覆盖自有数和三方数据,经营指标和画像指标,通用维度和分析维度。

向上一层是可视化分析层,包含统一联动视图和自助分析视图。

第三层是运营&经营分析层,深度沉淀业务分析思路实现自动化下钻分析和自动化预警和归因,尽量实现“隐性”的分析思路“显性”化,智能化。

精细化运营层搭建动、静态画像库以及画像质量&价值监控体系。

顶层为决策支持层,形成分层建构体系化“准”“全”“易”。

下面分享一些我的思考:

1. 数据分析综合了业务理解和数据开发,复合型的角色和能力要求。“脚踏实地”是基础,既要理解数据又要理解业务。我在面试时会非常关注分析师是不是了解数据的来龙去脉,是不是了解业务的背景,今天拿到的数据是不是今天业务实际发生的等等,这些都决定后续数据分析的可靠性、可解释性和方向性。

2.  “抬头看路”。数据分析以数据结果为重要依据但不完全依赖。关注外界环境,行业生态乃至国家政策对于洞察都是有益的。

3. “方案落地”。及时抽象有价值的分析思路、沉淀为数据产品,最合适可行的方案>最优方案,快速验证方案及思路的业务价值并基于此识别/挖掘更大价值。强调识别需求及提供高解答质数据方案的能力,而非盲目做大。

4. “释放价值”。低调做事,做扎实,并在适当的时候影响高层和其他团队。在工作中,跨团队demo以前的产品时,经常会听到“我怎么从来不知道有这样的思路,这样的服务方案?”。所适当宣传,碰撞思路,有助于更高效的迭代创新,释放数据价值。

(0)

相关推荐