揭秘招商银行新IT架构 及 银行IT架构转型思考

来源丨人工智能和大数据

作为国内市场化程度最高的商业银行之一,招商银行对于IT系统建设的重视程度在业内也是非常高的。

有媒体统计,在招商银行2016年年报里,这些高频词汇,彰显了该行的新打法——“金融科技”11次、“IT”11次、“数字化”7次、“Fintech”6次。

招商银行董事长李建红在2016年度业绩发布会上表示,招行过去每年在IT上的投入超过50亿元,投入领先银行同业。该行将继续坚持“跑赢大市、优于同业”的目标,积极利用金融科技技术,进一步加大科技创新投入,并建立容错机制,为零售金融的进一步腾飞奠定坚实的基础。

  行长田惠宇近期也曾表示,该行的整个战略转型,目前已进入下半场,上半场确立了转型目标、方向、路径,推进了组织架构改革和结构调整。下半场主要通过实施Fintech战略,推动零售业务的投入产出模型发生变化。

由此可见,IT建设已经成为招商银行最重要的核心竞争力之一,那么,支撑招商银行整个IT系统运行的架构,究竟有什么特别之处?

下面,让我们一起来揭开招行新IT架构的神秘面纱。

招商银行新一代分布式核心系统于2010年启动规划,从规划到投产历时3年。

实施成果

1.技术层面

(1)解耦核心系统。打造层次清晰、运行高效、长期可用的核心框架,对未来业务系统落地实施奠定了基础;重构业务体系,建设满足专业化经营要求的业务系统集群,提高产品定价能力和盈利水平,降低运营成本,控制操作风险。

(2)统一客户信息。建立统一的客户视图和配套的管理系统,实现客户基本信息的集中和统一管理,并在统一的客户标识项下,关联客户在各系统中的产品开通、产品使用、客户行为等信息,形成360度客户视图,同时通过完整的客户信息管理、治理体系,明确客户信息的收集、维护和使用的策略、制度,满足客户经营和管理中各环节对客户信息的需要。

(3)打破渠道竖井。加强渠道整合,从架构上改变目前渠道的竖井状结构,建立多渠道协同体系,统一客户接触、统一客户任务、统一客户认证,使客户获得连续、一致的服务,让客户真正体验ONEBANK服务,不断提高价值客户的忠诚度和满意度。

(4)提升性能指标。从根本上解决主机性能压力。目前日均交易量大幅高出设计标准,各项非功能指标仍然优异。

2.业务层面

(1)提高柜面效率。对系统进行了一次全面梳理和优化,简化操作流程,减少业务菜单,强化系统自动控制,提高单笔业务效率。

(2)提升客户体验。扩大免填单业务范围,以回单替代申请,方便客户业务办理;创新业务处理模式,将凭证挂失等11类业务受理范围调整至全行所有网点,便利客户业务申请。

(3)增强事中风控。通过拍照仪、短信通知、密码键盘确认交易等手段强化业务操作事中风险控制,降低银行操作风险。

(4)业务基础支持。在利率定价、利率灵活设置、结构化存款方面建立了先进的底层技术支持机制,并将客户价值贡献引入到定价过程;在收费定价、收费统一管理方面也做了大量改进。

(5)加强管理信息支持。从业务维度定义了“产品-事件-任务”模型,系统详细记录柜员每次操作,为柜台的成本分摊和柜面行为管控提供精细化的数据支持。

(6)推进数据标准全面落地实施。面对大数据时代的来临,数据标准的实施是全行管好、用好数据的基础,借助新一代核心系统项目,招商银行在数据标准全面落地实施方面也扎扎实实地迈出了一大步。

系统特点

1.基于AS400集群的分布式核心

业内对分布式系统的探讨大多基于开放式架构,而招商银行选择的基于AS400主机集群的分布式系统为业内独创。招商银行一方面倚重AS400的高可用性和易维护性,发挥自身在AS400管理、开发、运维方面的知识积累优势;另一方面通过以AS400主机系统为基础的集群获得了足够的可扩展性,并保障了分布式架构下的数据一致性。

AS400主机与普通×86服务器相比,单机性能强大,分布式集群的规模较小,集群的可维护性高。以本项目为例,×86集群可能需要上百台服务器,而AS400的集群仅需要几台主机。

由单主机向分布式架构的转变势必会带来数据库的拆分。招商银行采取垂直分片方式将业务分为借记卡和其他业务,在保障简单但巨量的借记卡业务的同时,将借记卡业务按分行来分表,从而实现了业务集群化基础上的可扩展性。

2.AS400集群内的事务保护

对于银行核心系统而言,业务数据事务一致性的重要性不言而喻。在银行核心系统的场景下,互联网公司经常采用的最终一致性方案是行不通的。

招商银行自行设计的双机间的交易穿透和双机事务保护机制,在集群的不同主机间采用强事务一致性,在账务层实现了交易穿透。应用开发人员可以完全不用知晓账户所在的位置,由核心底层自动完成集群中主机间的账务穿透,账务交易成功则双方同时确认,任意一侧不成功则双方同时回滚。

由于实现了交易的自动穿透,招商银行在AS400上几十年积累的80%的应用得以不修改或者小修改就能适应新的架构,有效保护了信息资产。

3.分钟级别的主备切换

新一代分布式核心集群的高可用方案采用深沪两地“生产主机-本地热备-远程温备”的方案。主备切换方案按分钟级别设计,在极端情况下提供秒级切换。

首先,主机要快速切换到备机,快速切换的前提是主备数据已经同步到同一点。实现快速同步技术的前提是将联机和批量的同步通道分离。分布式架构已经将同步数据进行了一次切分,再通过批量和联机的通道分离,使联机需要同步的数据量进一步减少,延迟保持在秒级。

其次,批量交易由于会带来数据库的大量读写,往往延迟较长。通过应用设计中的可重入等机制,在批量同步时间预计过长的情况下同步数据可以直接丢弃,在备机上重新跑批,以减少灾难场景下切换所需的延时。

最后,在系统中保存了一个几分钟的交易缓冲池,以在数据未同步的情况下,进行事后交易核对。在极端环境下直接切换时,可凭借这几分钟数据的事后核对保障业务的完整性和正确性。

4.虚拟子账户

热点账户是目前互联网高频交易环境下带来系统冲击的主要原因之一,“双11”支付宝的相关交易账户在秒杀等场景下极易产生热点。招商银行通过虚拟子账户技术从核心层面提供了互联网高频交易的分散策略。虚拟子账户把额度先分配到所有的虚拟子账户上,日间交易时只锁定子账户而不锁定主账户,子账户对业务不可见,而业务查询主账户实时累计子账户余额呈现。虚拟子账户的设计不仅很好地分散了热点,而且由于虚拟子账户可以按商户设置,在清算上提供了额外的便利。

5.渐进式的灰度投产策略

为了保障更好的业务服务和风险可控,新一代核心系统投产过程需逐步切换、支持灰度发布,系统支持必要时完全回退到老的核心系统。此外,系统上线的业务中断服务的时间需要控制在2小时以内,不能对业务产生影响。

为满足上述约束条件,新一代核心系统为投产做了专门的设计:投产过程历时半年,按先小型分行、后中小型分行、最后大型分行投产的顺序逐步推进。在分行分批上线的半年时间内,新老两代核心系统同时在线;业务路由支持新老两代核心系统;单张卡通过配置可以切换到新核心系统,同时提供新老核心的统一视图。

附:银行IT架构转型思考

中国工商银行行长谷澍

IT 架构作为企业架构的基础,支撑着上层业务架构的建设与发展,进而促进顶层愿景和战略的顺利实施。在企业信息化建设快速发展的今天,信息系统规模越来越大,复杂程度越来越高,IT 架构技术支撑能力的重要性愈加凸显。近年来,随着金融产品和服务模式的持续变革,以及工商银行转型发展的深入推进,促使我们不断思考银行IT 架构面临的挑战和影响。

一是随着移动互联网、线上支付、电子商务的快速发展,金融服务的渠道和场景更加丰富,服务模式和体验更加新颖,需要IT系统在支撑多渠道服务协同、信息共享联动、提高服务个性化智能化等方面发挥更大作用。

二是随着各行各业互联网化和现实世界数据化趋势的不断演进,人类社会已进入了数据大爆炸时代,银行需充分发挥数据价值,助推客户营销、产品设计、风险防控和经营管理转型,这就要求IT系统在数据存储、分析挖掘、数据服务等方面给予有效支撑。

三是随着业务处理线上化和自助化的绝对数量和占比持续提升,信息系统对于银行服务的基础支撑作用日趋关键,要求IT架构在安全稳定运行、业务承载能力等方面提供更有力的保障。

四是国际化战略实施过程中面临着不同国家与地区在客户服务、监管规定等方面的差异,以及境内外业务联动发展的新需要;综合化战略要求传统商业银行服务和非银金融服务既合理隔离,又协同发展。这些都对于IT架构提出了新的要求。

从当前技术发展整体趋势来看,集中与分布相结合的架构体系可较好地契合与支持上述创新需求。为促进全行战略转型与发展,工商银行从2014年启动了IT架构转型工程,其中一项重要内容就是要加快分布式架构的使用,推动信息系统从传统集中式架构为主的架构体系,向集中式和分布式架构有机融合的架构体系进行转型。

分布式架构主要特点与发展情况

1、分布式架构的内涵与主要特点

业界对于分布式架构尚未形成统一的定义,但基本包含“基于分布式架构的系统是一组相互独立但并行协同工作的计算机集合;对系统的用户来说,系统就象一台计算机一样”这两层意思。从硬件角度,每台机器都是自治的、独立的;从软件角度,用户感受是整体的、一致的。据此,分布式架构应具备以下特征:

一是物理部署分布式,即用多台计算机来共同承载业务;

二是处理过程分布式,系统各环节各司其职、并行处理,通过特定机制有效协同关联;

三是数据存储分布式,将数据分散存储,但不影响数据运算结果的完整性和一致性。

综合上述特点,分布式架构设计的核心理念是“并行拆分与横向扩展”,即按照一定维度将系统进行拆分,系统各部分松耦合并行运行,并建立起较为完善的横向扩展与容错恢复机制。也正是基于这一设计理念,使得分布式架构具备了多方面的优势:

一是系统扩展能力较强,可基于通用硬件扩展计算和存储能力来提升系统处理能力,满足业务不断增长的需求;

二是系统运行效率较高,在对系统各环节合理拆分的基础上,通过并行处理进一步突破传统串行处理存在的效率瓶颈;

三是系统运行可靠性较好,将系统拆分后并行运行在多台相同的设备上,即使单一设备出现故障,整个系统仍可正常运转或仅局部受损;

四是系统成本优势明显,分布式系统基于相对廉价的通用计算和存储设备构建,获取相同处理能力的成本低于传统架构。

但与此同时,分布式架构也存在一些不足。例如,在对系统进行拆分后,如何协调各部分之间的并行处理,确保最终处理结果的一致性;如何应对跨网络访问过程中可能存在的信息丢失和通讯延迟,确保信息系统服务水平;如何确保在单个节点异常情况下系统正确切换与恢复,确保系统整体可靠性等等,这都需要在系统设计与实现层面制定有针对性的解决方案。再如,分布式系统由于其数据分开存放,不同功能并行处理,为了确保系统整体可靠性,往往采用“数据最终一致性”的原则进行设计,需在产品功能设计层面同步予以考虑。

2、分布式架构发展历程

分布式架构并不是今天新兴的技术名词,从20世纪70年代就已经开端起源,一系列关于分布式架构的基础理论研究开始出现。但直至本世纪初,集中式架构一直牢牢占据着企业信息系统架构的绝对主流地位,即把一类业务集中部署在同一台服务器上的一套系统中,共享同一套计算和存储资源,通过持续提升单台服务器的性能来满足业务不断发展的处理需求。

这一方面是由于分布式架构需以一系列复杂的系统设计与实现方法为基础,有关理论及实践做法有待突破和完善;另一方面根据集成电路性能提高的情况,单台服务器性能约每18~24个月可提高1倍,集中式架构已能较好地满足业务发展需要。

经过三十多年稳步发展后,本世纪初计算机芯片性能提升速度开始减慢;同时随着以搜索引擎、社交网络、电子商务等为代表的互联网时代来临,数据量以每年50%以上的速度快速增长,对信息系统处理能力带来了空前的挑战。上述两种因素叠加影响下,原有集中式架构已无法适应互联网业务快速增长的需要。谷歌、脸书、亚马逊等互联网企业投入了大量技术力量,从分布式架构着手研究解决海量数据存储、计算以及高并发交易处理的难题,在云计算、大数据等方面取得了重要成果,使分布式架构成为业界关注的热点。

以银行为代表的传统金融机构信息化工作起步较早,早期主要采用集中式架构,较好地支持了客户管理、存贷款、支付结算、投资理财等业务开展。近年来随着银行服务模式持续演进提升以及与各行各业日益融合渗透,业务范围和内涵不断丰富。各银行应势而动,着手探索一条既要保证核心业务的安全可靠,又要满足新兴业务尤其是互联网金融相关业务快速发展的IT架构转型道路,在分布式架构应用方面取得了一些突破。

加大分布式架构应用,积极推进工商银行IT架构转型

1、立足工商银行自身特点制定IT架构转型策略

分布式架构技术已在以互联网企业为代表的新兴公司中广泛使用,技术体系逐渐成熟和完善。面对新的形势和挑战,工商银行立足自身实际分析,既看到分布式架构技术对于我行IT架构转型带来积极的促进作用,在电商、社交、数据挖掘等系统中加快引入使用;也看到金融行业与互联网行业在业务特点、服务理念、客户群体、存量IT资产等方面存在的较大差异,深入剖析传统IT架构与分布式架构的优缺点和适用场景,取长补短,有差别有针对性地予以采用。

工商银行在IT架构转型工作中没有简单照搬互联网企业的做法,而是基于围绕传统商业银行业务已建起的近200个业务系统,结合“国际化、综合化”战略实施的现实需要,以“开放性、高容量、易扩展、成本可控、安全稳定、便捷研发”为主要目标,提出了“构建集中与分布有机融合的IT架构体系”的转型实施策略。对功能相对稳定、与客户资金安全紧密相关、且无明显性能容量压力的业务,一段时期内仍以传统集中式架构实现。对于业务新颖性强、创新速度较快、交易并发量大,或者对信息系统部署有特殊监管要求的境外业务,则逐步以开放平台分布式架构实现。

2、高效推进分布式架构在工商银行的落地实施工作

工商银行在IT系统架构转型过程中,始终坚持“优化存量、管好增量”的原则,统筹推进各项落地实施工作。

一是对于原有部署在主机集中式系统的存量非核心业务,正逐步迁移至开放平台分布式架构系统。目前工商银行主机系统日均承载了近4亿笔交易,峰值达到每秒1万多笔,并继续保持着快速增长的态势。为应对交易量的持续增长,充分发挥主机系统和开放平台系统的不同优势,工商银行已将客户增值服务信息、历史明细、现金管理、会计要素管理等相关业务迁移至开放平台,目前正着手进一步开展小额支付、金融市场、投资理财等业务的迁移改造工作。

二是对于原有部署在开放平台并采用传统集中式架构的系统,正结合业务特点差异有选择性地实施分布式架构改造。工商银行对于已有的网上银行、手机银行、银企互联、信贷管理、客户营销管理等多个系统,也正结合全行业务发展需要和业务内在特点,差异化地实施IT架构优化提升。对于线上支付、短消息提醒、产品集中销售等业务量波动较大的内容,正逐步按照分布式架构实施改造;对于柜面业务处理、客户营销管理等业务量相对稳定的内容,则重点基于集中式架构持续优化提升。

三是对于近年来新推出的相关业务,工商银行注重发挥分布式架构等新技术作用,促进产品创新和服务能力提升。在互联网金融与大数据处理方面,工商银行基于分布式架构建设了“三平台(融e购、融e联、融e行)、一中心(网络融资中心)”、大数据处理平台等;在国际化方面,工商银行建设了基于开放平台的境外核心银行系统,已逐步在莫斯科等境外机构投产实施,在支持各境外机构业务灵活创新的基础上,也更好地满足了部分国家或地区的特殊监管要求;在综合化方面,工商银行结合各子公司业务特点,基于开放平台建设了相关业务系统,有效促进了业务的转型发展。

工商银行分布式架构实践过程中的有关思考

1、客观辩证地看待分布式架构带来的促进与挑战

分布式架构以其具有的横向易扩展、松耦合、高可靠、硬件成本低等特点,迅速成为业界关注的热点。随着技术体系的成熟和相关开源软件的出现,进一步促进了分布式架构在各行业的广泛应用。工商银行通过自身实践,也充分体会到了分布式架构技术在支撑业务产品创新、降低功能耦合程度、确保系统稳定运行、降低硬件成本投入等方面的促进作用。但与此同时,分布式架构作为有别于传统集中式架构的设计,也有其自身的局限性。一是对于功能相对简单、服务需求相对稳定的业务,使用分布式架构反而将显著增加设计与实施成本。二是分布式架构对于架构设计、研发、运维等人员的知识结构有着新的要求,架构转型需要与人员知识结构转型相配套。三是对于已有的基于主机和小型机建设的系统,需结合系统现有布局、改造成本、业务系统升级规划等综合因素确定转型策略和实施计划。

2、分布式架构转型需要科技和业务部门协同推进

分布式架构下系统各组成部分的相互关系及作用模式发生了较大变化。除了在系统架构设计和研发等方面的变革,更由于系统部署模式、故障恢复机制的变化,须在运维监控、应急处理等方面进行配套,需要研发部门与运维部门之间的紧密协同,共同做好分布式架构下运维管理平台的建设和完善。同时,分布式架构系统建设过程中还需要业务部门与科技部门密切配合。一方面,可运用分布式架构的灵活可扩展、并行高效率处理等优势,在业务促销、复杂产品估值、实时风险防控等方面发挥价值;另一方面,分布式架构在数据和事务一致性等方面的局限,也可能给产品与服务带来一定挑战,需要业务部门和科技部门共同寻求解决方案。

3、持之以恒推进IT架构转型优化工作

当前服务创新层出不穷,信息技术发展日新月异,IT架构须紧随业务和技术发展趋势持续转型和优化提升。工商银行一直高度重视信息技术发展,持续加大对信息科技工作的资源投入,不断加强对新技术的研究与应用,持续推进IT架构的转型优化工作。当前,除了云计算、大数据等分布式架构技术已逐步发挥价值外,对于区块链分布式账本、人工智能、物联网等新兴技术,工商银行也在研究如何加以应用,以进一步提升客户服务与改进经营管理。

(0)

相关推荐