金融科技简述 I
电力革命与大数据、云计算、人工智能
人类的航海历史始于以人力、风帆为动力的传统时代。近代蒸汽机和燃油发动机的出现大大提升了航海的效率,全球贸易蓬勃兴起。应用现代核能技术,航空母舰和大型潜艇在大洋中实现了长期自由航行。可以说,动力的提升推动了人类航海时代的不断跃进。对金融业而言,科技创新同样是发展的重要动力。例如,纸张和印刷术的发明促进了中国古代“飞钱”、“交子”的创新,而电话、电报的出现导致全球金融交易方式和效率发生深刻变革。
新一轮金融科技的创新主要体现在大数据、物联网、云计算、人工智能、区块链、隐私计算等新兴科技的崛起。在这些新的技术出现之前,人类收集、处理数据的能力十分有限,只有高价值的数据才会被采集和利用。随着移动设备、传感器、物联网的出现,数据记录和分析工具不断创新,大量低价值的数据得以采集汇聚。数据量如此之大,需要巨大的计算能力,无法用单台的计算机进行处理,必须采用分布式架构对海量数据进行挖掘和存储。实时的大型数据分析需要向数十台、数百台甚至更多的电脑分配工作,云计算应运而生。正是因为计算硬件和分布式处理方式发展,巨量的数据和更复杂的算法才得以实现,机器智能开始向人工智能转变,各种社会应用功能不断拓展。
在产生了海量数据之后,如何安全和可信地记录和存储数据的就愈发重要。区块链技术创新增强了数据的真实和可靠性。数据成为社会核心经济资源后,价值大大提升,但同时也产生了原始数据保护和防范个人隐私侵犯等需求。通过明文加密和基于密码学基础,以及硬件环境保护的隐私加密技术应运而生,实现“数据可用不可见”,成为数据使用和交易过程中的保险箱。
总的看来,如果说大数据是基础资源,物联网则是采集途径,云计算是炼化基础设施,人工智能是应用工艺,区块链是新型记录储存方式,隐私计算则是数据资源的保险箱。
1、大数据的产生
这一轮大数据信息革命,跟早期的能源电力革命非常相似。工业革命之前,煤和石油并不值钱,因为挖掘成本高,利用效率低。随着挖掘技术、化工处理工艺的进步,它们得以被大规模开发,成了社会争夺的原料和资源。最初发电的设备只是独立型发电机,分散在少数的企业,发电的规模和效率都非常有限。为了更加高效地社会化利用电能,出现了大型专业的发电厂,对煤和油等燃料进行集中统一利用,生产大规模电力,通过传输电线、配电站传输到各个角落。发电传输方式的演进,就像由个人电脑、小规模服务器组合发展到大规模“云计算”。发电规模和效能的提升,就像人工智能算力的提升,二十世纪初电灯、电话以及电梯开始广泛应用,就像我们现在对大数据、人工智能的算法和场景的应用。
大数据的定义有很多种说法,大多都是围绕获取、存储、管理、分析方面做出的定义。2011年,美国麦肯锡公司在《大数据的下一个前沿:创新、竞争和生产力》报告中最早提出:大数据指数据量远远超出传统数据库软件工具收集、存储、管理和分析能力的数据集。信息技术研究和顾问公司Gartner给出了这样的定义:大数据是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。关于大数据的特点,目前业界广为被接受的理念是IBM提出的“5V”:
Volume(海量):数据量大,包括采集、存储和计算的量都非常大。大数据的起始计量单位至少是P(1000个T)、E(100万个T)或Z(10亿个T)。
Variety(多样性):种类和来源多样化。包括结构化、半结构化和非结构化数据,具体表现为网络日志、音频、视频、图片、地理位置信息等,多类型的数据对数据的处理能力提出了更高的要求。
Value(价值):原始数据价值密度相对较低,类似沙里淘金,但挖掘后的数据价值高。如何结合业务逻辑并通过强大的机器算法来挖掘数据价值,是大数据时代最需要解决的问题。
Velocity(速度):数据增长速度快,处理速度也快,时效性要求高。比如搜索引擎要求几分钟前的新闻能够被用户查询到,个性化推荐算法尽可能要求实时完成推荐。这是大数据区别于传统数据挖掘的显著特征。
Veracity(真实性):数据具有准确性和可信赖度,即数据的质量有保证。
大数据的产生,来源于无所不在、不断创新的各类采集工具。在二十年前的互联网时代,照片、音乐、视频等海量数据被连接到网络中;搜索引擎逐渐替代门户网站成为大众上网的第一入口,形成了海量用户搜索行为数据。当前的移动互联网时代,移动设备的传感器收集了大量的用户点击行为数据,带来了大量的数据流;社交网络成为亿级用户高频使用的软件后,大量社交数据产生,对应着不同人群的不同特点;电子商务的兴起,让大众交易全流程数据都可以在线获取,包括消费特点、支付数据、物流数据。
物联网把传感器、控制器、机器、人员和物等通过新的方式联在一起,形成人与物、物与物相联,实现信息化、远程管理控制和智能化的网络。在中国古代,东汉科学家张衡发明的地动仪可以算是远距离传感器的雏形,是一个非常典型的基于物物相联概念的科技发明。张衡发明的地动仪可以感知地震,并用非常形象的“蟾蜍吐丸”来传递远程的地震信息。而如今,利用计算机和互联网,人们可以将物物相联的技术投入更大范围和有效的应用,比如通过建立物联网气象站,更加科学精准地预测天气变化。
5G网络技术的快速发展、落地,也大大促进了数据的传输和连接。2019年6月6日,工信部正式向中国电信、中国移动、中国联通、中国广电发放5G商用牌照。我国正式进入5G商用元年。未来5G网络的传输速率可达10Gbps,因此能够高效的支持远程医疗、外场支援、物联网、智慧城市、智能家居、智能物流等连接量较大的应用。与此同时,利用5G技术,也能够收集更多、更复杂的数据。
现实生活中,大数据无处不在。在城市智慧交通上的应用中,智能车载记录仪、摄像机等作为移动监控设备,观测交通路况,抓拍违法行为,通过实时图像识别、人脸识别确认机动车车牌号码和驾驶员身份信息,将抓拍视频、照片、车辆号码、人员身份信息数据向云端传输、处理、解析,让交通违法无处遁形,提升城市道路交通的智能管理水平。一旦严重交通违法行为与个人征信记录实现实时挂钩,将对交通违法行为形成有力制约,提升交通安全性的同时,也能够增强大众信用意识和社会信用水平。
工作环境中,美国MakuSafe公司开发了一套可穿戴手环,供员工在工作场所中穿戴使用,并能不断收集实时工作环境和运动数据。这款无线手环收集到的场地实时数据会立即在MakuSmart云平台中作处理,并显示在仪表界面上,可帮助安全管理人员识别安全趋势,定位常见高危区域,甚至会主动采购安全设备,从而提升工作场地的安全性,并且在事故发生后减少停工时间。这款移动可穿戴设备反馈的信息,还能够帮助保险公司更好地预防工伤事故、更高效地处理工商理赔、更科学地计算理赔金额。
农业生产由于地理和历史原因,往往是以家庭为单位的小规模生产模式为主,气象和地质灾害等不可控因素对农业生产的潜在影响较大。农业物联网围绕农产品种植、生产、加工的整个过程,通过物联网技术提供对太阳能辐射、降雨量、风速等生产环节的实时监控,如土壤水分的测量,从而掌握农作物的动态生长过程,实现了农业生产的精准化。生产之后,可以借助传感器的形式,对于农产品的质量进行全流程监控,并且通过互联网征信以及物联网生产的全程跟踪,企业与农户就可以取得一定金额的信用贷款。
大数据在金融机构的业务应用非常广泛。在风控方面,传统的风控模式主要基于金融机构线下获取的客户数据及央行征信数据,通过人工审核来完成,数据采集效率低、数据源维度较少,而利用大数据技术,能够对多渠道、多维度的数据源进行聚合、挖掘、交叉验证、模型建设,从碎片化、非结构化的数据中,交叉验证信用水平,降低欺诈风险,构建差异化的风控模型,作出更加科学的信用评级和风险定价。大数据技术也能够支持贷后管理实时风险分析,通过违约信息排查和监测预警及时跟踪违约风险。
在营销方面,大数据可以更加及时反映用户实时的需求,帮助企业更加精准地抓住营销机会,针对目标用户画像进行建模,并与营销场景的用户标签相匹配,向用户推荐个性化的产品服务,优化渠道策略,提升转化率,降低获客成本。
在运营方面,大数据可以针对用户不同阶段的数据表现,做用户生命周期管理,从用户激活、再度营销到挽留,都可以进行更加精细化的管理,智能分析和预测客户的需求,制定个性化、差异化的运营策略,提升用户活跃度和忠诚度。在产品方面,可以根据用户在每一个节点的交互数据,更深层次地理解用户的习惯,分析用户的特征和偏好,对产品服务进行优化改进,提升用户体验,根据市场的变化和用户不断更新的需求,打造创新的金融产品。
个人普惠金融方面,部分领先的金融机构已建立起基于大数据分析的利率定价流程,广泛使用客户分群、客户行为预测、信用风险分数测算等分析方法建立定价模型。这也激励着传统银行整合利用各渠道营销资源,建立完善渠道间协同机制。充分发挥数据优势,开发长尾客户,建立客户画像,针对客户场景提供个性化服务,唤醒客户潜力,让金融覆盖到更广阔的人群。
大数据本质是开放与共享,但如何界定和保护个人隐私权成为法律难题。大数据存储、处理、传输、共享过程中也存在多种风险,不仅需要技术手段保护,还需相关法律法规的规范和金融机构的自律。在国际范围内,欧盟提出的GDPR(General Data Protection Regulation,一般数据保护条例),将数据保护的严重性提高到前所未有的程度,对涉及数据共享、开放、流通、交流、使用和保护的法律制定与执行提出了更高要求。金融数据完整性保护日益成为全球规范趋势,当前需要通过制度约束、规范保障、新技术应用等多重手段,推动实现兼顾大数据合理应用与数据有效保护的双赢结局。
数字鸿沟(Digital Divide)最早由美国国家远程通信和信息管理局(NTIA)于1999年提出,最早是指不同国家、地区、行业、企业之间,由于对信息、网络技术的拥有程度、应用程度以及创新能力的差别而造成的信息及贫富差距,犹如一条鸿沟横亘在其之间。在数字普惠金融得到大力发展的同时,仍然有不少农村居民、老年人、残障人士等特殊群体较难获得数字化金融服务,形成了数字鸿沟。因此需要积极探索使用科技手段,如图像识别、语音技术等科技,进一步推动数字普惠金融的发展,让金融科技能够真正便民、惠民、利民,填补由于信息科技发展不均衡带来的的数字鸿沟,这也成为当前金融科技发展的重点之一。
2、云计算与爱迪生
1879年10月21日,美国发明家托马斯·爱迪生点亮了世界上第一盏电灯。最开始一个电源只能点亮一盏电灯,爱迪生经过探索,提出并实现了一个电源可以同时点亮若干盏电灯的理论。他架设了世界上第一条供电线路,发明了火力发电机和使用保险丝的安全方法。1882年9月4日,爱迪生在纽约建立了世界上第一座发电厂。这座发电厂利用蒸汽机驱动直流发电机,内装6台发电机。一方面通过发电机联网创造更大规模的电力,另一方面通过搭建供电线路,可使电力远程供给更多人使用,打造了世界上首个“发电设备云”。
像现代电力供应一样,当代的云计算也有以下特点:一是随时随地提供不中断服务,用户只要有可以上网的终端,就可以通过云来获取应用服务,所请求的资源来自“云”;二是安全可靠,云计算有多种措施保障,包含数据多副本容错、计算节点同构可互换等,比本地计算机存储更可靠;三是高可扩展性,云计算支持多种类型应用同时运行,满足应用拓展和用户大规模增加的高可扩展性;四是高性价比,云计算有专业团队开发和管理,节省用户端在软硬件的前期投入,用户可以低成本获得所需的服务。
近年来,云计算已经成为全球IT公司的重点发展战略,IT巨头纷纷带领市场向云计算转型,促进了云计算市场规模的快速增长。根据Gartner研究报告,全球公有云市场规模从2010年的683亿美元增长至2016年的2,092亿美元(包括BPaaS、SaaS、PaaS、IaaS、Cloud Management and Security Services和Cloud Advertising),年均复合增速高达20.51%。云计算行业由巨头主导,“马太效应”明显。前24家超大规模运营商(通常拥有数十万台服务器,例如亚马逊和谷歌)拥有近320个大型数据中心,2016年占全球云服务市场的68%(包括IaaS、PaaS和私人托管云服务),占SaaS市场的59%,而2012年这两项数据仅为47%左右。超大规模运营商的主要云服务市场份额逐年增长,行业集中度不断提高,反映出明显的马太效应。根据中国信息通信研究院报告,2019年公有云市场规模达到689亿元,相比2018年增长57.6%。信通院还预计2020-2022年仍将处于快速增长阶段,到2023年市场规模将超过2,300亿元。。
2017年6月,中国人民银行印发《中国金融业信息技术“十三五”发展规划》,提出金融机构要稳步推进系统架构和云计算技术应用研究。截至“十二五”期末,主要银行业金融机构数据中心实现“双活”“多活”等模式,有效提升了数据中心的效用,通过运用虚拟化、开源软件、分布式、云计算、大数据等新技术,创新建设信息基础设施,搭建企业级云平台,探索信息基础设施架构从集中式向分布式转变,具备了对海量数据进行高效处理的能力。
云计算在金融业的应用日益广泛,但也带来了一系列新的挑战。例如,物理主机如果遭到破坏会给虚拟服务器造成危害;多用户数据集中在云服务器存储,存在被非法访问、篡改的隐患;云平台出现故障,导致数据延迟或无法恢复,会给用户带来损失;云计算数据可能分布在不同国家和地区,处于不同政府的监管下,解决法律纠纷的难度大。
此外,云计算的安全不仅要考虑物理空间和网络空间的环境安全和技术安全,还要考虑管理安全;不仅要具备静态的保护能力,防止和降低故障、损害,还要具备主动防御的能力,能够及时发现攻击,并能够从破坏中及时恢复。对于云计算数据中心的安全保护,通过单一的手段是远远不够的,需要有一个完备的体系,涉及法律、技术、监管多个层面。
3、 人工智能与老中医
随着数据的积累、算力的提升以及算法的改进,人工智能近期取得了质的突破。虽然人工智能概念的提出已有将近60年之久,但初期的发展速度一直偏慢,直至本世纪后才飞跃发展。这就像人类利用电力,古代人类也看到了雷电,敬畏其威力,但其他技术条件还没有成熟,无法利用。直到今日,深度学习算法、海量大数据和能提供高性能算力的硬件满足了人工智能的基本需求,人工智能迅猛发展,在一些目标明确、程序规则固定的商业领域,机器的分析能力已经超越人类。
人工智能的基础要素
数据是人工智能的基石,是驱动人工智能取得更好的识别率和精准度的核心要素。进入互联网时代后,出现了大数据的高速发展与积累,这为人工智能的训练学习奠定了良好基础。比如,在AlphaGo的学习过程中,核心数据是来自互联网的3,000万例棋谱,而这些数据是在十多年互联网行业的发展中积累的。离开了这些棋谱数据的积累,机器战胜人是无法实现的。
算力为人工智能的实现奠定了基础。互联网时代下的大数据高速积累,从2003年的5EB到2013年的4.4ZB,于2020年达到44ZB。而随着计算的成本在不断下降,以及处理器和服务器的算力愈发强大,从CPU到GPU,甚至到量子计算的出现,人工智能技术发展所受到的约束也在逐步减少。
算法是人工智能发展的重要引擎,尤其是深度学习的算法,可以帮助我们以前所未有的方式理解世界,创造和发现新事物。算法的迭代——从技术层面的创新到思维方式的转变,意味着人工智能乃至社会生态的无限的可能。以人脸识别为例,在2013年人脸识别引入人工智能技术后,识别率大幅提升,能做到97%的识别正确率,超过了人类95%的识别率,这才为人脸识别的商业化应用奠定了基础。
我们可以简单的将人工智能理解为一种复合流程,即数据、算力和算法以某种非线性的有机融合所形成创新的解决方案,就好比名老中医,通过“望、闻、问、切”进行诊断输入,调取脑海中积累的海量案例数据,通过阴阳五行、黄帝内经等各种复杂的药方诊疗,同时借助自身超凡的悟性和智慧,将各种案例和模型在脑海中飞速的组合和迭代,最终得出治疗思路。人工智能的数据就好比名老中医的海量案例,算法就是名老中医的医学经验诊断,算力是名老中医的悟性和智慧。
有时候,老中医在诊断病情的时候,自己也说不清判断的依据,因为他大脑已经成为一个非常复杂的非线性多维空间结构,这也导致了名老中医难以复制和传承。然而利用人工智能可以快速、批量的生产名老中医——通过海量数据的训练,跨越时间的约束快速获得非凡经验;利用机器学习算法,快速学会各种理论模型和内功心法,通过增强算力弥补天赋的不足,快速提升智力水平来承载经验和理论的运转。
人工智能的核心技术
人工智能很像人类的感官、思维、学习方式,核心技术包括图像语音识别、自然语言处理、机器学习、专家系统等。图像语音识别类似人类的感观器官,接收转化内外部信息,而自然语言处理类似人类的大脑,将非结构化信息转化为结构化信息,其思考方式往往是通过专家系统和机器学习来提高效能。
图像识别是信息时代的“眼睛”,它是模式识别的一种类型,是对人类视觉功能的模拟。图像识别首先采集图像,然后通过对输入的图像信息建立图像识别模型,分析并提取图像的特征,然后进行分类识别,使计算机系统具有模拟人类通过眼睛接收外界信息、识别和理解周围环境的感知能力。
图像采集是指利用相机等传感器把图像、照片、景物等信息转换为计算机可以接受的数值或符号(串)集合。在数据采集之后,要进行数据处理,包括预处理、特征提取和选择。数据预处理的主要作用是改善图像质量,特征提取主要是用映射的方式将高维空间的原始底层特征变换为低维空间的高层新特征,从而有利于分类。判别分类是图像识别的关键,特征提取往往以在分类中使用的某种判决规则为准则,所抽取的特征是在某种准则下分类错误最小。通常这个过程并非一次能完成的,需要不断地修改和完善。
自然语言处理(NLP)是计算机科学、信息工程和人工智能的交叉领域,涉及计算机和人类(自然)语言之间的交互,特别是如何对计算机进行编程来处理和分析自然语言数据。由于语言是人类思维的证据,所以自然语言处理是人工智能的最高境界,被誉为“人工智能皇冠上的明珠”。
目前,人类与计算机系统之间的交流主要依靠受到严格限制的非自然语言,即我们常说的程序语言。NLP主要研究如何使计算机能够理解、生成、检索自然语言,从而实现人与计算机之间用自然语言进行有效交流。自然语言处理的研究内容包括语音识别、语音合成、文本朗读、机器翻译、问答系统、信息检索、信息抽取、自动摘要、文本分类或聚类等。
让计算机能够确切理解人类的语言,并自然地与人进行交互是NLP的最终目标。根据这个目标,该领域大致可以分为自然语言理解(NLU)和自然语言生成(NLG)两块。NLU侧重于如何理解文本,包括文本分类、命名实体识别、指代消歧、句法分析、机器阅读理解等;NLG则侧重于理解文本后如何生成自然文本,包括自动摘要、机器翻译、问答系统、对话机器人等。两者间不存在有明显的界限,如机器阅读理解实际属于问答系统的一个子领域。
由于自然语言作为人类社会信息的载体,使得NLP不只是计算机科学的专属。NLP技术广泛应用在文档密集型的垂直领域。像“今日头条”这样的新闻类应用之所以火爆,主要就是因为其采用了自然语言处理技术,应用程序可以聪明地归纳每个人看新闻时的不同习惯、爱好,给不同用户推荐不同的新闻内容。带智能推荐功能的应用如果做得好,用户就会越经常使用,机器就越懂得自己的“心思”,一段时间后,这个应用程序就不亚于一个量身定制的新闻管家了。而且,目前国际上已经出现相当数量的新闻内容,是由计算机上的人工智能程序自动撰写的。
NLP在其他领域也有极大的应用潜力。在法律领域,中国裁判文书网上就有几千万公开的裁判文书,此外还有丰富的流程数据、文献数据、法律条文等,且文本相对规范,NLP可以被应用到法条搜索、辅助量刑、合规审查、法律风险提示、智能法律咨询等领域。在金融领域,单A股就有3,600多家上市公司,这些公司每年都有年报、半年报、季报等,加上瞬息万变的金融新闻,金融界的文本数量是海量的。除了少量的结构化数据外,大量的公开信息都以PDF、Word、网页等富格式文档的形式存在。通过NLP可以大幅提升处理此类海量信息的能力与效率。目前,NLP被应用到智能投研、舆情分析、合规监管等相关领域,用于快速处理海量文本,以提升效率和降低成本。
机器学习是用数据或以往的经验来对计算机程序的某些性能标准进行优化。机器学习方法在大型数据库中的应用被称为数据挖掘。与此相似的例子是大量的矿石被人们从矿井中提取出来的,经过处理后会变成高价值有用的材料。在数据挖掘中,大量的数据被处理后用来构建有价值的模型。这些模型的应用非常广泛,在金融领域里银行会通过分析过往的数据来构建模型,用于信用评估,欺诈检测等等。在医学方面,机器学习模型可用于医疗诊断,比如IBM的Watson诊疗系统。在制造业中,机器学习模型被用于生产优化、过程控制和故障排除。
专家系统是一类具有专门知识的计算机智能软件系统。该系统对人类专家求解问题的过程进行建模,对知识进行解构,然后运用推理技术来模拟通常由人类专家才能解决的问题,达到具有与专家同等解决能力的水平。知识与推理是专家系统的中心。一般来说,专家系统由知识库、推理机、综合数据库、解释器、人机交互界面和知识获取等部分组成。
研究方法论
人工智能的研究通常被分为三个学派:经验主义、连接主义和符号主义。经验主义以大量数据训练算法,通过统计的概率分布,建立函数模型,完成机器学习。类似于人类在不断进化中学习条件性反射,机器也可以在数据积累中不断拓展对世界的感知范围,并建立对感知信号的反应模型。该学派的优势是模拟了人类“感知-反应”的学习过程,通过固定的信号输入和反应要求,准确把控人工智能的行为模式;劣势是基于现有的技术能力,人类很难在数据输入中穷尽现实世界的所有“感知-反应”组合,因而限定了人工智能的边界。
连接主义采用的方法是,把数据输入到通过大量人工神经元相互连接构成的神经网络,不断训练并完善神经网络,完成深度学习。有一个形象的比喻:神经网络就像一个水管系统,上方布满阀门,下方有不同的出口,每一次注入新的水流,人们都可以预先规定水流的出口,再让计算机自动调节水管系统内阀门的大小,通过不断地注水和调节阀门,最终每次水流都可以从规定的出口流出。数据输入就是注水,阀门就是算法的内部参数,而最终流出的水流就是人工智能的处理结果。计算机在自动调节算法的过程中,可以不断发现数据中隐藏的规律,这增强了人工智能举一反三的能力。
符号主义又叫理性主义,认为世界上全部信息都可以用符号系统进行承载,通过向机器输入符号化的知识和假设,可以让机器推导出一个合理的结论。知识图谱就是这一学派最重要的应用之一。通过向机器输入一个基于现实世界的实体、关系、概念、属性构成的语义网络,使人工智能的逻辑推理成为可能。
三大学派都有独特的优势:经验主义的优势在于模拟仿生依靠过去的经验,重点应用于可自主行走机器人;连接主义大幅减少了训练数据量的需求,通过当前不断尝试,让机器自身总结规律,优势在于图像和自然语言识别;符号主义的模型更为直观和简洁,主要靠逻辑推理,在关联查询上效率很高。
人工智能的市场前景和金融应用
在Gartner公司发布的《2019年度新兴技术成熟度曲线》中,共有29项新兴技术首次进入成熟度曲线,其中涉及人工智能的新兴技术占比超过50%,包括通用机器智能、情景经纪和神经形态硬件等。此外,随着智能手机语音助手使用率的快速增长和智能机器人领域的大规模并购,虚拟个人助理和智能机器人在新兴技术成熟度曲线上的位置明显前移。在Gartner公司发布的《2019年度新兴技术成熟度曲线》中,智能机器人、虚拟助理、深度学习等13项人工智能技术处在期望膨胀期,人工智能也开始进入触发期。
随着深度学习算法的普及,图像处理技术有了很大提升,已经接近人眼视觉能力;语音识别准确率达到95%,已经接近人类听觉能力;开放领域的语义理解准确率达60%~70%,垂直领域的语义理解准确率达95%,这意味着专用人工智能已经基本成熟。但是,真正意义上完备的人工智能系统应该是通用的智能系统,而非专用的智能系统,从专用人工智能到通用人工智能还有很长的路要走。
从投资规模来看,根据德勤的报告,在过去5年间,全球人工智能领域投资出现快速增长。全球人工智能领域融资在2017年迎来全面爆发。据不完全统计,2017年全球人工智能融资总额跃升至104亿美元,并在2018年持续增加。截至2019年上半年,全球人工智能领域共获融资超过109亿美元。在我国,人工智能领域获得资本青睐,成为风口产业,在资本和技术协同支持下进入了高速增长期。2018年中国人工智能领域融资额高达1,311亿元,同比增长677亿元,增长率为107%。
当前,各国纷纷在战略上开始布局人工智能。美国将AI提升到国家发展战略的高度,2016年白宫组织研讨会讨论人工智能,成立人工智能委员会,用于协调全美各界在人工智能领域的行动。日本在其2016年开始执行的“第五期科学技术基本计划”中,计划安排26万亿日元的研发经费,用于物联网及人工智能系统等技术研发,旨在实现领先于世界的“超智能社会”(Society5.0)。
在我国,人工智能已经上升到了国家战略层面,成为我国未来整体发展的重要抓手。2016年3月,“人工智能”一词首次被写入“十三五”规划纲要。2017年7月,国务院印发《新一代人工智能发展规划》。2018年,工信部颁布《促进新一代人工智能产业发展三年行动计划(2018-2020年)》,对国务院发文进行了细化并提出了落实细则。作为一项重要战略,我国提出要抢抓人工智能发展的重大战略机遇,构筑我国人工智能发展的先发优势,加快建设创新型国家和世界科技强国。2019年6月17日,国家新一代人工智能治理专业委员会发布《新一代人工智能治理原则——发展负责任的人工智能》(以下简称《治理原则》),提出了人工智能治理的框架和行动指南。
在金融领域,人工智能有广泛的应用场景。人工智能可以应用在金融预测和反欺诈领域。大规模采用机器学习,导入海量金融交易数据,使用深度学习技术,可以从金融数据中自动发现规律,如分析信用卡数据,识别欺诈交易,并预测交易变化趋势,提前做出相应对策。基于机器学习技术构建金融知识图谱,基于大数据的风控需要,把不同来源的数据(结构化、非结构化)整合到一起,可以检测数据当中的不一致性,分析企业的上下游、合作及竞争对手、子母公司等之间的关系。
人工智能可以应用在授信、投资以及定价等金融决策中。在授信业务中,通过整合多来源及不同性质的数据(比如社交媒体数据),快速运算出结果,分析贷款要求是否合理。在贷后监控方面,通过数据筛选、建模和预测打分,实时对借款人还贷能力进行监控,及时对后续可能无法还款的人进行事前干预,减少坏账损失。在投资决策中,根据金融交易历史数据,利用深度强化学习技术(Alphago核心技术),给出当前经济形势预测、银行某项关键数据趋势预测,辅助金融决策。在保险定价方面,可以通过对车的定位、跟踪驾驶速度,结合其他非保险领域的数据,通过模型算法自动化地分析其风险因子分数(车祸发生的概率等),可以使保险定价个性化和动态化。
根据马科维茨的现代资产组合理论(MTP),结合个人客户的风险偏好和理财目标,利用人工智能算法和互联网技术为客户提供资产管理和在线投资建议,实现个人客户的批量投资顾问服务。一般而言,其成本远低于人类投资顾问,因其服务过程能够实现全部或绝大部分自动化操作管理,因此被称为智能投顾。“研究交易”是投资的核心步骤,AI技术(包括索引技术、知识图谱、图像识别、机器学习、决策智能等)构筑的智能投顾已渗透在“研究交易”的各个方面。智能投顾的复杂性在于影响市场的因素复杂繁多,因此AI技术需要在每一步环节与发达的金融理论相结合。目前来看智能投顾尚在初期,不过随着数据搜索分析、报告生成、量化交易每一步骤得到“细致的”智能化,优秀的智能投顾产品将在未来出现。
智能客服系统采用自然语言处理技术,提取客户意图,并通过知识图谱构建客服机器人的理解和答复体系。同时,智能客服以文本或语音等方式与用户进行多渠道交互,为广大客户提供更为便捷和个性化的服务,在降低人工服务压力和运营成本的同时进一步增强了用户体验。随着机器视觉、深度学习技术在人机交互领域的发展,银行等金融机构已经开始在网点大堂设置智能服务机器人,通过语音识别、触摸交互、情感表达、肢体语言等方式,了解客户的需求,并对此进行反馈和信息推送,实现迎宾分流、开展大数据营销、辅助查询开卡、销卡等业务的办理,减少大堂经理的重复性工作。服务机器人的应用,提高了金融机构服务的科技水平,给客户带来新体验,为提升银行服务质量和效率注入新力量。
在看到人工智能正在越来越多地为社会进步做出巨大贡献的同时,也应看到其所带来的诸如数据泄露、伦理道德危机、使用安全质量不达标等一系列潜在的风险。美国智库“新美国安全中心”在2018年度发布的《人工智能:每个决策者需要知道什么》报告,提示人工智能的一些潜在弱点,例如弱可解释性,人工智能算法目前仍是黑箱;存在安全问题和漏洞,机器会重结果而轻过程,通过找到系统漏洞,实现字面意义上的目标,但其采用的方法不一定是设计者的初衷。因此,人工智能技术的应用发展也具有两面性,需要通过法律、制度、技术等手段对人工智能的研发、使用进行全流程把控。