【友盟+】CDO 李丹枫:机器模仿人的能力越来越强,但应用的发力点还集中在辅助决策功能上

数据猿导读

过去将人工智能分为两类:第一类是模仿人做事,第二类是做人做不了的事情。尽管现在技术的发展已经使第一类的商业化成为可能,但从投资的角度,还是更看好第二类。在【友盟+】CDO 李丹枫看来,人工智能在现阶段还是主要起一个辅助的作用,机器负责提供建议,人来做最终的决策。

作者 | 李丹枫

本文长度为3000字,建议阅读6分钟

本文为数据猿年关策划活动《大数据的2016,我的2016》系列稿件,感谢本文作者 【友盟+】CDO 李丹枫 先生的投稿。

敬请期待春节后的2月16日,由数据猿与中欧商学院、腾讯视频共同举办的高端领袖线下演讲栏目中欧微论坛之《超声波》

要说2016年人工智能的里程碑式的标志性事件,那就非AlphaGo与李世时的人机围棋大战莫属了。看到AlphaGo连胜3局的时候,我还是挺有感触的,一是敬佩DeepMind的科学家们,能够让人工智能达到一个新的高度;二是佩服Google的眼力,感觉是一个现实版的伯乐和千里马。

人工智能可以分为两类,但界限开始逐渐模糊

我记得当时刚刚从学校毕业参加工作后,结合学校和工作上的经验,我将人工智能分成了两类:

一类是试图去模仿人可以做的事情,如语音和图像识别,下棋也包括在其中。这一类的人工智能是最具挑战的,因为衡量的标准是和人的能力做比较,系统要达到相当高的准确率才可以考虑在实际的场景中应用;

另外一类是去帮助我们做人做不了的事情,如搜索,反欺诈。由于需要在短时间内处理海量的数据,这个人是无法完成的。这个场景是最适合产品化的。

人工智能发展到今天,这两个类型的界限已经开始模糊了。

2016年是我回国两年来觉得最有收获的一年。在年初【友盟+】(由原来的三家公司,友盟,CNZZ和缔元信合并而成)成立之后我先担任首席数据科学家,之后担任CDO。这使得我可以从一些日常的事务中脱离出来,专注在数据创新上面。

另外,三家公司的数据合在一起,使我们真正做到了所谓的“全域大数据”。我们的数据覆盖120万APP,600万网站,每天触达的活跃独立设备达14亿。

【友盟+】用这些数据都干了什么?

现在数据有了,问题也来了。有这么多的用户互联网和移动互联网的行为数据,我们可以用来做什么呢?一个比较容易想的场景是做精准广告投放。但这个对于我们来说太简单直接了,我们需要一些更加创新的数据应用场景。我们提出了两个场景:

一、基于用户互联网和移动互联网行为的风控。在中国普惠金融市场风起云涌的环境下,风险控制越来越成为企业成败的关键,而风控最重要的是数据。

据中国网数据,截至2016年3月底,央行征信共收录8.85亿自然人数据,而有信贷记录的只有3.7亿人。也就是说有5亿多人没有信贷记录。而这些人,恰恰就是普惠金融所面对的主要客户。所谓巧妇难为无米之炊,没有数据,谈何建模和风控。

【友盟+】的数据,对这样的人群(实际上是他们所使用的手机)有很好的覆盖。现在大多数P2P贷款是通过手机来操作的,这就使得我们可以将移动互联网的行为和贷款申请人联系到一起。那么用户行为数据可以用来做有效的风控吗?这个是我们需要回答的主要问题。

好在我们这个想法得到了融360平台的大力支持,他们为我们提供了第一批Y值,就是贷款是否逾期的信息。我们首先做了一些简单的统计,发现了一些有趣的现象,例如,如果一个手机的信息在【友盟+】的数据里找不到匹配,这个账号的逾期风险率要比找得到的账号高28%!

二、在手机品牌,地域等维度也发现了比较明显的区分。我们进而做了一个简单的逻辑回归模型,发现结果是高于我们的期望的。现在,这个产品已经在融360平台上线,我们欢迎有兴趣的企业和机构来使用。

我要强调的一点是这个产品是完全建立在用户移动互联网行为上的,我们的理念是“物以类聚,人以群分”,同一类的人会在多个维度上都有相似性。我们的目的是用这个结果辅助贷款机构做决定,最理想的场景是把我们的结果整合到贷款机构自己的模型中,再做最终的贷款决定,而不是单纯的用我们的结果。

除了在辅助征信方面,我们也发现【友盟+】的数据在反欺诈,反黄和反赌方面可以发挥很大的作用。现在,我们和蚂蚁金服在多个层面都有深度合作。【友盟+】数据在风险控制方面的应用可以说是我们数据创新发掘的第一个价值点。

三、帮助游戏APP发掘潜在的付费用户。很多依靠游戏内用户付费的游戏,真正的付费用户占比非常少,大多在5%以下,有许多只有1-2%。如果我们可以帮助游戏运营者发掘在尚未付费的用户中,有多少有可能转换成付费用户,这样,他们可以把主要的促销精力集中在这些用户上,就可以达到事半功倍的效果。

由于【友盟+】的移动互联网用户覆盖率非常高,对于一个游戏的新用户,在我们这里很可能已经是一个老用户了,另外我们可以用到这个用户在其它APP上的行为做判断。这样我们可以帮助游戏APP在它的用户的生命周期很早的时候就做出最终付费可能性的判断。这个判断的本质就是给用户做排名,越排在前面的,付费转换的可能性越大。

在实际运营中,可以对排在不同位置的用户做区别对待,前面的促销力度大一些,后面的小一些,或者根本不去考虑。这样就可以做到“把好钢用在刀刃上”。想法挺好的,数据也有,我们模型也做出来了,但放到市场上一试,发现了一个大问题,市场的需求好像不强。

主要的原因是中国的大部分游戏还在粗犷运营的阶段,而且【友盟+】所能触达的客户,往往是中小的游戏开发者,他们基本上都把游戏交给发行和运营公司去做游戏运营,而后者由于手中有许多游戏,主要以渠道运营,做不到每个游戏的精细化运营。

2017年,要避免被“AI”、“大数据”忽悠

谈到我看好的2017年的机会,我觉得比较重要的一点是避免被“AI”,“大数据”这些概念忽悠,还是要通过表面看到本质。很多的Business Plan都喜欢给自己戴上这样的帽子,但实际上的”AI”只是简单的统计报表,”大数据“只是简单的爬虫。

我在前面提过我过去将人工智能分为两类:第一类是模仿人做事,第二类是做人做不了的事情。尽管我认为现在技术的发展已经使第一类的商业化成为可能,如语音,图像识别。但从投资的角度,我还是更看好第二类。人工智能在现阶段还是主要起一个辅助的作用,一个比较有效的利用人工智能的方式是所谓的“man+machine”,机器负责提供建议,人来做最终的决策。

例如,我的一个朋友的公司,他们做的事情是帮助医生处理医学影像,他们主要是在医生认为没有病灶的片子中,找到那些可能被漏掉的,找出来再给医生去做最后的判断。做的是一个“捡漏”的辅助工作,可以帮助减少误判断。还有一点,就是要对市场有一个比较正确的判断。

我不太明白的是中国的征信市场,现在已经有8家机构在等个人征信的执照,还有许多人想进入,但市场有那么大吗?那美国为例,美国市场上的个人征信机构基本上只有一个——FICO(也是我在美国的第一份工作),FIOC现在的市值是接近38亿美元,市盈率36%,也就是说利润在1亿美元左右。

征信只是它3大业务之一,另外两个是规则引擎和反欺诈。就算是征信是所有的利润所在,1亿美元这个饼也太小了。中国有这么多家对这个市场虎视眈眈,我觉得到头来会发现原来这块肉是根本吃不饱的。贷款的市场是很大的,但征信的市场却不然。所以还是要对市场的大小有一个理性的判断。

那么在2017年最想做的事情是能够真正证明【友盟+】的数据价值,就是用收入来证明。例如:风控,我认为是有机会的。另外在利用数据在市场营销方面,也会做很多的尝试,毕竟广告是支持起互联网的主要支柱。在证明数据价值的同时,我们还需要把我们多年在数据采集,整理,分析已经预测的能力输出,为我们现在的和潜在的客户提供更好的服务。特别是对于一些有互联网业务的传统企业,【友盟+】可以帮助他们做好互联网化的进程。让他们真正体验到互联网给他们 提供的价值。

关于作者

李丹枫,【友盟+】CDO在美国数据分析和挖掘领域工作10多年,曾任职于包括雅虎、微软、FICO等在数据应用走在前沿的公司,积累了丰富的数据挖掘和机器学习的实战经验,所参与的产品在金融,保险,搜索,互联网广告及零售业中有广泛的应用。

 活 动 预 告 

(点击图片查看详情)

注:本文由 李丹枫 投稿数据猿发布。

(0)

相关推荐