再谈人工智能:奇迹短期难再现,应用范围窄,潜力已近天花板
公众号后台回复:管理1906,免费下载本月推荐精品管理类图书
公众号后台回复:人文历史1906,免费下载本月推荐精品人文历史类图书
加入“ICT销售和大客户联盟”(微信ID:ICT-League),寻找志同道合的小伙伴!
您的关注就是我们最大的动力,这里有大量企业家高净值粉丝,每天分享最新商业资讯、趋势、深度好文、把握财经动态。喜欢学习和阅读的朋友请关注我,文章每天都会更新,欢迎转发阅读!
01
IPO绿色通道
今年,“证监会为四大行业IPO开特殊通道”,其中就包括人工智能。
2019年3月20日,科沃斯首发申请获得证监会发审委通过,这家以扫地机器人知名的公司有望成为A股市场的“家用机器人第一股”。
2019年3月8日,富士康成功闯关、闪电过会,从递交招股书到最终过会,36天的IPO审核堪称“史上最快”。
申万宏源在其发布的相关研报中指出,富士康此次的“即报即审”也从侧面反映了加快新经济布局迫在眉睫,有助于改善产业结构,也充分体现了证券市场超常规、大力度地支持“四新”行动正逐步落实。最终目的是通过资本市场强力助推“中国式创新”。
i黑马联合黑智,评选出了“2018年中国人工智能(准)独角兽”榜单,榜单包括20家中国人工智能独角兽公司,以及30家中国人工智能准独角兽公司。
“独角兽公司”最早用来指那些在私募和公开市场的估值超过10亿美元的创业公司,此后,“独角兽”成为流行于国内外的赋予创业公司的赞誉。
“2018年中国人工智能(准)独角兽”的榜单如下:
i黑马的报告称:我们评选出的50家公司,只是对当前人工智能技术应用现状的一个极小的缩影。但这些入选者,已在不同领域中,对商业未来的模式和我们的经济生活带来了全新的改变。在未来,我们还将见证它们的成长,以及看到更多的革命性的技术和研究涌现、更多的行业应用的爆发。
但我经过仔细的分析这50家公司后发现:20个独角兽30个准独角兽企业,近80%都跟图像识别或者语音识别有关系。
02
如果没有人类标签,人工智能就一无是处!
图像识别、语音识别,这是目前人工智能真正取得成绩和突破的两个领域!
其他的应用其实不是天天在媒体上看到的宣传的那么回事。
就是这两个领域的现状是什么呢?我在前些日子刚发了另一片文章人工智能之旅,真的特别费人工!一文中有阐述,大家有兴趣可以去销盟公众号(ICT-League)的历史文章中查看。
这里可以补充一点信息就是:谷歌、微软、Salesforce和雅虎等公司的人工智能够牛吧?但是在这个牛逼的背后是大量依赖非洲的廉价劳动力,这些廉价劳动力干什么呢?就一件事:“给数据贴标签”!业界有一个很好听的名字叫做:“标注”。
给数据贴标签的工作没有什么技术含量,他们就是数字世界里的“建筑工人”。比如说语音识别中,一个“我”字,可能需要的标签就会包括:“咱”、“俺”、“吾”、“余”、“老子”、“爷”等等,他们可能都代表着一个意思:就是“我”,这类的字在特定的位置(主语、宾语位置等)就可能是同一个意思。这在语音识别中就是“标注”和“扩词”等。这些工作跟算法、优化、神经网络、卷积、深度学习等等都没有关系,非常的耗人力,不需要什么高深的理论和知识,它就是“建筑工人”。很有讽刺意味的是,这些非洲廉价的数据贴标者,经过大量的重复性的准备工作后,给出的信息恰恰是硅谷人工智能工作的重要组成部分!
可以这么说,如果没有人类标签,人工智能就一无是处!至少在目前,这不是夸大!
有没有有点像郎咸平教授说“6+1”理论?
郎咸平认为工业2.0、3.0的时代,是属于6+1的产业链,是产品设计、原料采购、仓储运输、订单处理、批发跟零售这六大块,加上制造,就是6+1。其认为欧美企业掌握了前面六块,具有了最有利润的部分,而中国制造仅仅掌握了制造,这样中国制造将难以持续发展。
然而回顾中国经济发展的过程可以看到中国制造成功推动了中国的发展,而欧美失去了制造业优势后逐渐衰落。
但是,数字世界真的不会在向实体制造业一样,因为制造儿给我们留下一个制造业的体系!这里的“数据标注”就是数字世界中的“1”,很遗憾,这个“1”是真的难以持续发展的。
令人遗憾的是,我看到了很多的标榜为大数据的公司,其实他们的活就是大量的在这个“标注”阶段!
尽管数据贴标签者能十分辛勤的劳作,但对于很多场景却是标注根本无法解决的。
比如:在一个具体的项目中就遇到了语音标注的问题。问题很简单,就是“4”,“10”,“14”,“44”,“是10”,“是4”,“一期”、“二期”等,由于说话者的发音、咬字、连读等问题,通过ASR、切词、标注等都无法准确解决。倒霉的是,这些词恰恰是项目中出现频率很高的关键字!
之前一直以为AI公司能通过优化、NLP、深度学习等技术能很好的解决,或者解决大部分的问题,这也是他们标榜的自己的深度学习有多牛、自己的算法工程师有多资深等等给出的印象。但事实的结果是:AI公司双手一摊,说这个他们没有解决方案,也无法优化!直到这个时候,才发现其实他们的人工智能的集体智慧就是廉价的“数据贴标签”,那个NLP、深度学习等的黑盒子,其实是无法打开的,因为打开了也是近乎于空!
这让我想起了《悟空传》里的一段对话:
大圣此去欲何?
踏南天碎凌霄。
若一去不回?
便一去不回!
从泡沫到产业落地,如果说去年各公司还在炒概念抢融资,那么今年,深入行业,拿出站得住脚的产品,就成为各公司追逐目标。
希望我们的AI公司真正的在其他的6个环节上做好工作,而不是在“1”这种无聊、重复、永无止境的工作。有意思的是我们一直把这种劳动定价为货品,而且是一种耐用货品,但它却是AI公司价值主张的集体智慧的集中表现。这种表现在媒体的推动下得到了极大的扩张!
不改变这种只在玩儿“数据贴标签的智慧”的现状,那么好多AI公司便真的会是“便一去不回”!他们的NLP、深度学习的黑盒=空盒!
当人工智能项目按预期那样工作时,人们会赞不绝口,但亮丽的外表下必须有一个庞大的低工资劳动力的基础支撑。他们要上传图像、识别图里的人、动物、建筑物、汽车、其他标志、识别声音里的词汇,作出标签、扩大词库等等。在对数百数千万以上图像和数百数千小时的语音执行了这种操作后,人工智能系统才可以开始在现实世界中相对准确的识别这些对象。
所以,人类不会很快从人工智能圈子里数据标记和质量控制这一块消失。
03
奇迹没有发生,也不会继续大量发生
AI教父李开复在哥大毕业典礼的演讲:
“未来10年,所有金融企业都将发生天翻地覆的变化,因为人工智能将取代交易员、银行职员、会计师、分析员和保险经纪人。去年,我尝试采用智能投资算法获得了比我的私人理财顾问高八倍的收益——这提醒我,回家后就可以把这位私人理财顾问给辞退了。
未来10年,人工智能将替代大多数工厂工人、助理、顾问和中介。但人工智能也不局限于简单工作。人工智能还会替代部分新闻记者、医生和教师。你的人工智能助理将比你更了解你今晚想吃什么,你该去哪里度假,你想跟谁约会。
10年后,机械化的人工智能将会变得稳定可靠,人工智能运用在自动驾驶将比人类驾驶更加安全,今天还比较初级的家用Roomba扫地机器人未来会让我们刮目相看:机器人将学会做饭、洗衣服、做保洁,帮助人类分担所有繁重的家务劳动。
10年后,我们将进入一个富足的丰产时代,因为人工智能可以为人类创造巨大的价值,帮助我们消除贫穷和饥饿。我们每个人也将获得更多时间和自由,来做我们爱做的事情。
10年后,我们也将进入一个焦虑的迷惘时代,因为人工智能将会取代一半的人类工作, 很多人将因为失业、得不到自我实现而陷入沮丧。到那时,你们当中很多人将成为家长,也必然会考虑该如何提升孩子们的教育,才能避免他们被人工智能取代。
面对未来,你们必须要选择热情拥抱人工智能。即便你所在领域的第一个人工智能工具看上去是那么脆弱不堪,相信我,只要有更多的数据,它们很快就能进步。”
人工智能的世界真的会是如此吗?
我们可能对于深度学习技术的判断过于乐观,人工智能迫切需要找到一个新的阶段,而这注定将会是一个漫长的过程,有赖于与数学、脑科学等结合实现底层理论的突破。
Alphago成名已经过去三年了,它使得人工智成为最受关注的领域,深度学习由此深入人心!
但是,三年来,深度学习并未再给我们带来新的奇迹!目前的深度学习都是在做技术改良,没有理论的突破!这决定了其应用的空间被局限在特定的领域:大部分都集中在图像识别、语音识别、围棋三个方面。
这三个方面的突破恰恰证实了一个重要的人工智能技术应用的边界条件:规则简单,特定领域、数据充分、信息完全,信息确定。
超出了边界,其实,只要有任何一个或者多个条件不满足,人工智能就很难智能了。
规则简单:其实就是所谓的静态,包括按确定性的规律演化,就是可预测性问题。
特定领域:领域太宽也做不了,下棋的就会下棋,图像识别的就会图像识别,其他免谈。
数据充分:不仅仅是数量大,还要多样性,不能残缺等等。
信息完全:比如围棋就是完全信息博弈,虽然看上去很复杂,但本质上只要计算速度足够快,不要靠什么智能也能解决。
然而,在日常生活中,我们所有的决策都是在不完全信息下做的!
所以,从这一点上看,在复杂路况下的自动驾驶就不满足特定领域,也不满足信息确定性和信息完全。自动驾驶要想完美实现,需要更多的道路保障的投入,以保证满足以上的边界条件。否则,不管是5G,还是什么G,仅有传输速度和计算速度是不够的,他就是一种资本游戏!
没有更深入的基础科学的突破,人工智能的奇迹不会再更多的大量的发生。
不要跟随那些无厘头的蛊惑家们去做乐观的估计了,因为那只是科幻!
一度在媒体上出现的,所谓“中国市场大、数据多,运用又不受限制,所以将来奇迹一定会发生在中国”的言论,就是一种美好的蛊惑,或者就是一种资本游戏,直到,在基础科学的突破之后,这一切才有可能从科幻变为实际应用。
今后或许会在个别领域取得进展,但是不会很多人预计的那样全面开花!
04
深度学习
已经碰到应用的天花板了
概率统计理论的突破为多层神经网络和海量数据处理提供了有效的数学工具,但是,“黑盒”学习法却成为了深度学习的缺陷之一。即:结果的不可解释性。即使人工智能能给出正确的选择,我们却并不知道它根据什么给出这个答案,无法理解这个新的智能结果。
图灵奖得主朱迪亚·珀尔指出:尽管深度学习算法具有大脑的灵感,但它们其实就是另一种强大的数据分析工具,是“曲线的拟合”。
诺贝尔经济学奖得主托马斯·萨金特则认为人工智能其实就是统计学。
深度学习是其实就是在寻找重复出现的模式,重复多了就被认为是规律。它就会按照这个规律走。谁说多了就是谁!
那么问题来了。谎言重复多了也就会被认为是真理。
所以,目前的深度学习通常无法找到“有意义”的规律,只能找到重复出现的模式!换句话说就是光靠数据,是无法达到真正的智能!
人工智能的核心是知识表示、不确定性推理、人机交互等等,这些方面的突破才能给人工智能带来应用的突破。
遗憾的是,这可能是一个漫长的过程!
我的一个朋友从日本的早稻田大学的人工智能实验室回到了中国,他告诉我,他所在的实验室在探索机器与老鼠的结合,就是把老鼠的身子与机器的头连接,或者把老鼠的头与机器的身子连接,使得被切成两半的老鼠成为两个半生物半机器的东东。这样的研究不是对现行的人工智能技术的改良,是一个全新的突破性的尝试。期待着它能成功!
长远来看,我们最终是要发展人机协同。这意味着人工智能必须能与人类智能一样,能相互理解,不然没法协同。
如果没有新的理论突破,深度学习技术基本已经到达它的顶点。不确定性推理、知识表示等现在还在探索当中,这就是人工智能的现状。
人工智能领域的原创成果都是美国人做出来的,人工智能领域图灵奖得主共十一人,十个美国人,一个加拿大人。我们的跟踪能力很强,一旦有个苗头,我们就能迅速跟上。但是很可惜,我们缺乏顶尖人物!
深度学习这个领域,我们可以说达到世界平均水平了,但是最高水平和世界差距还是很大的。
值得欣慰的是,我们在应用上的发展比较美国还快,这得益于我们大量的数据和开放的数据应用等。
人工智能的深度学习这条路已经快走不动了,接下来怎么走?
新的技术路线应该要解决目前存在的不可理解性,脆弱性等缺陷,需要计算机科学、数学和脑科学的结合与突破。
05
总结
人工智能会出现低潮吗?
肯定会,但不会在向过去一样出现冷冻期,因为大数据、互联网和强大的计算资源,这些都会支撑人工智能继续走下去,尽管有的时候还只是表面上的繁荣。
至少在语音识别、图像识别这些领域有了很大的需求和市场。至少在符合5个边界条件的工作还是很多,他可以被替代。
说到替代人工,其实大家也不用太捉急,什么工作会被替代?
如果你的工作符合上面提到的人工智能的五个边界条件,绝对会被计算机替代!
这些工作的特点很明显---“照章办事”,不需要灵活性。比如出纳员、收银员等等。
富有灵活性和创造性的工作,人工智能绝对不可能完全代替!
鱼龙混在是目前国内人工智能领域的现状。甚至一大批非人工智能的企业也纷纷给自己重新打标签,希望获得IPO的绿色通道。另外,少PE,科技创业资金大,难以支撑科技导向成长慢,周转资金多、利润周期长现状,导致很多的人工智能企业不能或很少投入研发也是导致我们在应用研究多,而技术研究少,理论研究几乎空白的现状。
分享是一种美德,转载请注明来源和出处!