AI识物，到底是门怎样的生意？

2024-07-31 05:34:57

AI能说和听，这事儿大伙都知道。比如足够普及的智能音箱和手机里的语音助手、语音输入法。

而在感知智能这个大方向里，AI当然不只能说，同时还能看——比如说在张学友演唱会上抓个逃犯啥的。但AI的“看”不仅是识别人脸，同时也可以认识和判断物体。比如谷歌的猜画小程序就是依靠AI识物来实现的。

但这个领域，似乎还没有找到太多商业化的办法。人脸识别可以进行大规模安防应用，但AI识物在今天的更多应用展示，还是停留在游戏与炫技的层面。

有没有办法让AI识物的能力从“闹着玩”，变成“能赚钱”？

国内外各种AI势力正在努力破解这个问题。理想总归是美好的，而现实是缓慢掺杂着残酷。

AI之眼，似乎还没有带给商业世界足够的魅惑。

Google lens：

下一个时代还是又一块鸡肋？

普通人能够应用的AI识物能力，最主要还是集成在手机摄像头当中。当用户把摄像头对准想要识别的各种东西，AI系统就会通过图像识别以及OCR技术，给出相应的结果。

听起来还是蛮带感的。

而这个领域目前探索幅度最大的，还是AI巨头谷歌。在2017年I/O大会上，谷歌发布了集成在Google Photos里的Google lens功能。通过这个功能，手机用户可以将摄像头对准各种各样的东西，然后让AI开口说话，告诉你ta看见了什么。

确切来说，lens的很多功能还是相当具有实用性的。比如当旅行者面对一个不知名的文物古迹，可以用Google lens 来获知相关的历史以及文化知识；对准一瓶葡萄酒，AI可以告诉你这瓶酒的各种信息，比如年份、品饮方式、价格等等；在异国他乡拍摄交通指示牌，AI会借助谷歌翻译的力量把这些信息翻译出来。

谷歌没有公布lens到底能识别多少东西，但就目前情况来看，其可识别种类已经相当多。在今年的I/O大会上，该功能还被进一步升级，可以用来拍照识别文字信息、推荐穿搭风格，甚至还能识别海报给出艺人资料与作品。

从一年的发展来看，谷歌对于lens的期待很大，不仅升级了它的产品地位，还不断激发新功能，并建立与谷歌其他AI应用的联系。

但看似无所不能，什么都能识别的lens也有软肋：lens的真实工作流程，是将识别物体与数据库进行匹配。换言之数据库的大小直接影响着lens的使用体验。而其技术本身的创造力则乏善可陈。比如吴恩达去年就无情嘲笑过，lens的识花功能其实早就是百度玩剩下的。

目前来看，lens在真实生活中还是“偶尔惊艳，日常痴呆”。当然对于中国消费者的不便就更多了，比如lens目前并不支持中文。

但是AI识物这条路却是兵家必争之地，微软就不断宣称bing搜索中的拍照搜索一点也不必lens差。

可无论是谷歌还是微软，都无法解决AI识图搜索的根本问题：用户打开率低，商业化程度较差。

垂直行不行？

国内的玩AI识物的几个场景

相比于谷歌非常强势地推出了“用我可以识别一切”的AI识物功能。国内AI企业，无论是BAT还是创业公司，似乎都还处在这一技术应用初级开垦阶段，同时也更聚焦于快速商业化的可能。集中表现就是，国内AI识物的应用大多集中在几个场景中：

1、识图购物。这个功能已经屡见不鲜，无论是淘宝天猫还是京东，都已经投放了识图购物的功能。让用户可以通过拍照进行商品匹配，较高效率获知现实中商品在自家平台上的价格。就技术解决方案来说，由于拍摄商品往往是特征较明显、信息比较明确的AI识别品类，比如衣服、箱包等等，所以这类识图技术难度不高，加上完整的商品数据库，并不需要很强的技术探索能力。但缺点也很明显，那就是用户打开的针对性太强，

2、识花。各种各样的识花软件和产品功能，早已经洗礼了中国用户的AI常识。目前花卉植物的AI识别能力已经被做得相当精准。问题可能集中在大部分这类应用还是需要调用云端数据库进行匹配，识别速率并不高。而跟识图购物同样的问题，在于应用场景太狭窄。毕竟大家都没空天天春游……

3、识字。相比于识别花卉，文字识别其实对于OCR纠错、模糊识别等领域的技术挑战更大。尤其是识别手写体以及古文字。而国内很多AI创业公司已经开始聚焦于拍照识别文字的细分应用领域。比如我们已经能看到AI识别和录入名片、用AI拍照并实现外文翻译；以及旅行中用AI来识别碑刻、匾额、金石文字等等，为旅游增添乐趣。

4、批作业。从文字识别引申出国内另一个AI识物的主要流派，是用AI来识题和批改作业。这一领域要求足够的数据支撑和手写体识别能力，目前只能说还处在早期应用阶段。但对于数学等科目来说，AI批改作业和判试卷已经基本能够实现。而且批作业的AI还引申出另一个应用——用AI来答题的考试作弊神器。

这四大领域当然各有市场可能性，但同样的问题在于用户可能不会花费大量时间沉浸在某个细分识别领域。毕竟拿起手机来拍摄物体，很难变成一个随时发生的使用习惯。

要全能还是要专精，AI识物到底应该是一门怎样的生意呢？

想象力与困难并存的AI视觉应用

从谷歌的产品逻辑中，我们能够发现其对于AI识物的野心，是希望用户能够面对生活中各种东西：无论是猫狗、花草、海报信息还是街道建筑，都拿出手机拍一下，让AI告诉你这背后的答案。

这个让AI告诉我们一切的方案，出发点当然是好的。但问题在于这违背了大部分用户的搜索引擎习惯，而且我们生活中遇到的绝大多数问题，都不是货真价实摆在眼前的物体，而是某个知识、信息或者答案。这些东西都是无法用拍照来搜索的，甚至信息的搜索强度远远大于对眼前真实物体的不知所措。

另一方面，AI识物的准确度还有待提高，一两次发现AI识别错误或者恶意卖萌之后，用户自然就很难再形成尝试冲动。

所以万能的AI识别一切，似乎并不是这门生意的真正面目。

然而场景化的使用，问题在于出现频次不高，很难培养用户的使用习惯，当然也就很难沉淀到商业化的层级当中。目前来看，这个问题的解决方案很可能在于将AI识物的技术与某些相对高频发生的移动互联网需求相联系，在营销的帮助下形成场景化习惯。

最有可能的当然是旅游。我们能够发现，无论是识别花草，识别碑额，还是识别名胜古迹、翻译交通指示牌和菜单，这些都是旅行中的某个因素。而识花用识花的APP，翻译用翻译机，识别古迹再调出专门的小程序，这种体验恐怕大部分人会觉得很烦。

因此来看，在旅行场景的统一规划下，整合各种AI识物应用，形成一站式旅行AI，似乎在今天比较有机会。而BAT和旅行APP由于坐拥技术和数据优势，似乎更有可能成为这个领域AI应用的整合者。当然，能借助机器视觉能力诞生新的AI巨头，是我们更加希望看到的。

与旅行类似，AI识物的另一个机会在于儿童市场和教育市场。儿童需要用AI来识别和感知的东西更多，而让AI来给好奇宝宝提供关于生活中各种事物的解答，似乎也比较能够被年轻父母所接受。而更重要的识别类应用在于教育，无论是老师批作业，家长辅导孩子，甚至于学生寻找答案，毫无疑问都是很痛苦的过程。能够用AI来整合和激活这个市场，那么前景应该是相对客观的。

就像AI语音的理想状态，是通过对话来控制生活中的一切，包括智能家居硬件、内容、手机与购物。AI识物的理想商业状态，也是能够形成超级平台，让我们在面对生活中所有不解和好奇时，都拿出手机来拍一下，让AI告诉我们答案。

但世界搜索的需求限制，以及技术目前本身的瓶颈，确实在降低这种超级平台的诞生可能性。但在垂直场景中，毫无疑问AI识图是能够提升人机交互效率，并且非常酷炫有型的搜索方式，商业市场也依旧是足够充沛的。

但目前也有若干问题在限制这一技术的应用度。比如上文说过的模糊识别精度不高问题，经常会造成用户的需求与AI答案之间南辕北辙；再比如中文知识图谱体系不够完整，很多领域我们目前还没有足够AI回答的中文数据；还有一个问题，是很多AI识物的场景，其实是对摄像头的反应能力有要求的，这就放弃了很多低端机入门机搭载AI识别应用的可能性。

让AI帮我们看世界，已经足够近，却还比较远。远近之间的故事，可能才是需要无数科技公司想破了脑袋去参悟的。

安卓 8.0、AI、VR，谷歌这场大会将未来科技都提前曝光了！

◆ ◆ ◆ ◆ ◆ Android O 公测版本正式公开下载每年谷歌 I/O 大会最吸引用户目光的便是新一代安卓系统的公开,在今年大会上谷歌正式推出的 Android O 的公测版本,这 ...
谷歌 I/O 大会开幕！安卓 P 系统亮相：强调 AI，手势操作出现

北京时间 5 月 9 日凌晨,为期三日的谷歌 I/O 开发者大会正式召开.作为一年一度的重要发布活动,谷歌 I/O 看点十足.除了新一代 Android P 会在发布会上正式亮相外,谷歌还会浓墨重彩地 ...
Google Assistant更新：登陆iPhone、加入文字和Google Lens输入等

在今天凌晨开幕的Google I/O 2017大会上,Google宣布其AI语音助手Google Assistant将推出iPhone版,并对其加入了文字输入.Google Lens图像输入,支持到更 ...
除了Windows，你可知微软出品了不少“神器”

提到微软,大家脑海中最先浮现的肯定就是 Windows 了.作为一家已经成立了 46 年之久的顶级科技公司,微软其实每天也在做着很多软件公司都在做的事 -- 开发软件.那么除了 Windows 以外, ...
I/O拾珠：Android Go、Google Lens、Actions on Google

在微软为特定市场带来一款轻量级的Windows 10S之后,Google同样在昨晚带来一款轻量级的系统:针对弱鸡设备的Android O:Android Go.其中的"Go"或许指 ...
百度饮得知识图谱的头啖汤！会让大家跟着吃鸡吗？

2017年,知识经济日益火爆,分答.知乎.得到等知识平台可谓如日中天.眼下这种火爆已在从人类延展到机器.互联网巨头纷纷对知识变得饥渴起来,知识成为数据之后的又一个香饽饽. 互联网巨头对知识越来越青睐 ...
微信识物功能在哪里

微信识物功能在哪里,对于很多网友来说,有很多网上的东西都是没有见过的,但是又出于好奇想要知道东西是什么东西,所以就有很多网友想知道微信识物功能在哪里,那么下面就让小编给大家介绍一下. 1.首先用户需要 ...
解锁华为图库新技能，图片集锦、AI识图…有趣又安全

今天我们给华为手机用户介绍一款系统自带的应用--华为图库,用它不仅可以轻松管理和编辑照片,还能更好保护照片的隐私和信息安全,让你的图片管理更加得心应手! 1.图片集锦好帮手,'时刻'来呈现出行旅游. ...
“小动物”抢滩的AI启蒙赛道到底有多火？

在中国古代,儿童启蒙读物被称为"蒙学",最著名的当属"三百千",也就是<三字经><百家姓><千字文>.元朝刘壎<隐居通 ...
再次拿到数亿融资，梅卡曼德的3D视觉+AI+机器人解决方案到底价值几何？

梅卡曼德日前宣布完成美团领投的数亿元C轮融资,老股东红杉资本中国和源码资本跟投,泰合资本担任独家财务顾问.梅卡曼德表示,本轮融资将进一步提升公司的产品和服务能力,更好地助力机器人解决方案提供商/集成商 ...
#好物推荐不锈钢门搭扣

#好物推荐不锈钢门搭扣
手机一定要装这些APP！拍照就能识物，好用到哭！

助友们好,我是助攻姐的朋友胡萝卜. 自从上次给大家推荐了一波辨认植物的小工具,就有助友问胡萝卜: 有没有识别昆虫.鸟类这些动物的小工具呀? 有!有!有! 识虫的,观鸟的,看鱼的,还有什么都能识别的小工 ...
识物与识人

(2010-06-09 23:05:20) 关于文物鉴定,马未都有一段精彩的论述:文物鉴定中容易出现两种错误.一种错误是把真物看假,另一种是把假物看真.把假物看真不怎么丢人,做伪者手法天天翻新,技术 ...
AI与云这门To B生意，是时候“娘化”一下了

娘化,原本指的是ACGN(动画.漫画.游戏.小说)界对各种角色甚至是非生命体的女性化塑造.有趣的是,最早的"娘化"就是因AI而出现的.1995年,一位日本中学生制作了一款具有假想人 ...
【AI应用】微软AI识图让相机使用更有“范儿”

目前常见的小程序有微信小程序.支付宝小程序.QQ小程序等,随着小程序技术越来越成熟,我们对技术使用必将迈入小程序时代. --技术思维说在日常生活中,看到满篇的英文单词不认识怎 ...

AI识物，到底是门怎样的生意？

相关推荐