百度输入法每天语音被调度3.35亿次!又一个AI赋能的样板

8月1日,百度发布了2018年二季度财报。财报显示,百度二季度营收260亿元人民币,同比增长32%,净利润64亿人民币,同比增长45%,移动端收入占比77%,高于去年同期的72%。当然,作为公司核心战略,AI依然是百度财报最高频出现的元素。不论是成为收入增长新驱动的信息流业务,还是给百度编织未来的DuerOS和Apollo,均与AI直接相关。

除此之外,在财报中被重点提及的应用还有两个,一个是百度旗舰应用百度App,6月日活达到1.48亿,同比增长17%,日均用户使用时长同比增加30%,信息流取得成功;另一个则是输入法,李彦宏在发布财报时透露,依托“百度大脑”的进化,百度输入法语音输入请求量短短一年时间内成长到日均3.35亿次。

为何输入法被突出?

看到输入法日均语音请求3.35亿次这个数据,我还是感觉到有些意外的。第一个是输入法只是百度众多应用的一款,不是百度App这样的旗舰应用,会在发布财报时被李彦宏重点提及,让人意外。第二个是百度输入法的数据确实很可观,前一天发布财报的搜狗旗下的搜狗输入法,日均语音输入请求量才3亿次,而搜狗输入法是中国输入法的老大,其日活跃用户数达到3.8亿,百度输入法语音请求次数竟然超过了搜狗输入法,这也让人意外。

相对于搜索引擎、信息流等超级市场而言,输入法市场对于百度来说,曾经不是那么重要,更多是防御性业务。输入法是用户与机器之间人机交互的一个重要桥梁,负责信息的录入,此前搜狗输入法拥有绝对优势,并且从输入法切入到浏览器再进入到搜索市场。百度反其道而行之,在搜索市场拥有绝对优势后,推出了浏览器和输入法等工具,避免被人掐住脖子。

百度出发点可能是防御,但这并不阻碍百度将输入法做好。熟悉输入法发展历史的都知道,搜狗输入法可以在微软等巨头均有输入法时脱颖而出,正是因为与搜索大数据结合,进而给用户更加精准的候选词条和句子,大幅提升了搜索效率,搜索成了输入法的幕后功臣。因此,作为最大中文搜索引擎的百度,做起输入法自然是得心应手,事实上,百度输入法推出以后就成为主流输入法应用。

到了AI时代,输入法对于百度的重要性正日益凸显。从财报可以看到,百度对输入法的重视正在升级。百度越来越重视输入法应用,在我看来原因有几个:

第一,输入法特别是语音输入法,是AI的典型应用,百度AI技术特别是语音技术和自然语言处理技术,通过输入法实现了规模化的应用;

第二,语音输入法可以帮助百度获取更多语料数据,进而可以反哺算法实现语音技术甚至百度大脑的进化;

第三,长期来看,语音输入法给语音助理等应用提供了基础,用户如果习惯用语音输入文字,就会习惯用语音来与机器交互,发号施令,而语音助理也是百度布局的重点,最核心的业务是DuerOS,百度二季度财报显示,DuerOS 6月的语音唤醒次数达到了4亿。

百度输入法语音输入崛起之道

从文字输入到语音输入甚至图片输入,输入法的技术门槛正变得越来越高,AI技术已成为其核心驱动,正是因为这样的变化,给了百度输入法崛起又一个机会。与此同时,智能语音输入技术的成熟,用户越来越习惯语音交互,也让语音输入法逐步兴起,当然,语音输入的兴起,与智能语音助理、智能音箱等等应用的兴起也有间接关系。

7月,赛诺(SINO-MR)对外发布的《2018上半年中国手机输入法分析报告》显示,在手机输入上,语音输入正在越来越重要,拼音和手写输入法则有下滑趋势,“得益于1分钟输入400字,提升用户对语音输入效率的感知,语音输入占比从去年下半年的38%提升至今年上半年的41%,使用占比稳步提升。”人工智能的应用,将大幅提升输入法的语音输入效率。

语音输入兴起,同时十分依赖AI技术。百度抓住这样的趋势,基于领先的AI技术在语音输入上进行布局,如今实现了厚积薄发。

百度在AI上的战略布局,在深度学习上的技术积累,已无须赘述。回到输入法上,这款应用本身也是百度AI驱动的一个典型产品,李彦宏在谈到语音输入法的成绩时,也提到这是基于百度大脑的进化而实现。

具体来说,百度输入法搭载了百度第二代深度尖峰技术(Deep Peak 2),极大提升了用户的语音输入体验。Deep Peak 2模型,即基于LSTM和CTC的上下文无关音素组合建模。与传统语音技术的建模方式相比,它能够充分发挥神经网络模型的参数优势,大幅提升百度输入法对中英文、多种口音、多种风格(如朗读、聊天、轻声)混合输入的识别准确率,目前,百度输入法语音输入相对正确率较行业领先水平提升20%,能够更精准地识别用户的自然对话。

除了准确外,百度输入法还将用户输入场景做细,针对性进行优化,进而提高输入效率和用户体验,比如它推出了语音速记、轻声识别和极简语音等多种功能,其中轻声识别是满足用户在公共场合的输入,尽量减少对他人的干扰的同时,实现准确的输入。

AI技术的积累,特别是语义技术的积累,确保百度输入法在面对不同语言、方言、口音和风格的语音输入时,均可十分准确;产品细节的优化,特别是针对不同场景的功能优化,让百度输入法效率更高、体验更好,有第三方报告显示,准确率和效率,是影响用户选择一款输入法的关键点,这样看来,百度输入法语音输入快速爆发式增长就不让人意外。

输入法是百度AI赋能的新样本

在上个月举行的开发者大会上,百度旗下AI基础技术开放的核心平台“百度大脑”升级到了3.0,拥有多模态语义理解能力,可供开放的AI能力超过了110种,此外还提供了EasyDL,AutoDL和AI Studio等系列开发工具包,推动深度学习框架PaddlePaddle的应用,百度甚至还发布了自主研发的“昆仑”系列AI芯片。种种举措都表明,百度正在构建AI全栈技术的基础设施,且毫无保留地将其开放出来。

将AI技术开放出来给更多行业,更多应用,更多场景,获取更多用户数据和使用反馈,进而反哺算法进化形成正循环,就可以让百度AI立于不败之地,这个思路一直贯穿在百度的AI基础技术,以及垂直应用如DuerOS和Apollo平台中,百度将这个理念提炼为要让“Everyone CanAI”。

当然,百度在将AI开放给外界的同时,自然首先会让自有业务“吃上”AI,不论是搜索,地图,金融,娱乐、商业还是旗下App,几乎都已受益于AI,百度输入法靠语音输入功能弯道超车,也是一个AI赋能传统应用的案例。输入法的历史跟互联网一样远,百度输入法1.0早在2010年就已推出,如今依托百度大脑背后的AI技术,正在焕发出新的活力,甚至有机会成为语音输入法的NO.1。

而且向后看,百度语音输入法也可以进一步将用户导入到类似于智能助理、智能翻译、智能教育等等语音驱动的应用,毕竟,用户习惯通过语音跟手机对话后,就有更多应用诞生的可能。

在我看来百度输入法的成功也是可以复制的。通过AI基础能力来赋能传统经典应用,让其具备更好的体验,这一套模式,已经、正在和还将被复制到更多应用场景中,比如搜索引擎、浏览器、电商购物、视频等等App都在受益于AI技术的进化,它们都需要百度大脑这样的AI基础技术平台的支持。当更多应用认识到这样的趋势后,就可能会成为百度大脑的开发者,调用百度的语音以及AI服务,进而复制百度输入法的成功,我想这才是李彦宏在发布财报时强调输入法的深层涵义。

热点事件追踪:

淘宝造富计划掌门1对1美团无人车算法看门狗金融科技井喷中国版米其林社交之王Uber撞人新世相新氧融资金蝶第二春刘强东的平台经济学互联网上市潮教育科技耐克拿下跳一跳盒马外卖阿里收购饿了么相机争夺战头条瞄准爱奇艺陌陌收购探探

(0)

相关推荐