记录一亿病人数据、深受医生喜爱的语音识别公司Nuance

Nuance公司的语音识别技术在2011年推出,并在业界处于领先地位。该技术致力于为临床专业人士提供语音导航文件系统和应用程序以实现与患者进行全新交流的目标。该技术的运用极大地提高了医生诊断的工作效率,使得患者病情采集工作快速、灵活而准确。

动脉网(ID:vcbeat)

文:陈坤

责编:张楠

Nuance公司的语音识别技术在2011年推出,并在业界处于领先地位。该技术致力于为临床专业人士提供语音导航文件系统和应用程序以实现与患者进行全新交流的目标。该技术的运用极大地提高了医生诊断的工作效率,使得患者病情采集工作快速、灵活而准确。

Nuance公司近来宣布通过使用Nuance的基于云计算的临床语音识别技术,医生已经平均每年记录一亿病人的数据。

这一具有里程碑意义的成果归功于急剧增长的医疗卫生机构使用的网络以及嵌入式Nuance医疗解决方案,且使用量自今年年初已上升到30%。

Nuance公司根据市场反馈,预计若保持该增长速度可得出以下结论:94%的医疗机构正在考虑或有强烈兴趣使用临床语音识别技术,同时89%的医疗机构认为便携性是最大优势。

医生在巨大压力下掌握患者病情:目前医生正面临着与日剧增的压力,即使用不同的临床系统工具、在不同平台上治疗、同时保证病人电子病历的记录完整性。

一般而言,治疗记录通过移动设备、网络等虚拟环境完成,同时要求设备具备一定的安全性、灵活性,使得医生能够快速、准确的掌握病人的事实情况,以支持当今不断变化的临床工作流程。

“相比以往,医生在院内、院外的移动更加频繁。与此同时,病人的数据也需要尽快及时地得以记录。

当病人产生有关需求时,医生也必须能随时提供服务。 将Nuance的Dragon 医疗设备与Cerner公司的医师档案记录工具相整合,能让我们有效满足这些需求。”汉娜EHAB博士,全民医疗服务的首席医疗信息官(UHS)说道。

Cerner公司至今已将该解决方案部署到全国16处医疗机构中。“我们的目标是结合Cerner公司电子病历,将至少30%的患者病情信息传输至Nuance语音识别技术系统。

在短短几个星期内,我们惊喜地看到医院里患者的自愿采用率达到了60%甚至90%。这也告诉我们,除非主动改进,使用先进的工具,否则无法实现如此高的采用率。”

汉娜博士将这一显著采纳率归功于Nuance的语音识别和语音配置文件,该软件允许医生持续体验使用,并在适合自己的临床工作流程中检索所需要的临床资料,以提高资料的可移植性和准确性。

“从我开始讲的第一分钟它就能够理解,”他补充说,并指出,医生们非常喜欢使用这个不用培训的软件。医生的满意程度和软件本身的方便性也是获得该软件较高采纳使用率的重要原因,同时它也是沟通UHS医务人员和IT人员之间关系的重要媒介。

除了Nuance的云技术软件应用,在过去几年内,语音识别打通平台数据入口的公司如研发移动EHR APP的Cerner、Epic、eClinicalWorks等已经超过了3000家。

剖析

美国通讯公司Nuance的全球化产品项目研究

Nuance通讯公司是美国跨国计算机软件技术开饭公司,总部设在马萨诸塞州伯灵顿,美国波士顿郊区,主要经营范围是提供语音和图像的应用程序。

目前经营的产品集中在服务器和嵌入式语音识别、电话转向系统、自动电话目录服务、医疗转录软件和系统、光学字符识别软件和桌面图像处理软件等方面。

该公司还保留着一个专门为政府机构军事活动提供软件和系统开发的小部门。在2011年10月,未经证实的研究表明,其服务器服务于苹果iPhone 4S的Siri语音识别应用程序。

作为世界上最大的语音识别公司,Nuance 是如何在激励的竞争中脱颖而出的呢?下面将系统的介绍该公司的产品项目、主要管理者、融资情况以及商业模式。

>>>>

Nuance 公司产品项目介绍

光学字符识别(光学字符阅读器)(OCR)是利用机械或电子输入方式将手写或打印文本的图像转化为机器可以识别的编码的应用程序。

它广泛地应用于处理印刷数据的业务中,不论是护照证件、发票、银行结单、计算机化收据、名片、邮件还是其他的静态数据,都能以任何合适的文档进行打印输出。

作为数字化印刷文本,它可以由人工进行电子编辑、检索、存储以及在线显示等操作,并且能由计算机进行识别,如供机器翻译使用,从文本到语音的转换,密钥数据和文本的挖掘等都是较为常见的运用。

OCR主要活跃于模式识别领域、人工智能领域以及计算机视觉领域。OCR早期版本需要对每一个字符图像进行训练,并且在一个时间只能制作一种字体。

在后来的发展过程中,OCR逐渐能够产生高度的识别精度且对于大多数字体都能够进行有效识别。甚至有些系统可以将格式进行输出,输出效果十分接近图像、列和其他非文本成分原页效果。

语音合成是主要是指人工制作人的语音。具备语音合成功能的计算机系统被称为语音计算机或语音合成器,语音识别活动可以由软件或硬件产品来实现。

而文本 - 语音转换(TTS)系统是指将正常的语言文字转换成语音的系统;其他系统则将音标等语音象征性表述转化为语音表述。

合成语音的创建则需要找到记录语音在数据库的存储位置并与串联件相联系加以进行。系统中不同的存储语音单元的大小决定了合成语音的大小。

系统存储电话或音素提供了最大的输出范围,但可能缺乏明确性。对于特定的使用领域,整个单词或句子存储允许高品质语音的输出。

另外,语音合成器可以利用声道和他人的声音特性模型来创建一个完全“合成”的声音输出。一个语音合成器的质量的高低是通过创建语音与人声的相似度大小来衡量的。

可理解的文本到语音的转换为视障人士或阅读障碍者聆听家里电脑上的文字作品提供了极大的方便。自上世纪90年代初,许多计算机操作系统中已包括语音合成系统。

语音识别(SR)是计算机与语言学跨学科结合而成的一项技术,主要指的是在语言学、计算机科学和电子工程领域的使用的开发方法和技术。

它能够识别利用计算机和计算机设备如categoriezed的智能技术和机器人技术对文本以及口语文本进行识别。它也被称为“自动语音识别”(ASR)、“计算机语音识别”以及“语音到文本”(STT)技术。

某些SR系统使用“培训”,即利用单个扬声器读取文本或孤立的词汇并传输到系统中,由系统对某人的特定语音进行分析,并用它来微调识别某人的讲话,提高语音识别的精度。不使用训练系统被称为“说话者无关”系统。使用训练系统被称为“说话者相关”系统。

语音识别的应用包括语音用户界面,如语音拨号(如“呼叫之家”)、呼叫路由(如“我想打对方付费电话”)、家庭自动化家电控制、搜索(如找一个播客,其中具体的话是口语),简单的数据输入(例如,输入信用卡号)、制备结构化的文档的(例如,一个放射报告)、语音到文本处理(例如,文字处理器或电子邮件)以及直接语音输入等方面 。

从技术角度来看,语音识别有着悠久的历史并经历了几次重大的创新。最近,该领域受到深度学习趋势和大数据发展的积极影响。

目前,全球范围内针对语音识别系统的研究和设计的学术论文数量大大增加。知名企业包括微软、谷歌、IBM、百度(中国)、苹果、亚马逊、Nuance公司、科大讯飞(中国)等,其中许多公司表示语音识别系统核心技术的突破是基于深度学习的普及。

>>>>

Nuance 公司团队成员

Paul Ricci 担任了Nuance的13年的首席执行官,他已做好了在语音辅助网络(voice-assisted Web)领域内一争高下的准备。

Ricci 在硅谷是出了名的为达目的誓不罢休。在任务期内他完成了 60 次并购,有好几次都有着专利诉讼的威胁(Nuance 官方记录有 8 次)。

在森尼韦尔市的一间 Nuance 会议室中,Ricci 说:“我不赞同这样的评价,有大量的卖家通过这些并购获得了大笔财富,他们对此也很满意。” 稍后他又补充到:“当你运营一家公司时,唯一能做的就是创造长期价值。”

Nuance大中华区总经理郑裕庆(Daniel Cheng)

英国Essex大学计算机系人工智能专业硕士,同时拥有Newcastle大学航海及造船专业学士学位。曾任赛门铁克(Symantec)中国公司董事经理、Business Objects大中华区董事经理。在IT行业拥有近二十年的从业历史,对亚洲及大中华区市场有着深刻的了解。

Nuance移动业务部产品管理副总裁Matt Revis

哥伦比亚商学院MBA学位,曾就任过Dragon Naturally Speaking(Dragon自然语音技术)的产品经理。

>>>>

Nuance 公司融资情况

在20世纪90年代末至21世纪初,Nuance公司开始反对其他NLSR厂商的竞争,包括飞利浦SpeechPearl,SpeechWorks和其他较小的公司。

后来,Nuance以出售许可证(培训与咨询)为依据将自己的技术给第三方,并将独立软件供应商和交互式语音应答(IVR)的供应商也建立在一个IVR平台上的应用程序。

2011年10月,Nuance公司收购Swype公司,一个产生输入软件的触摸屏显示并超过百米的公司。2011年12月 - Nuance公司收购Vlingo,经过多次起诉Vlingo的专利侵权。

在剑桥的Vlingo试图利用声音使应用程序更容易,使用自己的语音到文本J2ME / BREW应用程序的API。2012年4月 - Nuance公司获得创见服务。创见利用其专有的基于互联网的语音和数据分发技术、客户基础的技术以及以家庭为基础的医疗语言专家,将医生的录音转换成电子文档的形式。除此之外,还提供了客户的平台外包转录和编辑服务。

  • 2012年6月 - Nuance公司收购SAFECOM,并与惠普打印设备集成打印管理和成本回收软件提供商联合。

  • 2012年9月 - Nuance公司以22.5万美元收购DITECH网络公司。

  • 2012年9月 - Nuance公司收购Quantim,QuadraMed的HIM业务 - 一家提供信息技术解决方案为医疗保健行业.

  • 2012年10月 - Nuance公司收购J.A.托马斯和协会(JATA)

  • 2012年11月 - Nuance公司收购ACCENTUS

  • 2012年12月 - Nuance公司收购了计然。

  • 2013年1月 - Nuance公司收购VirtuOz。

  • 2013年5月 - Nuance公司收购以8000万美元收购特维德尔集团

  • 2013年7月 - Nuance公司收购了认知科技公司

  • 2013年10月 - Nuance公司收购Varolii(正式Par3的通信)

>>>>

Nuance 公司商业模式

俯瞰全球语音技术市场,超过80%的语音识别都采用Nuance识别引擎技术,在uance名下有超过1000个专利技术,公司研发的语音产品可以支持超过50种语言,在全球拥有超过20亿用户。

在金融领域,超过500家客户;电信行业,前15大公司有超过10家为Nuance用户。语音识别应用领域广泛,如呼叫客服中心、GPS语音定位搜索、电子词典发音,说话译成不同语言的文字。

Nuance是一家美国的上市公司,现在的全球员工数大概有五六千人,去年的公司营收已经超过十亿美元,现在大概有50多亿美元的市值。从软件业来讲,Nuance的发展速度还是比较快的。

Nuance目前一共有四个业务部门

  • 医疗业务部,提供医疗中的病历管理及手册转录服务。

  • 企业业务部,尤其是银行或者电信行业的用户,提供客户服务及呼叫中心应用。

  • 图像业务部,提供MFP多功能扫描、PDF以及文件自动化操作解决方案。

  • 移动设备业务部,提供手机与汽车设备中的指令及控制功能、语音查找及短信应用。

Nuance作为世界语音技术的领先的公司,可以为客户提供多方位全面的技术。在中国的众多语音识别公司还没有这么完善。Nuance仍然在加强对中国的投入,包括招聘一些本地的专家和技术人员,来做一些适合本地习惯的完善和改进。

比如该公司在上海有研发中心,北京也有研发团队。上海地区的团队主要利用Nuance先进的语音识别技术来进行本地化发展,将中文的一些细节设计得更好,以此符合中国人的使用习惯。

Nuance凭借其专业服务团队和全球合作伙伴网络的丰富专业知识为业界提供了全球最丰富、最广泛的语音、语言、文本和图像产品组合。

Nuance通过语音互动建立了强大的用户体验数据库,从而帮助客户的设备、应用和信息系统发挥了最大的潜力。在这个领域,在任何地方也没有其他公司比Nuance拥有更丰富的经验。

Nuance公司利用针对特定行业的自然人机界面与全球一些最复杂的技术、服务

和流程进行了整合,为客户提供了强大的、几乎是毫不费力的使用体验。

如今,医疗保健、移动和电信等行业内成千上万的公司和全球数以百万计的用户仅通过说话便能利用Nuance的技术来传递重要信息、增加生产力、开展业务。

END

点击图片阅读推荐内容↓↓↓

【医生专属福利】APP你用,iPad我送!

手术机器人已入稳步爬升期?看看达芬奇手术量分布

看TOP10医疗设备巨头都有哪些移动智能产品

动脉网
专业的互联网医疗创业服务平台
(0)

相关推荐