黄学东出任微软全球人工智能首席技术官

2020 年是黄学东加入微软的第 27 年。这位微软语音识别技术领域里的老将,在新年伊始有了新头衔——微软全球人工智能首席技术官,全面负责微软 Azure云、人工智能(AI)的工作,包括语音、机器翻译、计算机视觉、自然语言和人工智能认知服务。

根据最新任命,黄学东将领导新统一的 AI 认知服务工程和研究团队。黄学东领导了认知组织的语音和语言团队。据悉,未来,认知组织中的语音和语言以及计算机视觉团队将移至 AI 平台并向黄学东汇报,而 AI 平台组织中现有的  Form Recognizer , Personalizer 和其他认知服务工程团队也将向黄学东汇报。
从履历上来看,算上大学时期的研究,黄学东在人工智能领域里已经坚持了 30 多年时间。黄学东祖籍湖南, 15 岁时,他便参加了高考,考上了湖南大学计算机专业。湖南大学的本科学习结束后,黄学东北上来到了清华大学念硕士和博士。在清华,黄学东学习了 5 年时间,完成了硕士学业,但博士没有读完就“跑”了。原因是,当时在自己导师的鼓励下,黄学东提前到了英国的爱丁堡大学学习,并在该校获得了博士学位。
2017 年,黄学东被评选为微软技术院士(Technical Fellow),这代表着微软技术人员的最高荣誉,获得这一荣誉的人还包括图灵奖得主 Butler W Lampson 、 Charles P. Thacker 等。值得一提的是,黄学东也是微软首位华人技术院士。同时,他也是国际电子电气工程师学会 (IEEE) 和美国计算机学会 (ACM) 的双科院士,微软认知工具包CNTK的缔造者之一。
微软语音技术创始人,微软首位华人技术院士

从履历来看,黄学东是国际电子电气工程师学会(IEEE) 和美国计算机学会 (ACM) 的双科院士,也是微软认知工具包 CNTK 的缔造者之一。
同时,黄学东还是微软全球技术院士,这代表着微软技术人员的最高荣誉,目前全球仅有 20 多人获得这项殊荣,黄学东是微软唯一的华人技术院士。
1978 年, 15  岁的黄学东进入湖南大学师资班(后来的电子工程系),成为当时校园里年龄最小的学生之一。他先后获得湖南大学学士学位、清华大学硕士学位和英国爱丁堡大学博士学位。
1993 年,他作为高级研究员加入了微软研究所并负责组建 Microsoft's  语音识别技术研究团队。2000 年到 2004 年,他作为Microsoft's语音识别技术研究团队的总经理,负责微软语音技术和产品的研究、开发和市场拓展。
担任微软首席语音科学家期间,黄学东领导的语音和对话研究团队取得了多项里程碑式的成就
1993 年,黄学东作为高级研究员加入了微软研究所并负责组建 Microsoft's  语音识别技术研究团队。
2000 年到 2004 年,他作为 Microsoft's 语音识别技术研究团队的总经理,负责微软语音技术和产品的研究、开发和市场拓展。他领导微软语音技术的开发和产品的市场行销,包括获奖的 Speech Server 2004 。在加入微软之前,他在卡内基·梅隆大学致力于发展 CMU's Sphinx-II  语音识别系统。在期刊和会议上发表了一百多篇论文,并合著出版了两本非常有影响的专著即:Hidden Markov Models for Speech Recognition (Edinburgh University Press 1990) (语音识别中的隐含马尔可夫模型(爱丁堡大学出版社 1990 ))和Spoken Language Processing (Prentice Hall 2001)(口语处理(普林斯顿出版社2001))。曾获中国教育部的科技进步奖、 IEEE 信息论文奖、 Allen Newell 杰出研究奖章,及 SpeechTek 的语言领域十大领军人物称号。
2015 年以来,黄学东领导着微软在美国、中国、德国、埃及、以色列的团队研发包含语音识别及合成,微软企业人工智能客服对话解决方案、 cris.ai 以及 luis.ai 等认知服务、 CNTK 开源深度学习工具等人工智能产品和技术。
2016 年 10 月 18 日,由黄学东带领的微软语音团队在产业标准  Switchboard  语音识别基准测试中,实现了对话语音识别词错率( word error rate , 简称WER)低至  5.9% 的突破,首次达成与专业速记员持平而优于绝大多数人的表现。“这是人工智能领域突破性进展之一,意味着有史以来第一次有计算机能像人类一样,识别对话中的每一个单词。”黄学东说。
2017 年,在对话语音转写任务中,微软语音识别系统的词错率降到  5.1% ,准确率超过专业速记员。“可能表面上这个进展不大,但是在‘最后一英里’上,每  0.1  个百分点的进步都很艰难,必须保证系统没有任何 bug 。何况从相对错误率降幅角度,  5.9  到  5.1  是一个超过  10%  的相对进步。”
2018  年,在汉英新闻机器翻译任务中,微软机器翻译系统达到了可与人工翻译媲美的水平。
2019  年,在斯坦福对话式问答任务中,微软机器阅读理解系统刷新记录,成为目前排行榜上唯一一个模型分数超过人类分数的团队。
黄学东在接受采访时曾表示,他的最终梦想是能让机器理解人类的语言,并让机器能够像人一样说话、交流。
(0)

相关推荐