AI公开课：19.04.03周明—MSRA副院长《NLP的进步如何改变搜索的体验》课堂笔记以及个人感悟

2024-04-13 10:58:32

导读
周明博士，1999年加入微软研究院(MSRA)。现任微软亚洲研究院副院长。他现任国际计算语言学会（ACL）会长，中国计算机学会理事、中文信息技术专委会（即NLP专委会）主任、中国中文信息学会常务理事。他带领团队进行了微软输入法、英库词典（必应词典）、中英翻译、微软中国文化系列（微软对联、微软字谜、微软绝句）等重要产品和项目的研发，并对微软Office、必应搜索、Windows等产品中的自然语言技术做出了重要贡献。近年来，周明博士领导研究团队与微软产品组合作开发了微软小冰（中国）、Rinna（日本）、Zo（美国）等聊天机器人系统。
周明博士发表了120余篇重要会议和期刊论文（包括50篇以上的ACL文章），拥有国际发明专利40余项。他多年来通过微软与中国和亚太地区的高校合作计划，包括微软-高校联合实验室、微软实习生计划、微软-高校联合培养博士生计划、青年教师铸星培养计划，与高校和学术组织联合举办暑期学校和学术会议等多种形式，对推动自然语言处理在中国和亚太的卓越发展做出了杰出贡献。

问答环节

雷鸣教授：关于多轮语义分析器的看法。多轮还是限制场景，可以理解为算力或者某种不足。
周明教授：上下文信息如何关联，一定要考虑场景，通过场景定义状态，然后进行推理。
雷鸣教授：算力推动的发展，科研要跟着算力走，算力与自然语言的关系，未来的发展，是否会因为算力而提高？
周明教授：算力当然永远是重要的，有些问题，本身没有太多的训练语料，单凭算力是没办法的，可以通过人类的知识库，加以改进。人类模型如何建，如何融入到模型中。关于多轮，是出现动态的变化，无法提前通过输入输出得出，还需要常识、知识库的融入。基于数据驱动的，可以把模型建好。基于知识或者推理，背后还需要算力的。但是整个理论体系还没有起来，如果理论建好，那时候或许还是要看算力。
雷鸣教授：深度学习和知识图谱如何融合？语言其实是更大范围的表征。
周明教授：背后的技术可以用深度学习来做，可以把知识图谱也做词嵌入，与词的嵌入类似。但我不认为，该方向不太会有大的突破。第一，怎么来把知识图谱完备好；第二，假设知识图谱完备的情况下，如何去做推理。
雷鸣教授：动态理解，比如对视频的理解，单句或者一帧图片已经可以了。但是多轮的情况下，比如多轮对话，未来的发展，计算机视觉和自然语言处理的关系？
周明教授：未来人与机器的交互就是多模态的，现在的研究都是单模态的。现在，这是个特别诱人的方向，但是困境是缺乏相应的数据集。建议做语言与图像的双模态的数据集，以后可以做更大的数据集，来慢慢推动这个领域。基于数据集的驱动。
雷鸣教授：谈一下那些领域会有比较好的进展，在落地或者终端用户，适合学生创业的方向
周明教授：比如多模态的问答，先从单模态做起，先不加推理，以后再一步一步加上推理。关于哪些应用，具体的有，比如文本生成，把一首诗生成出来，但是不太符合逻辑，所以要结合逻辑生成诗句，会对人类的文档生成巨大的影响。再比如翻译、信息抽取，会对某个垂直领域，财经、医疗等。不一定会产生100%好，其实60%也可以产生很多效益。
雷鸣教授：NLP最近在挑战图灵测试吗？目前有多大进展。算力的重要性。
周明教授：真正的人工智能，凭图灵测试，其实并不能代表。大家要尊重算力，它体现了解码能力、信息抽取能力。人类建模的能力，常识知识推理。算力要有的话当然要有，还是要强化建模能力，去潜心做研究。
雷鸣教授：量变到质变，基于词法语法、基于概率统计(算力开始体现)、基于深度学习(更强的算力)，算力的提升会对算法有更好的体现，但是并不是要以算力为王，根据算力的基础，做出更好的模型。
雷鸣教授：如何理解非自然语言，比如写代码，计算数学公式
周明教授：…………，常识结合推理，认知。
雷鸣教授：同声传译是否会被替代？
周明教授：长期来看，很多场合会被替代，但短期来看，其实还有很长的路要走。比如碰到的背景噪声、专业术语、容错度低(场合严谨)等技术难点，可以探讨人机结合，但是实用上目前不太好，作为技术人员，当然希望越来愈好！

个评：NLP结合CV，在未来，会有意想不到的突破点！
备注：以上对话环节的文本编辑，为博主总结，与原文稍微有异，请以原文录音为准，欢迎网友留言探讨。

现场PPT

演讲PPT

演讲的五个部分

Multi-lingual capablity

少语料翻译

Multi-model

多模态搜索

VQA：利用VQA数据集，3000个词汇表，做出预测，输出最优词汇。

VQA中，犯常识性错误案例，基于常识改进图像认知，修正VQA的结果。

图像搜索与文本搜索的结合，提高用户搜索体验。

MRC

机器阅读理解

MSRA以前的MRC框架

几个优点

个性化推荐

用户画像，知识图谱，(以前喜欢的+预测未来喜欢的)，可解释性推荐(解释的推荐理由)

实现的技术

未来的技术

其实，还有文本生成等应用。

未来几个比较好的研究课题

欢迎来MSRA访问、学习！

2020上半年收集到的优质AI文章 – 自然语言处理

2020上半年收集到的优质AI文章 – 自然语言处理自然语言处理的蓬勃发展及其未来人工智能之自然语言处理初探我所知道的中国NLP「破圈」十年零基础入门NLP - 新闻文本分类现代NLP中的零 ...
【学习求职必备】微软亚洲研究院和它的10大AI黑科技

言有三毕业于中国科学院,计算机视觉方向从业者,有三工作室等创始人作者 | 言有三编辑 | 言有三接着上一篇介绍国内的重要研究院,今天开始第一期正式的介绍,先说历史最悠久的微软亚洲研究院 01 ...
微软亚洲研究院周明 | 从语言智能到代码智能

微软亚洲研究院副院长周明老师报告:From Language Intelligence to Code Intelligence Based on Pre-trained Models 感谢周明老师的 ...
2019年上半年收集到的人工智能自然语言处理方向干货文章

2019年上半年收集到的人工智能自然语言处理方向干货文章自然语言(NLP)发展史及相关体系读了这篇文字,做年薪百万的NLP工程师聚焦机器"读.写.说.译",探寻NLP未来之路 ...
AI公开课：19.03.06何晓冬博士《自然语言与多模态交互前沿技术》课堂笔记以及个人感悟

AI公开课:19.03.06何晓冬博士<自然语言与多模态交互前沿技术>课堂笔记以及个人感悟导读:AI与产业界结合,算法还是很重要的. 计算机能不能思考?会不会思考?把哲学问题转为科学问题 ...
AI公开课：18.05.16 周明博士(MSRA副院长)—北大AI第十一讲之《语言智能的进展》课堂笔记——你了解语言智能

AI公开课:18.05.16 周明博士(MSRA副院长)-北大AI第十一讲之<语言智能的进展>课堂笔记--你了解语言智能导读周明博士,微软亚洲研究院副院长.国际计算语言 ...
AI公开课：19.03.07雷鸣教授《人工智能革命与趋势》课堂笔记以及个人感悟

AI公开课:19.03.07雷鸣教授<人工智能革命与趋势>课堂笔记以及个人感悟导读:什么都比较重要,但更重要的是,一定要找到什么是最重要的.伟大的事情是有窗口的,历史的窗口给的机会,抓住 ...
AI公开课：19.03.07王海峰博士《人工智能技术与产业应用》课堂笔记以及个人感悟

AI公开课:19.03.07王海峰博士<人工智能技术与产业应用>课堂笔记以及个人感悟演讲内容(部分) 人工智能是新的生产力. 人工智能发展趋势 1.基础理论:小样本.低能耗.可解释. 2 ...
AI公开课：19.03.13沈徽-商汤副总裁《AI创新与落地》课堂笔记以及个人感悟

AI公开课:19.03.13沈徽-商汤副总裁<AI创新与落地>课堂笔记以及个人感悟导读:重要的不是学历而是能力,AI领域人才,硕士学位,不是优势也不是劣势,要更多的去考虑自己的能力.坚持 ...
AI公开课：19.03.20吴甘沙-驭势科技联合创始人《AI时代的自动驾驶趋势》课堂笔记以及个人感悟

AI公开课:19.03.20吴甘沙-驭势科技联合创始人<AI时代的自动驾驶趋势>课堂笔记以及个人感悟导读为什么要大大小小的公司都要做无人驾驶?因为它真的是一个很大的舞台,具 ...
AI公开课：19.03.21钱诚/雷鸣等教授或专家《寒武纪-深度学习处理器》课堂笔记以及个人感悟

AI公开课:19.03.21钱诚/雷鸣/汪玉/侯晓林等教授或专家<寒武纪-深度学习处理器>课堂笔记以及个人感悟导读:如果大家去创业的话,一定要看清未来的大趋势,看对赛道,当然,还有人才. ...
AI公开课：19.03.27韦韬—百度CSS《AI产业面临的安全威胁与挑战》课堂笔记以及个人感悟

AI公开课:19.03.27韦韬-百度CSS<AI产业面临的安全威胁与挑战>课堂笔记以及个人感悟导读韦韬,百度首席安全科学家(Chief Security Scientist ) 海因 ...
AI公开课：19.04.04李航—字节跳动AILab总监《深度学习与自然语言处理：评析与展望》课堂笔记以及个人感悟

AI公开课:19.04.04李航-字节跳动 AI Lab总监<深度学习与自然语言处理:评析与展望>课堂笔记以及个人感悟导读 1.关于李航教授李航,字节跳动科技有限公司人工智 ...

AI公开课：19.04.03周明—MSRA副院长《NLP的进步如何改变搜索的体验》课堂笔记以及个人感悟

问答环节

现场PPT

演讲PPT

演讲的五个部分

Multi-lingual capablity

Multi-model

MRC

个性化推荐

相关推荐