《人工智能之表示学习》报告重磅发布:在低维空间中高效计算实体和关系的语义联系

导读:近日,由清华大学人工智能研究院、北京智源人工智能研究院和清华-中国工程知识智能联合研究中心编写的《人工智能之表示学习》报告正式发布。该报告主要从概念、理论模型、领域人才、技术趋势等4个部分,介绍知识表示学习的技术发展和研究最新进展,并展望该技术的未来发展方向与前景。
近年来,以深度学习为代表的表示学习技术热度高涨,在语音识别、图像分析和自然语言处理领域获得广泛关注。表示学习旨在将研究对象的语义信息表示为稠密低维实值向量,便于在低维空间中进行对象关系的语义关联计算,并有效解决数据稀疏问题,显著提升自然语言处理、计算机视觉和机器学习算法等任务的性能。
本报告根据《CCF推荐国际学术期刊和会议目录》和ACM计算机学分类系统相关子领域的A类期刊和会议作为数据来源,主要研究2010-2020年期间表示学习的技术发展和最新研究进展,并展望该技术的未来发展方向与前景。
报告综合运用了文献分析、大数据分析和挖掘技术、特征抽取、人才画像等研究方法。借助科技情报大数据挖掘与服务系统平台AMiner,通过“表示学习”领域的关键词智能匹配出所有相关论文。并基于这些论文,进行进一步挖掘分析。
在语音交互的AI时代,深度学习的出现与发展使自然语言处理(NLP)技术取得了重大的突破。深度学习的重点之一则是语言表示学习,该报告主要从表示学习的理论基础、主要方法、最新科研进展及代表性论文解读等方面进行相关核心技术介绍。

表示学习的理论基础

  • 向量空间模型

  • 词袋模型

  • 主题模型

  • 独热表示与分布式表示

网络表示学习的主要算法
  • 基于网络结构的网络表示学习

  • 结合外部信息的网络表示学习

知识表示学习的主要方法模型
  • 距离模型/结构表示

  • 单层神经网络模型

  • 能量模型

  • 双线性模型

  • 张量神经网络模型

  • 矩阵分解模型

  • 平移模型

该报告还基于AMiner系统的“Topic必读论文”功能,通过本领域专家以及热心专业读者推荐,选取了表示学习领域其中代表性的十篇论文进行解读。此外,该报告还分析了领域相关的专利情况、国家自然科学基金NSFC项目。
表示学习领域全球学者分布地图如下:
表示学习领域全国学者分布地图如下:
依托AMiner平台,针对表示学习领域,综合参考h-index指标和领域专家推荐意见,报告还筛选了国外和国内各10位代表性学者进行学者画像展示和简要介绍。“学者画像”是AMiner平台的核心服务功能之一,学者画像的特色在于提供专家学者如姓名、单位、地址、联系方式、个人简介、教育经历等个人基本信息。
作为一项新兴技术,知识表示学习的未来技术发展和应用具有巨大潜力。该篇借助领域技术分析系统(http://trend.aminer.cn),对所选期刊和会议中的科技论文情报进行深入挖掘,对表示学习的技术趋势及国际研究趋势等方面进行展示和分析。
技术研究发展趋势
根据“表示学习”领域关键词,从AMiner数据库中查找出指定期刊会议发表的论文,其中包含论文所在领域的分支术语和年份,统计含有这些术语论文数量,给出论文数量排名前10的技术术语,再统计这些术语的起止年份,划分时间窗格,生成大数据智能的发展趋势图。
国家研究发展趋势
根据AMiner平台分析不同国家在“表示学习”领域的研究趋势,在趋势图中以不同颜色的色带代表不同的国家,以其宽度表示该国家在当年的研究热度,与当年该国论文数量呈正相关,每一年份中按照其热度由高到低进行排序。
AMiner平台提供了领域人才分析功能。
  • 可视化的展现领域人才的国家分布、机构分布、h-index分布;

  • 分析了我国领域学者的比较优势以及中外合作情况;

  • 提供了人才查询、定位、分析、展示一体化应用模式。

  • 利用团队多年的命名排歧技术,建立了较为完善的学者-论文映射关系;

  • 提供学者研究兴趣发展趋势分析、学者合作者关系网络分析等;

  • 同时支持用户交互,通过众包方式丰富更新专家学者的相关信息。

(0)

相关推荐