AMiner发布《人工智能之信息检索与推荐》报告 预测六大技术热点

将朝智能化与个性化方向转变

信息爆炸式传播下,我们应如何筛选有效信息?

每天数以万计的信息资源在指间掠过,如何快速、准确获取所需内容?由此,信息检索与推荐技术应运而生。

一方面,网络信息资源的迅猛膨胀推进了信息检索技术的发展和成熟;另一方面,人们对信息资源的高效获取,也推动着信息与检索技术朝着更加智能化、个性化、专业化的方向发展。

为概貌性了解信息检索与推荐技术的发展概况和未来趋势,今天,AMiner正式发布了《人工智能之信息检索与推荐》报告

该报告旨在通过对信息检索与推荐发展历程、前沿技术与人才概况的全面分析,展现信息检索与推荐技术发展的现状与挑战。

本报告主要包括以下内容:

概述篇

本篇对信息检索推荐的概念与发展历程,以及这两者之间的联系与区别作了简要概述。

技术篇

该章节对信息检索与推荐领域的前沿技术,包括信息检索中的集合论模型、代数模型、概率模型等技术,信息推荐中的深度推荐模型、协同过滤推荐、基于内容的推荐、组合推荐方法、可解释性推荐等技术作了简要分析,并对信息检索与推荐领域相关的图书、文章、研究中心、竞赛等资源进行了梳理。

人才篇

本章节通过AMiner大数据平台对信息检索与推荐领域的顶级学术会议及期刊论文进行挖掘,获得这些会议和期刊最近10年(2009-2018年)的论文,之后通过论文作者挖掘出该领域的专家学者,提取论文中所有学者信息,从中选出h-index排名最靠前的2000位活跃学者,分析了学者的分布、迁徙等情况,介绍了部分该领域国内外知名度较高的活跃学者。

产业应用篇

本章节选取了信息检索与推荐各领域具有代表性的案例进行了分析,对典型的技术应用产品如百度、今日头条等,垂直应用如法律搜索、健康搜索、问答式搜索等,产品推荐、音乐推荐、信息流推荐等领域的产品进行了分析介绍。

趋势篇

本章节回顾了信息检索与推荐的发展关键词,并对信息检索与推荐未来的发展态势作了预测。

我们选取了其中的趋势篇,为大家展现与预测信息检索与推荐的未来发展走向。如果大家想要获取完整报告,可点击本文底部的阅读原文或在本公号回复“19”获取。

随着网络技术的发展,信息资源也呈现出爆炸性增长,手工检索已经很难适应当今信息的发展速度,计算机检索应运而生。

发展关键词回顾

AMiner根据信息检索与推荐领域的相关论文绘制研究热点趋势图(如图1),旨在基于历史的科研成果数据的基础上,对信息检索与推荐各个时间段的热度和发展趋势进行研究。图中,每个色彩分支表示一个关键词领域,其宽度表示关键词的研究热度,各关键词在每一年份(纵轴)的位置是按照这一时间点上所有关键词的热度高低进行排序。

图1 信息检索与推荐的热点趋势图

接着我们将挖掘到的各个时间段的前10个关键词列出,并按照出现次数降序呈现,如下表所示:

各时期的关键词表

从关键词表可以看出,User Interface(用户界面)和Document Retrieval(文档检索)一直是信息检索与推荐领域的发展关键词,出现了三次。其中,User Interface(用户界面)在1980-1989年间出现的次数为40;在1990-1999年间出现的次数为38;在2000-2009年间出现的次数为380,即用户界面的研究总体上呈递增趋势。而Document Retrieval(文档检索)在1970-1979年间出现的次数为6;在1980-1989年间出现的次数为74;在1990-1999年间出现的次数为63,即关于文档检索的研究总体上呈递减趋势。多媒体内容的出现对纯文档检索方法提出了新的挑战。

出现两次的关键词有6个,分别为Data Structure(数据结构)、Query Language(查询语言)、Retrieval System(检索系统)、Information System(信息系统)、Data Mining(数据挖掘)、Search Engine(搜索引擎)。

其中,Data Structure(数据结构)和Query Language(查询语言)首次出现都是在1970-1979年间;第二次出现在1990-1999年间,即它们的研究热度成衰减趋势。

Retrieval System(检索系统)和Information System(信息系统)是兴起时间较早,前者出现在1970-1979和1980-1989年间;后者出现在1980-1989和1990-1999年间;而Data Mining(数据挖掘)和Search Engine(搜索引擎)是近年来兴起的,出现在2000-2009和2010-2019年间,并且关于它们的研究热度不减。

此外还值得注意,在2010-2019年间Social Network(社交网络)和Social Media(社交媒体)这两个关键词的出现。21世纪以来,随着网络技术的发展,信息检索与推荐的研究也逐渐呈现社交属性。

通过对1970-2019年间信息检索与推荐领域有关论文的挖掘,总结出二十多年来,信息检索与推荐的领域关键词主要集中在User Interface(用户界面)、Document Retrieval(文档检索)、Search Engine(搜索引擎)、Query Language(查询语言)等领域。

技术预见

研究者根据信息检索与推荐领域近十年的相关论文,利用大数据分析、机器学习、人工智能等技术手段,建立算法模型及研发demo系统,分析挖掘出该领域的技术发展热点。

技术预见图中点的大小表示该技术的热点(主要由相关论文数量的多少决定,相关论文越多,热度越高,点越大),各技术之间的连线表示2个技术关键词同时在N篇论文中出现过(当前N的取值为5)。

图2 信息检索技术预见图

根据信息检索技术预见图(图2),可以得出信息检索领域相关度最高的技术有26项,分别为:data mining(数据挖掘)、latent semantic(潜在语义)、learning to rank(学习排序)、image classification(图像分类)、bag-of-words model(词袋模型)、feature extraction(特征提取)、feature selection(特征选择)、machine learning(机器学习)和text analysis(文本解析)等。

图3 推荐系统技术预见图

根据信息推荐技术预见图(图3),可以得出信息推荐领域相关度最高的技术有13项,分别为:search engine(搜索引擎)、web mining(web挖掘)、semantic web(语义网络)、search process(检索过程)、web pages(网页页面)、user satisfaction(用户满意度)、vector space model(向量空间模型)、data mining(数据挖掘)、web site(网站站点)和user profile(用户画像)等。

按照技术前沿度,可以列出相关的主要技术关键词,以及该技术历年的变化趋势(论文发表数量变化趋势),及重要代表性成果。具体如下图所示:

图4 信息检索领域的六个技术关键词

信息检索领域技术关键词图(图4)可以看出,未来该领域的六个技术热点分别为:social media(社交媒体)、wireless sensor networks(无线传感器网络)、support vector machine(支持向量机)、mobile device(移动设备)、sentiment analysis(情感分析)和recommender system(推荐系统)

图5 信息推荐领域的六个技术关键词

信息推荐领域技术关键词图(图5)可以看出,未来该领域的六个技术热点分别为:social media(社交媒体)、big data(大数据)、wireless sensor networks(无线传感器网络)、web2.0 support vector machine(支持向量机)和social network analysis(社交网络分析)

从总体上看检索技术发展迅速,但目前仍存在一些问题。例如搜索引擎存在缺陷且智能化程度低的状况,用户在使用搜索引擎检索信息时,经常会搜索到一些毫不相干的内容,影响了搜索体验;有些网站质量差,栏目设置很是混乱,对信息资源的分类组织上都存在着混乱状况,类目划分标准不合理,甚至可能出现同时用两个或两个以上标准划分的现象;综合性搜索引擎提供大众化服务较多,而个性化服务很少,它们没有有效的手段理解用户准确的个性化信息需求,不能提供长期的主动的信息服务。

虽然推荐系统已经成功运用于很多大型系统及网站,但是在当前大数据的时代背景下,推荐系统不仅面临数据稀疏、冷启动、兴趣偏见等传统难题,还面临由大数据引起的更多、更复杂的实际问题。

为了解决这些问题,信息检索在未来必须具有能及时挖掘新信息和及时链接新增的信息、多途径检索等功能;未来网络信息资源在组织分类上需要制定一个统一的分类标准,规范网络术语,提高资源共享的程度;每个人对信息的需求也不再满足于标准化、单一化的大众需求,更加智能的融合NLP技术将更好地去理解用户显性的意图或者是隐性的意图;新的信息交互模式也是未来行业关注的焦点,交互式会话检索也会在业界越来越受关注,开发出更好的对其评测方法也是关注点之一。相信在众多信息专家努力下,在信息检索与推荐领域将取得更大的突破,人们可以获取更多丰富的信息资源。


(0)

相关推荐