搜索query意图识别的演进
文章作者:jackhan
内容来源:微信AI
导 语
问题背景
常见意图识别处理办法
- 查询词语:澳洲[addr]cemony[brand]水乳[product]面霜[sub_product]
- 查询pattern: [brand]+[product];[addr]+[product]+[sub_product]
- 一英镑等于多少人民币。这个query可以转化为 [数字][币种]等于[数字][币种]
- 《哈利·波特》怎么样。这个query可以转化为 [书/电影/音乐]怎么样
· Session内特征
– Query个数
– 翻页数目
– 点击情况
– 购买行为前浏览时长
· Query类型特征
– Query空格情况
– 命中关键词数目
– 无效字符清洗后剩余信息
– query长度
· 其他信息
– 搜索tab垂类类型:不同类型数目不同。例如服装鞋包类数目显著大于其他类型
– 搜索时间等side information
一些产品的意图识别方案
参考文章
1:https://www.infoq.cn/article/user-search-intention-recognition ““搜你所想”之用户搜索意图识别”
2:https://www.infoq.cn/article/V037TeLVfa-KhwL6WoIK “解读电商搜索——如何让你买得又快又好”
3:https://segmentfault.com/a/1190000014849907 “交互搜索中的自然语言理解技术”
4:https://yq.aliyun.com/articles/420506 “基于DNN+GBDT的Query类目预测融合模型”
5:https://juejin.im/post/5be4de62e51d45305c2cec2d “搜索意图识别浅析”
6: https://www.geekpark.net/news/205894 “浅谈淘宝类目属性体系:商品搜索背后的逻辑架构”
7:http://www.uml.org.cn/jmshj/201204185.asp “如何预测用户query意图”
8:https://coffee.pmcaff.com/article/978121249191040/pmcaff?utm_source=forum&from=related&pmc_param%5Bentry_id%5D=1188086304329792 “拼写纠错和Query类目预测”
9:https://www.codercto.com/a/73176.html “搜索引擎算法之关键词类目预测”
10:http://km.oa.com/group/37444/articles/show/364867 “query分析面面观”