RecNN | 一个基于强化学习的新闻推荐系统框架

2024-04-24 13:04:47

嘿，记得给“机器学习与推荐算法”添加星标

今天给大家推荐一个基于强化学习进行新闻推荐的算法库。

值得注意的是该库的创建者是一个高二的学生，该项目是作者的学校项目。作者觉得强化学习入门本身是一个相当困难的话题，当他开始深入研究时，发现不能很好的理解其中的原理。因此他用了一种“社会研究”的方式来理解其数学概念，希望这篇文章能够对新手有所帮助。

强化学习是推荐系统的理想框架，因为它具有马尔可夫属性。强化学习中所涉及的组件和概念正好可以和推荐系统中的组件一一对应，比如状态(State)是用户评分的电影，动作(Action)是接下来选择观看的电影，而奖励(Reward)是其对应的评分。

绿色表示状态，红色表示动作，黄色表示奖励

该项目介绍了实现DDPG/TD3算法的实现细节，讨论了强化学习的参数选择，介绍了动作评估的新颖概念，介绍了优化器的选择并分析了实验结果。特别说明的是，还发布了专门用于马尔可夫决策过程并与强化学习配合使用的MovieLens数据集版本。

该项目的Github地址如下：

https://github.com/awarebayes/RecNN

P.S. 好的内容值得被更多人看到。欢迎大家分享好玩好用的学习/科研/办公工具。提前祝大家元旦快乐~

框架搭建法！你最头疼的「论述题」终于有救了！

正在努力备考的同学们!真题进度怎么样啦?有没有感觉到自己的知识储备正在疯狂增长,写题速度正在疯狂变快? 前几天小铎推出了简答题如何撰写小标题<彭兰.常江老师教你写答题小标题!8篇范例与模拟现场练 ...
夺魁NeurIPS 2020电网调度大赛，百度PARL实现NeurIPS强化学习竞赛三连冠

机器之心发布机器之心编辑部受疫情影响,人工智能顶级学术会议 NeurIPS 2020 将通过线上的形式进行.随着会议召开时间临近,该会议承办的竞赛也陆续揭晓结果.今年新增的电网调度竞赛(Learn ...
AA DRL 优秀作品分享｜SEISMOS：灾后自动化居住系统

「 SEISMOS 」/ 灾后自动化居住系统 |项目作者| Huizhong Li, Xiaonan Liu, Razvan Voda, Jaeho Park |项目导师| Theodore Spyr ...
最后两天！5大万能金句、6个通用答题模板打包放送！

今天是平安夜,铎铎子给大家整上一期热乎的干货推送. 答题金句+万能答题模板.不管用不用得上,考前瞟一眼保准安心上考场. 话不多说,开整! PART 1 : 万能答题金句 1 适用对象:过度娱乐化.游戏 ...
2021真题分析03 | 这20个高频考点，一定会是复试出题重灾区！

2021真题分析03 | 这20个高频考点，一定会是复试出题重灾区！
阅卷真实反馈：最最最常见的论述答题错误！总结了7个！

本文由「押题冲刺班」赞助推送来冲刺班,热点专题.答题金句全都有! 考研进入冲刺期啦!各位崽崽们的专业课练习一定要抓起来了!现在这个阶段,你的"论述题"写明白了吗?依然是答题丢下开头 ...
最新基于强化学习的推荐系统综述

嘿,记得给"机器学习与推荐算法"添加星标来自 | 专知链接 | mp.weixin.qq.com/s/yOcWMmqddQPyEa2oROCzxQ 编辑 | 机器学习与推荐算法 ...
GitHub项目推荐｜基于强化学习的自动化剪枝模型

今天为大家介绍一个GitHub上最新开源的一个基于强化学习的自动化剪枝模型,本模型在图像识别的实验证明了能够有效减少计算量,同时还能提高模型的精度.项目地址:https://github.com/fr ...
基于强化学习动态避障的Python实现（绝赞摸鱼版）

基于强化学习动态避障的Python实现吐槽在前这是我的研究生小课题,可是老师从头到尾没有理过我,只给了我一个题目,连稍微具体一点的要求都没提.那我就摸鱼摸爆于是我进行了许多的简化,到最后做出了一 ...
AI|当推荐系统遇上图学习：IJCAI 2021基于图学习的推荐系统最新综述

『运筹OR帷幄』转载作者:Shoujin Wang Shoujin Wang, 麦考瑞大学博士后, 研究方向:数据挖掘,机器学习,推荐系统. 编者按作为人工智能最重要的应用之一,推荐系统几乎存在 ...
基于自适应策略的深度强化学习

人工智能算法与Python大数据致力于提供深度学习.机器学习.人工智能干货文章,为AI人员提供学习路线以及前沿资讯 23篇原创内容公众号点上方人工智能算法与Python大数据获取更多干货在右上 ...
基于异步多智能体强化学习的公交驻车控制方法

基于异步多智能体强化学习的公交驻车控制方法
从零实现一个支持深度强化学习的量化投资系统

研究过外汇自动交易,期货CTA,然后是股票的量化投资,当然本质上没有太大区别. 开源量化系统也用过几个,数据格式融合的问题,有些不方便,而且客观讲,实现一个简单的量化系统,其实非常简单. 这一次算是重 ...
VLDB 2020 | 基于深度强化学习的相似轨迹搜索

论文标题:Efficient and Effective Similar Subtrajectory Search with Deep Reinforcement Learning论文链接:https ...
Merlin：基于深度学习的推荐系统框架

编辑整理:光光出品平台:DataFunTalk.AI启蒙者导读:随着大数据时代的到来,人们在一天内接触到的信息量越来越大,为了解决信息过载的问题,人们提出'推荐系统'这一概念,它被广泛应用于电子商 ...

RecNN​ | 一个基于强化学习的新闻推荐系统框架

相关推荐

RecNN | 一个基于强化学习的新闻推荐系统框架