脑机头条 第33期| OpenAI大规模深度强化学习玩DOTA2
更多脑机干货第一时间送达

2020年2月22日
脑机头条 第33期
强化学习定义:
是智能体(Agent)以“试错”的方式进行学习,通过与环境进行交互获得的奖赏指导行为,目标是使智能体获得最大的奖赏,强化学习不同于连接主义学习中的监督学习,主要表现在强化信号上,强化学习中由环境提供的强化信号是对产生动作的好坏作一种评价(通常为标量信号),而不是告诉强化学习系统RLS(reinforcement learning system)如何去产生正确的动作。由于外部环境提供的信息很少,RLS必须靠自身的经历进行学习。通过这种方式,RLS在行动-评价的环境中获得知识,改进行动方案以适应环境。
在巴浦洛夫的最著名实验中,训练狗在铃声响起后会产生期待食物的反应,这些狗在食物到达之前听到声音就开始流唾液,这表明它们已经学会了预测奖励。在最初的实验中,巴甫洛夫通过测量它们产生的唾液量来估计它们的期望。不过最近几十年中,科学家们开始破译大脑如何学习这些期望的内部运作方式。
DeepMind近期发表在Nature上的一项新的工作是,受计算机科学的研究(对强化学习算法的重大改进)启发,他们为大脑中奖励学习的一些以前无法解释的特征提供了一个深刻而简约的解释,并由此开辟了研究大脑多巴胺系统的新途径。可谓是人工智能研究反哺神经科学/脑科学的典范。
详细介绍可以查看:脑机头条 第30期| 《Nature》最新研究:大脑中存在分布式强化学习机制
下面是两分钟的论文解读,OpenAI大规模深度强化学习玩DOTA2
*凡来源非注明"原创"的所有作品,均为转载,其目的在于促进信息分享交流,不做商业用途。若有侵权,请及时通知后台,管理人员删侵。
更多阅读
脑机头条第1期| 意念实时转语音:Facebook的非植入式脑机接口,解码准确率达到76%
脑机头条 第3期| 厉害了!机器人“鲁班”完成全国首例机器人辅助全脑血管造影手术
脑机头条 第4期| 国家神经系统疾病临床医学研究中心重庆分中心揭牌成立
科技部关于对科技创新2030—"新一代人工智能"重大项目2020年度第一批项目申报指南征求意见的通知
脑机头条 第8期| 自然指数2019全球十大科研机构榜单公布: 中科院超哈佛夺第一!
脑机头条 第9期| 可以用意念控制电子设备,还能玩游戏:这台脑机接口亮相CES 2020
脑机头条 第10期| 最全!2019年度国家自然科学奖、国家技术发明奖和国家科学技术进步奖
脑机头条 第11期| 清华和中国工程院联合发布"AI 2000人工智能全球最具影响力学者"
脑机头条 第12期| 高小榕教授: 脑机接口技术让人机共融成为可能
脑机头条 第13期| 欧洲首获医学认可,脑机设备Flow改变抑郁症疗法!疗效不变副作用更小
脑机头条 第15期| 全球首例"活体机器人"诞生,可编程修改、能自由移动,未来或有认知能力
脑机头条 第16期| 国内首例! 72岁高位截瘫患者用意念喝可乐、打麻将
脑机头条 第19期| 这所医科大学2019年新增两位脑科学校长
脑机头条 第21期| 马斯克:脑机接口技术将有重大升级,预计今年发布
脑机头条 第24期| 华人神经科学家李晓江被美大学解雇,面临刑事指控
脑机头条 第25期| 让机器也拥有记忆!DeepMind最新发布最新长程记忆模型和建模基准
脑机头条 第26期| 孙剑领衔旷视研究团队开讲:免费中文深度学习课程来了
脑机头条 第27期| 震惊的体验!脑机接口与虚拟现实的结合将会带来非常不一样的体验
脑机头条 第28期| 来自阿里达摩院的最新AI技术:新冠肺炎CT影像识别率达96%