PRICAI 2016国际人工智能大会论文解析 | 探索强化学习中多个动作之间的关系

2016-08-25 10:31:17     作者:章敏      来源:雷锋网

PRICAI 2016是环太平洋国际人工智能会议 ,每两年举行一次,大会专注于人工智能的理论,技术及其在社会领域的应用,和其对于太平洋沿岸国家经济的重要性

导读:PRICAI 2016是环太平洋国际人工智能会议 ,每两年举行一次,大会专注于人工智能的理论,技术及其在社会领域的应用,和其对于太平洋沿岸国家经济的重要性。

探索强化学习中多个动作之间的关系(Exploring Multi-action Relationship in Reinforcement Learning)

 

摘要:很多现实生活中的强化学习问题,要求代理同时控制多个行动。在这种情况下进行学习,以前,每一个动作通常和其他动作分开处理。然而,在应用中多个行动之间几乎很少独立进行,而且利用行动之间潜在的关系,可能有助于加快学习。本文探讨了强化学习中多个行动之间的关系。我们提出执行一个正则项来捕获多行动之间的关系。我们将正则项具体化到最小二乘策略迭代和时域差分法中,这有效的解决了凸学习目标。所提出的方法已在几个领域中被证实有效。实验结果显示具体化多动作之间关系能有效提高学习性能。

作者简介

俞杨(Yang Yu)

邮箱:yuy@lamda.nju.edu.cn

职位:南京大学计算机科学与技术系副教授/LAMDA Group

研究方向:人工智能,进化的机器学习,强化学习

相关学术论文:

·High-dimensional derivative-free optimization

·Pareto optimization

 汪涵(Han Wang)

邮箱:wangh@lamda.nju.edu.cn

职位:南京大学计算机科学与技术系理科硕士/LAMDA Group

研究方面:机器学习,数据挖掘,强化学习

via:PRICAI 2016

 PS : 本文由雷锋网(搜索“雷锋网”公众号关注)独家编译,未经许可拒绝转载!

 论文原文下载


返回沙发首页  
沙发管家微信
扫描关注沙发管家微信 QQ群: 沙发网官方群 微博:

资讯评论

亲,你需要登录后才能进行评论喔!

还没有评论,快来抢沙发吧!

提示

热门设备安装方法 查看更多>>

最新设备

智能电视 / 盒子评测

安装指南

应用

热门专题