版权归原作者所有,如有侵权,请联系我们

迁移强化学习研究进展

CCF计算机科普
由中国计算机学会主办,提供优质的计算机科普内容。
收藏
视频简介: 在本次报告中,将介绍近期在迁移强化学习方面做的三个工作。一是用于非稳态马尔科夫博弈任务的深度贝叶斯策略重用方法,二是基于策略重用思想的策略迁移框架,三是基于鲁棒环境推理的策略自适应方法。

内容资源由项目单位提供