版权归原作者所有,如有侵权,请联系我们

基于博弈论的多智能体信任区域策略优化

CCF计算机科普
由中国计算机学会主办,提供优质的计算机科普内容。
收藏
视频简介: 作者主要介绍了用博弈论的工具,将信任区域策略优化用于多智能体,在多智能体深度强化学习里,以梯度博弈的角度去分析。

内容资源由项目单位提供