自动化技术论文_稀疏场景下基于理性好奇心的多-智能城市

栏目导航

期刊信息

刊名：智能城市
曾用名：现代生活用品
主办：辽宁省科学技术情报研究所
主管：辽宁省科学技术厅
ISSN：2096-1936
CN：21-1602/N
语言：中文
周期：半月刊
影响因子：0
被引频次：9440
数据库收录：
国家哲学社会科学学术期刊数据库;期刊分类：自科综合
期刊热词：
施工技术,建筑工程,城市,高速公路,建筑,施工管理,水利工程,智慧城市,建筑设计,大数据,施工技术,建筑工程,施工管理,大数据,城市,公路工程,物联网,城市轨道交通,BIM技术,人工智能,智慧城市,智能建筑,BIM技术,城市,BIM,城市建设,物联网,智能化,智能设计,城市规划,

现在的位置：主页 > 期刊导读 >

自动化技术论文_稀疏场景下基于理性好奇心的多

来源：智能城市 【在线投稿】栏目：期刊导读时间：2022年05月31日 10:54:44

【作者】网站采编

【关键词】

【摘要】文章摘要:近来强化学习越来越多的应用于多智能体系统。强化学习中奖励信号起着引导智能体学习的作用，然而，多智能体系统任务复杂，可能在任务结束时才能获得环境的反馈，造成

文章摘要:近来强化学习越来越多的应用于多智能体系统。强化学习中奖励信号起着引导智能体学习的作用，然而，多智能体系统任务复杂，可能在任务结束时才能获得环境的反馈，造成奖励稀疏，导致算法收敛速度和效率大大下降。针对此类稀疏奖励问题，本文提出一种基于理性好奇心的多智能体强化学习方法。首先，受内在动机理论的启发，将好奇心思想扩展到多智能体中，提出理性好奇心奖励机制，利用一种分解求和的网络结构将不同排列的联合状态编码到同一特征表示，减少联合状态的探索空间，将网络的预测误差作为内在奖励，引导智能体去探索新颖且有用的效用状态；其次，引入双值函数网络对Q值进行评估，采用最小化算子计算目标值，缓解Q值过估计和方差，采用均值优化策略，提高样本利用。最后在追捕任务和合作导航任务的实验环境中进行了评估，在最困难的追捕任务中相较于基线算法胜率提高了15%左右，所需时间步降低了20%左右，在合作导航任务中也有较快的收敛速度，评估结果证明了该方法的有效性和通用性。

文章关键词:

论文DOI:10.19678/j.issn.1000-3428.0064365

论文分类号:TP18

文章来源：《智能城市》网址: http://www.zncszz.cn/qikandaodu/2022/0531/2309.html

上一篇：自然地理学和测绘学论文_PNT智能与智能PNT
下一篇：自然地理学和测绘学论文_智能城市地下空间信息