武器工业与军事技术论文_基于SAC算法的作战仿-智能城市杂志社投稿

栏目导航

期刊信息

刊名：智能城市
曾用名：现代生活用品
主办：辽宁省科学技术情报研究所
主管：辽宁省科学技术厅
ISSN：2096-1936
CN：21-1602/N
语言：中文
周期：半月刊
影响因子：0
被引频次：9440
数据库收录：
国家哲学社会科学学术期刊数据库;期刊分类：自科综合
期刊热词：
施工技术,建筑工程,城市,高速公路,建筑,施工管理,水利工程,智慧城市,建筑设计,大数据,施工技术,建筑工程,施工管理,大数据,城市,公路工程,物联网,城市轨道交通,BIM技术,人工智能,智慧城市,智能建筑,BIM技术,城市,BIM,城市建设,物联网,智能化,智能设计,城市规划,

现在的位置：主页 > 期刊导读 >

武器工业与军事技术论文_基于SAC算法的作战仿

来源：智能城市 【在线投稿】栏目：期刊导读时间：2021-08-25 11:52

【作者】网站采编

【关键词】

【摘要】文章摘要:[目的]现有作战推演仿真系统主要基于作战规则和经验知识作决策，但存在应用场景有限、效率低、灵活性差等问题。为此，提出了一种基于深度强化学习(DRL)技术的智能决策

文章摘要:[目的]现有作战推演仿真系统主要基于作战规则和经验知识作决策，但存在应用场景有限、效率低、灵活性差等问题。为此，提出了一种基于深度强化学习(DRL)技术的智能决策模型。[方法]首先，建立仿真推演的最大熵马尔科夫决策过程（MDP）；然后，以actor-critic (AC)体系为基础构建智能体训练网络，生成随机化策略以提高智能体的探索能力，利用软策略迭代更新的方法搜索更优策略，不断提高智能体的决策水平；最后，在仿真推演平台上对决策模型进行验证。[结果]结果表明，利用改进SAC决策算法训练的智能体能够实现自主决策，且与深度确定性策略梯度（DDPG）算法相比，获胜概率约提高了24.53%。[结论]所提出的决策模型设计方案可以为智能决策技术研究提供理论参考，对作战仿真推演具有重要借鉴意义。

文章关键词:作战推演,自主决策,深度强化学习,软策略迭代,最大熵,

论文作者:王兴众王敏罗威

作者单位:中国舰船研究设计中心

论文DOI: 10.19693/j.issn.1673-3185.02099

论文分类号: E91

相似文献:基于军事规则的无人坦克集群协同作战仿真.....作者:王春艳,任浩,匡敏驰,武丹凤,曹向舒,史恒,刊载期刊：《系统仿真学报》
一种基于可变规则的松耦合实体建模方法.....作者:杨正,向智敏,马世文,刊载期刊：《系统仿真学报》

文章来源：《智能城市》网址: http://www.zncszz.cn/qikandaodu/2021/0825/1813.html

上一篇：外科学论文_机器人辅助直接上方入路人工全髋
下一篇：电力工业论文_面向换流阀状态监测用传感器节