|
|
|
| 基于信息素机制的改进Q学习路径规划算法 |
| 罗熙王建宏丁勇军张金龙 |
| 江西理工大学电气工程与自动化学院 |
|
|
|
|
摘要 在求解路径规划问题上,Q学习因Q表初始化不合理以及行为策略的随机性,可能会导致算法收敛速度慢甚至易在搜索前期就陷入局部最优解。针对上述问题,本文引入信息素来对智能体的寻优范围进行优化,以提高智能体的搜索效率;利用获取到的环境信息对Q表的初始化进行差异性赋值,减少前期探索的盲目性,加快搜索速度;依照同步更新的信息素表对Q学习中智能体行为策略的探索率进行动态调整,使得算法保持一个合适的探索率而不致陷入局部最优。最后,在几种不同风格的栅格地图中进行仿真实验,验证了所提算法的有效性和可行性。
|
|
| 关键词 :
Q学习,
路径规划,
蚁群算法,
信息素,
探索率
|
|
|
| 基金资助:江西省自然科学基金面上资助项目(20232BAB201015); |
| [1] |
程志广刘建胜. 基于改进蚁群算法的设备拆卸序列规划及系统仿真[J]. 南昌大学学报(工科版), 2022, 44(4): 391-. |
| [2] |
钱信 吕成伊 宋世杰. 基于优化Q-learning算法的机器人路径规划[J]. 南昌大学学报(工科版), 2022, 44(4): 396-. |
| [3] |
陶丽文刘建胜. 一种多班级离散型教与学算法求解路径规划问题[J]. 南昌大学学报(工科版), 2022, 44(3): 282-. |
| [4] |
高翔马少斌张成文. 一种基于深度Q学习的移动自组网稳定路由[J]. 南昌大学学报(工科版), 2022, 44(1): 91-. |
| [5] |
刘建胜叶世鹏. fishbone仓储布局下的订单实时分配与拣货路径规划[J]. 南昌大学学报(工科版), 2021, 43(2): 165-. |
| [6] |
胡从立;陈金平;徐敏; . 基于改进蚁群算法的含分布式电源的配电网重构[J]. 南昌大学学报(工科版), 2013, 35(01): 66-. |
| [7] |
曾明如;王从庆;刘公法;刘亮. 基于元胞自动机的移动机器人路径规划[J]. 南昌大学学报(工科版), 2012, 34(03): 287-. |
| [8] |
曾勍炜; 徐知海; 付爱英; 邓庚盛. 融合蚁群算法与支持向量机的网络流量预测[J]. 南昌大学学报(理科版), 2011, 35(04): 1-. |
| [9] |
严晓兰 徐冬蓉. 论网络文化环境下大学生职业素质的培养[J]. 南昌大学学报(人文社会科学版), 2008, 39(05): 152-155. |
| [10] |
白似雪; 黄美玲. 一种改进的求解多目标优化问题的蚁群算法[J]. 南昌大学学报(理科版), 2008, 32(04): 1-. |
|
|
|
|