|
|
基于优化Q-learning算法的机器人路径规划 |
中国电子科技集团公司第三十六研究所 南昌大学信息工程学院 |
|
|
摘要 针对传统Q-learning算法在路径规划中存在收敛速度慢、难以平衡探索与利用的关系等问题,采用改进后的势场对Q-learning算法的Q表初值进行优化,引入多步长策略减少算法的迭代次数和路径中的拐点个数,加入动态调节贪婪因子平衡探索与利用的关系。仿真结果证明,与Q-learnig算法相比,改进后的IMD-Q-learnig算法可将最优路径长度缩短79.09%,拐点个数减少46.67%,算法效率提升88.40%。
|
|
关键词 :
Q-learning算法,
路径规划,
移动机器人,
多步长
|
|
基金资助:国家自然科学基金项目(71563028)~~; |
[1] |
陶丽文刘建胜. 一种多班级离散型教与学算法求解路径规划问题[J]. 南昌大学学报(工科版), 2022, 44(3): 282-. |
[2] |
刘建胜叶世鹏. fishbone仓储布局下的订单实时分配与拣货路径规划[J]. 南昌大学学报(工科版), 2021, 43(2): 165-. |
[3] |
李姗姗宋振中倪春赵武. 基于MYO手环的移动机器人控制系统设计[J]. 南昌大学学报(理科版), 2018, 42(5): 506-. |
[4] |
曾明如;王从庆;刘公法;刘亮. 基于元胞自动机的移动机器人路径规划[J]. 南昌大学学报(工科版), 2012, 34(03): 287-. |
[5] |
陈世明; 聂森; 郑丽楠; 孙超峰. 模糊空间中基于人工势场的移动机器人运动规划[J]. 南昌大学学报(工科版), 2010, 32(02): 1-. |
|
|
|
|