搜索
您的当前位置:首页正文

基于改进型蚁群算法的AUV路径规划

来源:哗拓教育
DOI:10.195576.enki.1001—994.4.2017.03.001 基于改进型蚁群算法的AUV路径规划 董凌艳 .一.徐红丽 (1.中国科学院沈阳自动化研究所机器人学国家重点实验室,沈阳110016;2.中国科学院大学北京100049) ,摘要:在已知障碍物的环境中寻找一条从起点到终点的无碰路径即为路径规划 扩展改进 型蚁群算法应用背景,应用于智能水下机器人(AuV)的路径规划。为改善传统蚁群算法在 实际应用中的不足,提出加入再励学习机制的改进型蚁群算法。通过对蚁群信息素更新实 行奖惩制度后,改善蚁群算法搜索求解缓慢,易陷入局部最优解而产生停滞现象,提高算 法的搜索速度及寻优能力,能够明显地提高路径规划的效率。仿真结果验证了改进算法的 有效性。 关键词:路径规划;蚁群算法;再励学习;D1j kstra算法;信息素更新;自治水下机器人 中图分类号:TP273 文献标志码:A 文章编号:1001—9944(2017)03—0001—04 AUV Path Planning Based on Improved Ant Colony Algorithm DONG Ling-yah1,2,XU Hong—li (1.State Key Laboratory of Robotics,Shenyang Institute of Automation,Chinese Academy of Science,ShenyaRg 110016, China;2.University of Chinese Academy of Sciences,Beijing 100049,China) Abstract:Path planning is meant by looking for a path without collision from the start point to target point in an environment which the obstacle is known.Improved ant colony algorithm is extended tO the area of path planning for autonomous underwater vehicle.namely AUV for shon.To improve the drawbacks of traditional ant colony algorithm in practical印plieation,an improved ant colony algorithm based on reinforcement learning is proposed.The ant algo— rithm’S shortcomings of slow in search and easy in trapping into local optimal solution are improved with the usage of reward and punishment in the update of ant colony pheromone.Improve the search speed and optimization ability f tohe algorithm eaR obviously improve the eficifency of path planning.Simul ̄ion results verify the effectiveness of the improved algorithm. Key words:path planning;ant colony algorithm;reinforcement learning;Dijkstra lgoairthm;pheromone update;autonomous underwater vehicle(AUV) 海洋蕴藏着丰富的矿物资源、生物资源以及能 源,是人类可持续发展的财富,因此对海洋的开发成 为各国的战略重点。常见的水下机器人包括遥控机器 人ROV和自治水下机器人AUV。AUV由于其自主 性而受到广泛应用【l1。导航是实现机器人从起始位 收稿日期:2016—12—02;修订日期:2017—01—14 置到目标位置无碰撞且不丢失的一个过程,包括定 位、路径规划及运动控制3个部分。路径规划是导 航中最重要的一部分。由于机器人在各个领域中都 扮演重要角色.路径规划的研究得到了快速发展[21。 路径规划是在一定环境下,规划或寻找一条从 基金项目:中国科学院国防创新项目(CXJJ一15M031) 作者简介:董凌艳(1992一),女,博士研究生,研究方向为水下对接等。 茸动纪与 蓑2017,32p) ■ 起始状态(包括位置和姿态)到目标状态的无碰安 全路径。路径规划需要解决3个问题:从起点到目 标点的运动;运用一定算法实现避障,且经过必经 点:满足上述要求后,轨迹优化。路径规划根据工作 环境不同可分为2种:基于模型的全局路径规划 (静态路径规划)。作业环境全部已知;基于传感器 的局部路径规划(动态路径规划),作业环境全部未 知或部分未知。常用的路径规划方法有可视图法、 自由空间法、最优控制法、栅格法、拓扑法。 随着发展,遗传算法、模糊集理论和神经网络 等许多人工智能算法也应用到了路径规划领域[31。 AUV在海洋环境中工作区域宽阔,障碍物稀疏。 AUV所处环境属于大范围开放的三维空间。三维路 径规划十分复杂,难度较大,且大部分路径规划适 用于二维空间。AUV在水下作业大部分时间是在 同一深度航行,所以可以将三维路径规划转化为 二维路径规划。由动力学原理知,AUV航艏向以顶 流姿态是最省力和稳定的。因此路径规划时尽量使 AUV的姿态满足顶流要求f41。AUV水下携带能源有 限,水的黏性阻力等阻力因素更会增加AUV的能 耗,所以选择长度代价小的路径有利于节约AUV的 能源。 传统的路径规划方法都存在一定的缺陷,例如 遗传算法在解决大规模问题时编码困难,时空消耗 大。文献[5]指出将遗传算法与分层规划思想结合, 能有效克服遗传算法的不足。遗传模拟退火算法结 合分层路径规划思想。克服遗传模拟退火算法早 熟、局部寻优能力差的缺点嘲。基于栅格模型的改进 蚁群算法采用折返迭代方式.采用惯性原则和最大 信息素搜索策略使蚂蚁对最优路径更加敏感,提高 算法的效率和稳定性【7J。蚁群算法用于路径规划时, 由于蚁群算法具有一定的随机性,蚁群数量大,所 以算法寻优缓慢,且存在局部最优等问题。再励思 想加入蚁群算法能提高寻优效率,改善算法性能。 1蚁群算法描述 1.1算法基本原理 蚁群算法是20世纪9O年代提出的一种新型 进化算法,源于对蚂蚁的研究。蚂蚁在寻找食物时, 在走过的路径上释放一种称为信息素的分泌物,信 息素保留一定的时间,后续蚂蚁能够察觉信息素的 存在,选择信息素浓度较高的路径并且经过时留下 目 自己的信息素。假设有2条路径AB和CD,AB的长 度是CD的2倍。初始时,这2条路径都没有信息 素.蚂蚁选择路径的概率各为1/2。由于路径长度不 同.在一段时间内经过CD的蚂蚁数量是AB的2 倍,CD路径上信息素浓度就是AB段信息素浓度的 2倍。这样,蚂蚁选择CD的概率大于选择AB的概 率,随着时间的推移,选择CD的概率越来越大,最 终完全选择CD。蚁群算法具有启发性、较强的鲁棒 性、优良的分布性、易于与其它算法结合网。 1.2算法基本流程 蚁群算法的基本流程为①建立空间模型;②规 划初始路径;③初始化算法参数;④开始搜索;⑤蚂 蚁到达终点;⑥信息素更新;⑦判断算法是否结束, 未结束跳至④,结束了则至⑧;⑧得到最优路径。 1.3建模及初始化路径 步骤采用Maklink构建二维路径规划的空间模 型。Maklink线定义为障碍物之间不与障碍物相交 的顶点之间的连线。以及障碍物顶点和边界的交 线。Maklink线构造二维空间。Maklink图上存在l条 自由链接线,链接线的中点及起点和终点构成初始 路径规划的无向网络图。 Dijkstra算法用于计算单源最短路径,就带权图 中所有节点分成2组,以确定最短路径组和未确定 最短路径组。按最短路径长度递增顺序逐渐将未确 定组中的点加入到已确定组中,直到所有节点都包 含在已确定最短路径组。利用Dijkstra算法得到一 条从起点到终点的次最优路径。路径依次经过链接 线L (i=1,2,…,d),其端点为 m, ‘”,链路上其它 点表示为 Pi(h )=只‘。 +( (1)pi 。 ) h ∈[0,1](i=1,2,…,d) (1) 式中:h 为比例参数;d为链路划分节点数。只要给 定一组h参数即可得到新路径,蚁群算法的解表示 为(h-,h2,…,h )。 1.4蚁群转移规则 蚂蚁寻找下一节点按照一定的转移规则,与信 息素浓度及启发信息有关。蚂蚁在链接线上厶选择 下一链接线厶+ 上‘,节点的方法为 r ,I l I B I、 jlargmaxk ,【l I , l J,q≥qo … J -0thers 式中:i为链接线上的点;q为[0,1]之间的随机数; q。为[0,1]之间可调参数; . 为启发值; m为信息 素浓度。.,的计算方法为首先计算 到 的选择概率 P ,以此为根据,应用轮盘赌法找到下一节点 ,P 的计算方法为 pi,j-- —— — 一 上O ̄EITi, 叼i. 径的代价值作为再励信号,对较优的人工蚂蚁进行 奖励.对较差或者失败的人工蚂蚁进行惩罚,加 入再励机制后,提高较优路径的信息素浓度.降低 较差路径信息素浓度,使人工蚂蚁更倾向于较优路 (3)(j  径。另一方面,增加了未选择路径和已选择路径信 息素的对比,提高算法的寻优能力。在基本的蚁群 1.5信息素更新 信息素是影响蚁群算法的关键因素,分为局部 算法中,局部信息素更新中为预设值不变.改进 的局部信息素更新基于路径代价加入奖励惩罚制 信息素更新和全局信息素更新。实时信息素更新是 蚂蚁走过每个节点后对该节点的信息素进行更新, 其公式为 ,产(1-p)rl,j+P'ro (4) 式中:I"o为信息素初始值;P为[0,1]区间的可调参 数。当所有蚂蚁走过全部节点后,完成依次迭代搜 索,选择其中的最短路径进行全局信息素更新: =, (1-p)'ri,』+|p△ , A'7"i=. I/L (5) 式中:£‘为最短路径长度嘲。 2 改进算法 蚁群算法具有随机性,蚁群数量大,迭代次数 多,所以蚂蚁构造出的路径优劣程度不同。有些蚂 蚁甚至不能成功构造路径。如果蚂蚁在迭代过程中 构造劣质路径或不能成功构造路径可能会使算法 过早收敛或者搜索失败。为了改善蚁群算法的此类 缺陷,将再励学习机制引入到信息素更新机制中. 提高蚁群算法的性能。 2.1 再励学习 再励学习把学习看作试探评价的过程,用图1 描述。学习机输出一个动作作用于环境。环境接收 输出动作状态发生变化,产生奖励或惩罚的再励信 号反馈给学习机,学习机根据环境当时的状态以及 反馈的奖励或惩罚信号选择下一步的动作信号,选 择动作信号的原则是使受到正再励即奖励信号的 概率越来越大[1Ol。 图1再励学习系统 Fig.1 Reinforce learning system 2.2改进信息素更新 在蚁群算法信息素更新过程中以蚂蚁构造路 廖动 与 蓑2017,32(3) 度.即: 下 ,产(1-p) ̄'i,+pA ̄- △丁:{【0 ((nW ( ))) ((人工蚂蚁构造解失败)人工蚂蚁构造解成功 ( 6) 式中:W (t)为当前迭代中第k只人工蚂蚁所构造 路径的综合代价值。由此可见,当人工蚂蚁构造路 径越优,其代价值越小,得到奖励,其局部更新中 信息素增量Ar越大.对应路径上信息素保留的越 多,后续迭代中被选择的概率就大。如果人工蚂 蚁构造的路径代价值大或者无穷大,受到惩罚,其 局部信息素更新中信息素增量△ 越小.对应路径 上信息素保留的越少,在后续迭代中被选择的概率 越dx[n] 3仿真与分析 仿真实验算法流程如图2所示。 l MAKuNK图论法建模 I D k t 法生成初始路径 【 初始化参数 1r' II蚂蚁迭代寻优, 局部信息素更新 寻找最短路径.全局信息素更新 N 图2算法流程 Fig.2 Algorithm flow chart 在有障碍的环境内,应用MAKLINGK图理论 构造如图3所示的二维规划空间。 利用Dijkstra算法获得初始最短路径。算法流 程为①初始化2个集合 和s,分别存放未确定和 已确定最短路径集合点,利用带权图初始化原点到 ■ ∞舳∞∞加∞∞∞∞∞0 !vl0 i : i ;v2O : : : :v19 v16 40 6o 8O l00 l20 104 160 180 20o (kin) 图3无向网络图 Fig.3 Undirected network diagram 其他节点的最短路径长度D,其中有连接弧的对应 值是其弧的权值,否则为极大值;②选择原点到点i 的最短路径长度D[i],将点从集合 移至集合S;③ 根据节点i更新数组D中源点到集合 中的节点k 对应的路径长度值;④重复②③找到原点到所有节 点的最短路径。通过以上算法得到图4。 x/(km) 图4初始最短路径 Fig.4 Initial shortest path 初始化最短路径后,得到初始最短路径经过的 链接线。每条链接线上10等分得到等分点作为采 样点。计算采样点之间的距离d,寻找所有采样点之 间的最短距离d 和最长距离d 。从节点i到节点 的代价计算为: cost= : dHIax—dIIlin COST=∑cost (7) 式中:COST为已选择路径代价值与待选择节点的 代价和.作为再励学习机制奖惩标准。标准改变将 会影响算法的迭代效果。当代价小于一定值时,给 予奖励,局部更新中信息素衰减后的增量△ 大,当 代价大于一定值时,给予惩罚,局部更新中信息素 衰减后的增量Ar为零。加入再励学习机制的蚁群 算法。最后得到的迭代曲线和基本蚁群算法得到的 迭代曲线的对比如图5所示。 ■ ∞舳∞∞加∞∞∞∞加0 图5改进蚁群算法和基本蚁群算法迭代曲线 Fig.5 Improved ant colony algorithm and basic ant colony algorithm iterative curve 由图可见,加入再励机制的改进蚁群算法较基 本蚁群算法寻优更快,迭代曲线更加稳定。 4 结语 介绍了传统AUV路径规划的方法和特点,以 及基本蚁群算法的原理、流程与不足。将再励机制 引入到蚁群算法中,利用MAKLINK建立二维规划 空间模型.Dijkstra算法得到初始次优路径。在局部 信息素更新中加入奖惩再励信号。仿真验证了改进 型算法的有效性,改善了蚁群算法搜索求解时陷入 局部最优解而产生停滞现象,提高了算法的搜索速 度及寻优能力.能够明显地提高了路径规划的效率。 参考文献: …1 李哗,常文田,孙玉山,等.自治水下机器人的研发现状与展望lJ】. 机器人技术与应用,2007,20(1):25—31. [2]张捍东,郑睿,岑豫皖.移动机器人路径规划技术的现状与展望 .系统仿真学报,2005,17(2):439—443. [3】张巧荣.智能水下机器人分层全局路径规划方法研究[D].哈尔 滨:哈尔滨工程大学,2002:1-83. 【4]彭艳,顾国昌.基于遗传算法的水下机器人大范围路径规划【JJ.应 用科技,2003,30(2):18—21. f5】顾国昌,付岩,刘海波.基于遗传模拟退火算法的水下机器人路 径规划【J】.哈尔滨工程大学学报,2005,26(1):84—87. [6]王沛栋,冯祖洪,黄新.一种改进的机器人路径规划蚁群算法[J]. 机器人。2008,30(6):554—560. 【7]覃刚力,杨家本.自适应调整信息素的蚁群算法Ⅲ.信息与控制, 2002,31(3):198—201. [8】史峰,王辉,郁磊,等.MATLAB智能算法3O个案例分析【M].北 京:北京航空航天大学出版社,2011:217—227. [9】张云.一种基于模糊神经网络采用再励学习的PID控制器【D1.曲 阜:曲阜师范大学,2003:1-51. 『10]陈岩,苏菲,沈林成.概率地图UAV航线规划的改进型蚁群算法 【J].系统仿真学报,2009,21(6):1658—1663. ■ Automation&Instrumentation 2o17,32(3) 

因篇幅问题不能全部显示,请点此查看更多更全内容

Top