原文:Adaptive virtual leader–leader–follower based formation switching for multiple autonomous tracked mobile robots in unknown obstacle environments
地址:https://www.sciencedirect.com/science/article/pii/S0016003224001832?dgcid=author
原作者:黎星华, 刘晓平等
编译:董亚微@一点人工一点智能
注:本文经原作黎星华博士授权,如需转载,欢迎联系
入群邀请:8个专业方向交流群
摘要:本文研究了一组自主跟踪移动机器人(ATMRs)在未知障碍环境中的编队切换问题。
首先,本文设计了一种新颖的虚拟领导者-领导者-跟随者的编队结构模型,其中领导者跟踪由参考轨迹确定的虚拟领导者,而跟随者则跟踪由虚拟领导者指定的期望位置。随后,开发了一种动态优化的编队切换策略,其中领导者实时计算编队调整因子,根据环境约束动态调整编队参数。
此外,本文提出了一个综合的性能评估指标体系,用于评估编队切换效率,利用了ATMR运动学的固有简单性。最后,我们进行了大量数值模拟和物理实验,验证了所提出策略的有效性。
介绍
目前,对多智能体系统的协同控制在民用和军事领域越来越受到关注,因为它在协同物体运输[1]、搜索和救援[2]、追踪和监视[3]、环境监测[4]、空间和地面探索[5]等方面有着广泛的应用。从运动方式的角度来看,地面自主移动机器人可以分为轮式、履带式和腿式机器人。履带式机器人因其能够适应各种地形环境而脱颖而出。这归功于履带与地面的大接触面积、强大的附着力和出色的克服障碍能力[6,7]。这些优点增加了在需要可靠性、机动性和越障能力的应用中对履带式机器人的需求[8]。
多个自主履带移动机器人(ATMRs)的协同控制面临的挑战在于如何在穿越狭窄的走廊或有障碍物的通道时迅速改变形态。到目前为止,由于自主履带移动机器人的重量和宽大的履带,它们遇到了严重的转向困难,导致形态转换缓慢。本研究的目标是为ATMRs建立一种高效的形态切换方法,该方法与环境约束相一致,同时最小化形态调整时间和能量消耗。
目前,对多智能体系统形态切换模式的现有理论研究可以大致分为两类。
第一类是静态形态切换,即多智能体系统从一个固定形状直接转换到另一个形状。许多有价值的形态切换策略方案被提出。Desai等人[9]提出了一种形态切换策略。这种策略结合非线性控制理论和图论,使移动机器人团队在穿越充满障碍物的地形时能够自动过渡到单列或双列形态。然而,这种方法没有有效解决形态变化的优化问题。在文献[10]中,多个机器人的原始三角形态被分成一列形态和一个小三角形态,每个机器人组独立避开障碍物。类似地,在文献[11–14]中提出了几种在动态环境中进行形态分割和合并的方法,使机器人团队可以分为较小的子群避免碰撞,并在绕过障碍物后重新组合成原始配置。在文献[15,16]中研究了无人机(UAV)群体的形态重构问题,当出现智能体丢失、障碍物存在或任务规格变化等情况时,形态模式会发生变化。在文献[17]中,引入了一种链路失活规则用于领航员-跟随者形态,用来响应环境变化对网络拓扑进行修改。然而,虽然形态切换方案直接将原始形态转变为列形态方便了穿越障碍区域,但却忽视了形态优化的问题。
第二类是动态形态切换,即多智能体系统具有自主选择适当形态配置以满足当前环境约束的能力。最近的研究越来越关注多智能体系统的动态形态。在文献[18,19]中,采用虚拟连接结构方法设计整个形态作为机械连接,通过调整虚拟关节角度使其能够配置成不同的形态模式。这种方法适用于多个机器人需要穿越狭窄水道的场景。在文献[20–22]中应用基于视觉的领航员-跟随者形态控制方法,通过调整领航员和跟随者之间的角度来生成、维持和转换形态,同时避开障碍物。在文献[23]中提出了一种适用于具有速度约束的多机器人系统的切换形态策略,它使用几何障碍物避障控制方法来计算每个机器人的航点和规划安全路径。然而,为了实现形态的安全转换,需要准确获取所有航点的位置信息。在文献[24]中可以找到基于距离的多智能体系统形态缩放策略,通过修改有向图中领导者的边来调整期望形态的大小。
上述论文提到了多个关于编队切换的问题和挑战。首先,对于衡量编队切换效率的性能评估指标体系非常重要。
在文献[25]中,提出了五个性能指标,包括鲁棒性、收敛速度、功耗、灵敏度和系统效率。此外,还进行了五种不同信息拓扑连接的性能比较。然而,这些性能比较过程和分析仅限于单个规则六边形障碍物。文献[26]设计了一种基于路径规划的优化方法,通过最小化行程成本来实现一组机器人之间的编队切换。然而,它未考虑与改变编队或绕过危险区域相关的额外成本。文献[27]提出了一种动态和优化的多机器人编队切换策略,适用于未知障碍环境中的机器人操作。通过优化三种编队规避模式的选择,即无编队切换、同构切换和异构切换,实现了动态最优的领导者-跟随者结构。此外,为了评估异构编队切换的性能,定义了一个环境适应性函数,其中包括能量消耗比、编队切换收敛比和编队畸变程度。然而,能量消耗模型依赖于复杂的机器人动力学,使其在实际应用中具有挑战性。
然而,尽管上述工作成功地实现了多智能体系统在环境约束下达到期望的编队配置,但仍存在一些问题。
首先,传统的领导者-跟随者结构在一些情况下可能会过于依赖领导者,如果领导者出现故障,可能导致系统崩溃,并且可能会产生领导者和跟随者之间的层次错误。虚拟领导者-跟随者模型可以解决这些问题,但它具有刚性结构,限制了调整编队形状的能力。
其次,许多编队切换策略都集中在固定配置、基于角度和距离的动态配置上,但在环境约束下的编队优化问题尚未得到充分解决。此外,大多数相关工作都是在仿真环境中进行的,并未在实际实验中进行验证。
第三,很少有研究建立全面的编队切换性能评估指标体系。文献[27]提出的性能评估指标体系仅适用于异构编队转换,并且其中的能量损失率指标是基于机器人动力学构建的,具有复杂性和难以应用性。其他研究主要关注优化行程距离和时间。
综上所述,编队切换仍然是一个具有挑战性的研究领域,需要进一步解决上述问题,并在实际应用中进行验证。
为此,本文提出了一种基于自适应虚拟领导者-领导者-跟随者的多个ATMR在未知障碍环境中进行编队切换的方法。与现有研究相比,本文的主要贡献总结如下:
(1) 引入了虚拟领导者-领导者-跟随者编队结构模型,旨在解决传统的领导者-跟随者模型中跟随者对领导者过度依赖以及虚拟领导者-跟随者模型中编队形状无法灵活调整的问题。该设计确保领导者负责规划和协调整个系统,同时确保其行为不会干扰跟随者的运动状态。
(2) 提出了自适应编队切换策略,包括四种模式:无编队切换、同构编队切换、异构编队切换和处理异常状态。在该策略中,领导者能够通过实时计算编队调整因子来动态调整编队配置。该因子基于环境信息和当前编队形状确定。此外,该策略通过数值仿真进行验证,并与其他编队切换策略进行比较,然后通过三个实际ATMR在不同障碍区域进行实际应用。
(3) 引入了一个新的综合性能评估指标系统,包括能量损失比函数、编队调整时间比函数和编队畸变度函数。该评估系统仅依赖于机器人的基本运动特性,确保其具有普适性。所提出的性能评估指标系统也可以在其他多智能体系统中使用。
图1 虚拟领导者-领导者-跟随者的几何结构模型
本文的剩余部分组织如下:第2节介绍基本的前提条件和关键的研究问题。第3节介绍主要的研究结果。第4节和第5节分别提供数值模拟和物理实验。第6节总结了本文,并展望了未来的研究方向。
符号说明:
、
、
和
分别表示实数集、𝑛维实数集、
维实数集和正实数集。
表示自然数集。对于矩阵
,
和
分别表示其转置和欧几里得范数。
表示实数的绝对值。
初步知识与问题描述
2.1 虚拟领导者 – 领导者 – 追随者编队结构
考虑一个由
个索引为 1、2、…、
的 ATMR 组成的多机器人系统。虚拟领导者- 领导者-跟随者的编队几何形状如图 1 所示,其中虚拟领导者
的位置由参考轨迹点确定。
其中一个ATMR被指定为领导者
,而其他 ATMR 则充当跟随者
。领导者利用其车载传感器(例如激光雷达或摄像头)实时检测前方通道中的变化。然后,它将每个跟随者与领导者之间的期望距离和方位角约束转换为它自己与虚拟领导者之间的期望约束。
在实际应用中,由于其内部空间的限制,定位传感器很难安装在几何中心的 ATMR 中。
受相关工作 [32,33] 的启发,我们选择了一个偏差点
沿第 𝑖 个ATMR的方向轴,距离重心为
,以表示其实际位置。在图1中,
表示其在惯性系 𝑂𝑋𝑌 中的偏航角,
和
表示其满足速度约束的线速度和角速度。
和
分别表示虚拟领导者相对于惯性系的的位置和偏航角。
图2 几种典型的编队形状
将第𝑖个 ATMR 与虚拟领导者之间的距离和方位角定义为
和
,表示如下:
其中,
将第𝑖个ATMR与虚拟领导者之间的期望距离和方位角定义为
和
。将第𝑖个ATMR的期望位置定义为
,可以通过以下方式获得:
此外,此编队结构的数学表示为
。
2.2 编队表示
ATMR的编队表示是编队切换研究的基石。通过建立平面或空间上一些典型编队形状的数学关系,可以大大简化编队转换过程中涉及的数学计算。图2所示,编队形状主要包括线形、列、三角形、楔形、菱形以及圆形等构形。
编队参数矩阵
的一般公式定义为
其中
包含三个参数:
表示ATMR的唯一ID号,
表示ATMR和虚拟领导者之间的期望距离,
表示ATMR和虚拟领导者之间的期望方位角。
那么,ATMRs的所有编队形状都可以统一描述如下:
其中,
中的第一行元素是领导者
的编队参数,其余行是跟随者
的编队参数。
利用图2中描述的几个示例性编队形状,建立了一个与编队形状有关的库,如下所示:
值得注意的是,上述几个典型的编队参数矩阵不能表示此类编队形状的所有可能结构,而只是作为此类形状的一个具体示例,例如,在三角形的情况下,可以通过调整跟随者和虚拟领导者的距离或方位角获得新的三角阵形。但是,可以通过调整
的值来实现所有编队形状。
2.3 问题描述
对于石化工厂、油气田、石油灌区、仓库、森林道路等人员无法接近的高风险、强放射性、易燃易爆等复杂多变的户外环境,必须派遣ATMR执行任务,进入灭火和救援等危险区域。这些ATMR穿越的区域往往是狭窄的走廊或有障碍物的通道,因此编队必须根据当前的环境约束主动选择合适的形状,有效地通过障碍区域。
图3展示了针对三台ATMR构成的多机器人系统在可变障碍物环境中采用的四种不同的编队切换策略。图3(a) 说明了一种静态编队切换模式,其中采用了固定纵队编队切换配置[9,17]。该模式使多机器人系统能够以较高的安全因子穿过障碍区域,但增加了行驶距离和编队不稳定性。另外三种策略属于动态编队切换模式,其中机器人团队调整编队参数以适当收缩原始三角编队,方便在障碍区域中导航。
图3(b)仅专注于调整跟随者和虚拟领导者(或领导者)之间的期望方位角[20-22]。图3(c)强调调整跟随者和虚拟领导者(或领导者)之间的期望距离 [24,27]。图3(d) 同时调整了跟随者和虚拟领导者(或领导者)之间的期望距离和期望方位角。我们的策略使多机器人系统能够根据环境约束动态调整两个编队参数,从而获得最佳编队形状,减少行驶距离并提高切换过程中的编队稳定性。
上面提供的示例只提供了每种编队切换策略的定性比较,缺乏用于综合评估的定量指标。因此,对于多机器人系统自主选择适应当前环境约束的最优编队形状,至关重要的是建立定量性能指标和有效的编队切换方法。为此,本文的研究重点如下:
问题1(编队控制):基于本文设计的虚拟领导者-领导者-跟随者结构,对于多ATMR系统,一个编队控制器是必不可少的。此控制器使系统能够快速形成编队,实时跟踪虚拟领导者,并保持相对于虚拟领导者的期望相对距离和方位角。
问题2(编队切换):为了应对环境障碍物导致通道宽度变化的约束,一种有效的自适应编队切换策略对于多ATMR系统至关重要。该策略使系统能够选择适当的编队形状来穿越障碍区域。
问题3(性能评估):为了有效评估各种编队切换方法的性能并指导选择编队的最优形状,一个简单且合理的性能评估指标体系至关重要。该评估体系仅依赖于简化的机器人运动状态,无需复杂的动态模型,从而确保了其实用性和易于实施。
图3 四种不同编队切换策略的实例
主要结果
在这一节中,将讨论第2.3节中提出的三个问题。首先,采用基于虚拟领导者-领导者-跟随者的编队控制方法来形成和维持期望的编队形状。然后,考虑障碍物通道宽度的变化限制,设计了一种动态优化编队切换策略,以根据环境变化调整编队形状。最后,建立了一个综合的性能评估指标体系来评估各种编队切换策略的有效性。
3.1 基于虚拟领导者-领导者-跟随者的编队控制方法
在本文中,每个ATMR被建模为一阶积分器:
其中,
表示第𝑖个ATMR的控制输入,其中
和
分别是它在惯性系的X和Y方向上的控制输入。
然后,虚拟领导者
也被描述为一阶积分器:
其中
表示虚拟领导者的速度。
本文构建了一个编队控制框架,如图4所示。该框架包含环绕运动控制律和方位角定位控制律。
为了确保ATMR能够以平滑的运动形成期望的编队形状,本文采用了我们最近的研究中提出的两个控制律 [32],该控制律指导每个ATMR收敛到以虚拟领导者为圆心的圆上的特定位置。
环绕运动控制律表示为:
其中,
是第𝑖个ATMR的相对位置调整参数,
是第𝑖个ATMR和虚拟领导者之间的相对位移,
是一个具有转向角
的旋转矩阵,并且
是在初始时间
时从虚拟领导者指向第𝑖个ATMR的单位向量。
图4 编队控制器的结构框架
图5 障碍环境中三个 ATMR 的编队切换示意图
然后,方位角定位控制律表示为:
其中,
第𝑖个ATMR的方位调整参数
3.2 动态优化编队切换策略
为了说明可变障碍环境中的编队切换过程,如图5所示,我们以三个ATMR为例。编队从三角形开始,然后根据通道宽度特征选择最佳形状。
在图5中,编队宽度表示为D,机器人宽度为B,道路宽度为W,边界扩展层宽度设置为B/2。领导者跟踪虚拟领导者的实时位置,利用其上的激光雷达感知环境信息,并提取道路两侧的边界信息以及环境障碍物。然而,像静止车辆这样的大型障碍物可能会阻挡一些激光雷达的信息采集,从而无法获取完整的道路边界点。因此,这些障碍物的检测到的边界点被认为是候选点,并进一步区分以替换丢失的道路边界点。
领导者的激光雷达检测到的道路两侧的边界点坐标为:
其中,
表示第j个有效激光束到道路边界的距离,
表示激光束与道路边界之间的夹角。此外,
,表示第j个有效激光束相对于领导者前进方向的偏转角。
定义领导者到最近边界点
的距离为
。假设与p相对应的扫描角为a,则有
。由此可计算,最近边界点到领导者前进速度
的垂直距离为:
定义
为领导者检测到的最小通道宽度,领导者计算编队调整因子
,表示如下:
其中,
表示初始时间
时的期望编队宽度,其表示为以下形式:
此外,
满足以下关系
其中,
表示编队切换模式。
本文提出的动态优化编队切换策略流程如图6所示,在该场景中,ATMR 团队从事编队跟随任务,领导者利用车载激光雷达感知环境信息,进而计算
的值,根据该值,领导者发布以下四个指令以动态调整编队模式。
(1)
= 0(无编队切换):表示前行通道足够宽,编队只需保持原有形状继续前行,此时编队期望宽度设为
。
(2)
= 1(同构编队切换):表示若编队继续保持原有形状,存在与通道边界发生碰撞的风险,故需适当收缩编队,以保持原有形状通过前行的通道,此时编队期望宽度设为
。
(3)
= 2(异构编队切换):表示前行通道宽度仅足够单台机器人通过,需切换为纵队形状,此时编队期望宽度设为
。
(4)
= -1(异常状态处理):表示前行通道的宽度连单台机器人通过都满足不了,此时控制中心需另行下达终止编队任务或执行新编队路径指令。
综上所述,领导者与虚拟领导者的期望距离和期望方位角设定如下:
其中,
和
表示异常值,表示领导者退出当前编队任务,等待下一条指令。
各跟随者与虚拟领导者的期望距离和期望方位角设定如下:
其中,
表示异常值,表示跟随者退出当前编队任务,等待下一条指令。
图6 提出的动态优化编队切换策略流程图
3.3 综合性能评估指标体系
为了进一步评估各种编队切换策略的性能,本文在文献 [27] 已有的评估体系上进一步改进,改进之处:
· 设计能量损失率函数时,无需考虑机器人的实际输出力矩,即不依赖机器人的复杂动力学,只需要建立机器人行驶距离与能耗之间的函数关系即可;
· 设计编队失真度函数时,无需预先构建固定构型的编队形状库;
· 编队调整时间比函数采用编队切换的总时间与行驶的总时间进行比较,而不仅仅是通过障碍区域编队的总时间,这样就确保了比较是在统一的时间基准下进行的。
之后,建立了一个包含能量损失率函数、编队调整时间比函数、编队失真度函数的新型综合性能评估指标体系。
3.3.1 能量损失率函数
该函数旨在评估编队切换策略的能量效率,它计算编队切换期间的能量消耗与机器人编队总能量消耗的比率。目的是识别在实现期望的编队切换的同时最小化能量消耗的策略。
目前,大多数机器人由车载电池供电,电能消耗对机器人任务的持续时间起着决定性作用。减少编队切换过程中的能量消耗,可以确保机器人实现更长时间的连续运行,因此,有必要建立一个能耗模型。
通常,机器人的功耗是一个复杂函数,它包含电机速度、机器人外形、机器人重量、功效以及风速、道路湍流等外部干扰等多个参数 [34]。
对于能量消耗的建模,我们主要关注其取决于机器人行驶距离的能量消耗,因此,机器人能量与速度之间的函数关系建模如下:
在这里,
表示时间t时机器人i的能量,
是一个非线性映射,
表示时间t时机器人i的速度。
考虑到简化问题,我们假设机器人在静止时的能量消耗为零。假设
是机器人i在初始时间
的初始能量水平,
是单位行驶距离的标准能量消耗率。机器人i在时间t的能量函数可以描述为:
那么,机器人i在时间区间
内的总能量消耗是:
最后,时间区间
内的编队切换总能量损失比函数被定义:
在这里,
和
A分别表示编队在时间区间
内的实际能量消耗和理想能量消耗。需要指出的是,
表示编队在整个时间区间
内保持了其期望的初始配置而没有任何变化。
简而言之,
的值越小,能量消耗越低,机器人能够连续运行的时间就越长。
3.3.2 编队调整时间比函数
该函数旨在评估编队调整过程的效率,它计算编队调整所需的总时间与机器人团队的总行驶时间之比。该指标可用于识别最小化编队调整时间所需的策略,从而提高整个系统的响应时间。
当编队接收到切换命令时,需要一定的调整时间从当前形状过渡到目标形状。为了最小化调整时间,编队调整的效率也是影响编队整体执行效率的关键因素。编队调整时间比作为评估编队切换的关键指标。另一方面,它衡量了编队切换过程的响应能力。总调整时间与总行驶时间的比率表示编队切换收敛的速度。因此,编队调整时间比函数在时间区间
上定义为:
在这里,
表示编队变化的次数,
表示在时间区间
内编队的总切换次数,
和
t表示第k次切换过程中编队从当前形状到目标形状的开始和结束时间。
简而言之,
的值越小,目标形状的转换速度越快,编队的收敛时间越短,整体编队切换效率越高。
3.3.3 编队畸变程度函数
该函数评估编队在切换过程中的畸变程度。它计算当前编队位置与期望编队位置之间的偏差。低畸变程度表示更有效的编队切换策略。该函数有助于识别在切换过程中保持编队完整性的策略。
图7 模拟环境设置和原始编队形态
机器人团队在移动过程中,通道的宽度会发生变化,因此机器人需要适应不断变化的环境条件来调整编队。为了优化编队切换,必须尽量减小编队的变形。编队形状的畸变程度作为性能指标函数,评估编队切换的效率。它量化了当前形状相对于期望形状的结构畸变程度。编队形状的畸变程度函数被定义为:
简而言之,
的值越小,编队的畸变程度越低,越接近期望的编队形状。
由于多机器人系统对每个性能指标都有不同的要求,在多智能消防机器人系统中,能量损失比和编队调整时间比等因素的权重可能大于编队畸变程度的权重。
因此,为了考虑不同多机器人系统中性能指标的重要性差异,可以制定一个综合性能评估指标体系:
在这里,
、
和
分别是能量损失比函数、编队调整时间比函数和编队畸变程度函数的权重因子,满足
。
总结一下,
可以作为一个综合的有效性评估指标,用于评估编队切换策略的质量。数值越小,说明编队切换策略越有效。
仿真结果与分析
为验证第3节中提出的编队切换策略和性能评估指标系统的有效性,进行了数值仿真,以证明与两种现有策略的比较:文献[17]中提出的固定列编队切换策略和文献[27]中基于编队形状库的动态优化编队切换策略。首
先,我们建立了如图7所示的仿真环境。该环境包括一条带有𝑋对称障碍物的道路,其中包含五个不同宽度的可通过区域(A∼E)。此外,在该环境中构建了一个由三个宽度为𝐵=1米的自主移动机器人组成的多机器人系统。道路两侧的扩展区域和障碍物的宽度设置为𝐵/2=0.5米。
为了确保公平比较,进行了三组模拟,所有模拟都使用相同的编队控制器参数:
和
。ATMR团队的期望初始编队参数矩阵设置为
,然后计算得到期望初始编队宽度
= 6.66 米。根据公式 (15),可以计算得到
= 0.45 和
= 0.15。ATMR的初始姿态设置为
,
,
。虚拟领航者的参考轨迹定义为
米,
米,对于
170 秒。ATMR的速度约束设置为
米/秒,
弧度/秒,
。
图8 使用[17]中提出的固定列编队切换策略的多机器人系统的模拟结果
图9 使用[27]中提出的动态和优化编队切换策略的多机器人系统的模拟结果
图10 使用本文提出的动态优化编队切换策略的多机器人系统的模拟结果
使用[17]中提出的固定列编队切换策略的多ATMR系统的仿真结果如图8所示。从图8(a)可以看出,当领导者在道路上10米处检测到通道变窄时,编队立即从当前的三角形配置转换为固定列。这个列形编队在机器人前进时保持不变。当最后一个机器人通过35米处的狭窄区域时,由于通道宽度恢复到初始宽度,列形编队又变回了原始的三角形编队。这种策略可以确保高水平的安全性,特别是在障碍物周围有足够自由空间的区域。然而,它的静态编队切换模式会破坏原始的编队结构,并可能略微增加机器人的总行驶距离。
多ATMR系统利用[27]中提出的动态和优化的编队切换策略的仿真结果如图9所示。如图9(a)所示,在0∼10米的范围内,三个机器人形成了期望的三角形编队,并进入非切换模式。然后,在10∼15米的范围内,原始的三角形编队缩小为一个较小的编队,并进入形态同构切换模式。在15∼30米的范围内,小三角形编队切换为列编队,并进入异构切换模式。此外,在30∼38米的范围内,列编队切换为小三角形编队,然后进入形态同构切换模式。最后,在38∼51米的范围内,该编队恢复为原始的三角形。总之,这种策略的优势在于机器人团队能够根据环境约束动态地调整其形状。然而,该策略依赖于预先构建的编队形状库,这意味着每个编队参数矩阵中的
都是预先定义的,而只有
是动态调整的。此外,该策略仅在领导者进入障碍区域时触发编队切换命令,这可能导致跟随者无法为期望的编队留出足够的空间,并增加与环境障碍物碰撞的风险。正如图9(a)所观察到的,第2个跟随者在障碍区域10∼15米内进行形态同构切换时与障碍边界发生了碰撞。
本文提出的动态优化编队切换策略在多ATMR系统中的仿真结果显示在图10中。如图10(a)所示,在0∼7.41米和38.94∼51米的区域内,由于
=1.20>1,ATMR团队保持期望的三角形编队,并保持不进行编队切换;在7.41∼12.45米的区域内,原始的三角形编队根据
动态收缩,进入同构切换模式,因为0.45<
= 0.90< 1;在12.45∼33.36米的区域内,团队转变为列编队,由于0.15<
=0.45≤0.45,进入异构切换模式;在33.36∼38.94米的区域内,列编队变成小三角形编队,然后进入同构切换模式,因为0.45<
=0.75<1。这种提出的策略的优点如下:(1)机器人团队不依赖于预先建立的编队形状库,其中
和
不是固定值,而是根据编队调整因子动态确定。因此,可以准确地说动态切换策略更适用于实际应用;(2)领导者预测障碍物通过变化并提前发布相应的编队切换命令,使编队能够主动适应。
总结一下,上述三种策略允许根据领导者检测到的通道宽度变化进行编队切换。图8(b)(c)、9(b)(c)、10(b)(c)清楚地展示了在编队切换过程中,距离和方位角误差以及线速度和角速度发生了显著波动。然而,在编队完成切换后,这些值会收敛到零。
上述三种策略的综合性能比较结果如表1所示,表明所提出的策略的整体性能优于文献[17]和文献[27]中描述的策略。
具体而言,与文献[17]和文献[27]中的策略相比,
有15.07%和9.06%的改进;
有5.10%的减少和11.75%的改进;
有19.89%和15.17%的改进。值得注意的是,文献[17]中得到的
比文献[27]和我们的策略更好。这是因为在这个仿真中模拟的通道被分为了五个不同的宽度区域,而障碍区域是连续的。因此,文献[17]中的机器人团队只需切换一次列形编队就可以穿越障碍区域,而其他两种策略则需要多次切换,导致编队调整时间更长。
然而,在实际场景中,障碍物的分布通常是未知且不连续的。采用固定的列形编队切换策略将需要团队每次接近障碍区域时都改变编队形状,最终导致编队调整时间增加和不稳定性。
为了定量分析三个加权因子与三个策略的
值之间的关系,我们基于表1的结果计算了不同
、
和
的
值。结果呈现在表2-4中。可以观察到,在大多数数值上,我们提出的策略的综合性能优于其他两个策略。然而,值得注意的是,当
较高时,参考文献[17]的综合性能更好,而
值与表1中的
值更接近。
实验结果与分析
5.1 平台描述
为了进一步展示我们提出的策略的有效性,我们在三台真实的ATMR(全地形机器人)上实施了该策略,其中包括一台侦察机器人(尺寸:1160毫米×840毫米×840毫米)和两台灭火机器人(尺寸:1550毫米×1050毫米×1010毫米),如图11所示。
在室外环境中,三台ATMR使用车载RTK(实时差分定位)来获得稳定的厘米级定位精度,使用RS-LiDAR-16来检测道路两侧的障碍物和边界信息,并使用高带宽通信基站在三台ATMR和控制中心之间建立低延迟的通信网络。在每个机器人内部安装的微型计算机上运行ROS(机器人操作系统)。控制器获取的线速度和角速度转换为左右驱动轮的速度,然后通过UDP(用户数据报协议)协议传输到底部单片机,驱动左右电机实现机器人的运动。
测试场地是一条宽度为15米的四车道道路,从东到西延伸。在道路中心选择一个特定位置建立ENU(东-北-上)惯性坐标系。在这项工作中,侦察机器人充当领导者,实时跟踪由期望轨迹创建的虚拟领导者的位置。两台灭火机器人充当跟随者1和跟随者2,与领导者并排形成编队,完成编队跟随任务。
图11 实验平台的示意布局
5.2 结果与分析
为了进行非同构和异构编队切换测试,我们在车道上设置了三个具有不同宽度的障碍通道。在这三组情况下,虚拟领导者的初始姿态为
,其在𝑋和𝑌方向的线速度分别为0.3m/s和0m/s。这意味着虚拟领导者向道路的西方向移动,其轨迹方程为
m和
m。
考虑到电机驱动器输出能力的限制,我们将速度约束设置为
m/s,
rad/s,𝑖=1, 2, 3。三种情况下使用相同的编队控制器参数:
=0.2,
=0.12,
=0.10和
=0.15,
=0.08,
=0.08。
由于消防机器人需要执行由领导者(侦查机器人)发出的编队切换指令,我们将考虑的机器人的宽度设置为𝐵 = 1.05 m。因此,障碍物的扩展区域和车道边缘的宽度为
= 0.525 m。
5.2.1 案例1:没有进行编队切换
在案例1中,障碍通道的宽度被设定为7米,并且三个ATMR的预期初始编队参数矩阵被设置为
,表示一个初始编队宽度为
= 6.25米的等腰三角形。
根据公式(15),可以计算出
= 0.504和
= 0.168。对于没有障碍物和设置的障碍通道的车道区域,它们的编队调整因子分别为
=2.4>1和
=1.12>1,满足无编队切换的条件。编队的运动时间段设置为
秒。
图12 三个ATMR没有进行编队切换的实验结果
实验结果如图12所示。从图12(a)(b)可以看出,多ATMR系统在整个运动过程中始终保持三角形编队,黑实线表示实际编队形状,黑虚线表示期望编队形状。然而,观察到由于机器人履带与地面之间存在显著摩擦,编队未能完全收敛到期望形状,这需要从方位角误差中得到更大的角速度来旋转机器人。
图12(c)显示,当编队处于稳定运动状态时,领航机器人、跟随者1和跟随者2的距离误差相对较小,约为0.05m、-0.15m和-0.12m。然而,观察到跟随者1和跟随者2的方位角误差较大,约为0.2弧度(11.46度)和-0.2弧度。
值得注意的是,由于期望距离和期望方位角被设定为
= 0和
= 0,领航机器人的方位角误差往往在(-𝜋, 𝜋]范围内波动。此外,图12(d)显示,三个机器人的线速度并不相同,主要是由于各个机器人之间硬件的差异,特别是考虑到侦查机器人和灭火机器人的不同设计。
5.2.2 案例2:同构编队切换
在第2个案例中,障碍物通道的宽度被设定为5米,并且期望的初始编队参数矩阵与第1个案例保持不变。编队调整因子计算为0.504<
=0.8<1,满足同构编队切换的条件。编队的运动时间段也设置为
秒。
图13 对于三个ATMRS的同构编队切换的实验结果
实验结果如图13所示。从图13(a)(b)可以看出,三个机器人最初按照期望的三角形编队行动,并在整个移动过程中保持该编队形态。在大约-10米的位置,编队开始收缩成一个较小的形状,并在穿过障碍区域时持续收缩。一旦所有机器人通过该区域,小三角形编队恢复到原始大小并继续移动。此外,图13(c)(d)显示,在收缩和恢复阶段,两个跟随者的跟踪误差和速度波动较大。
5.2.3 案例3:异构编队切换
在第3种情况下,障碍物通道的宽度被缩小到2.32米。三个机器人的期望初始编队参数矩阵设置为
,表示一个非等边三角形编队。期望的初始编队宽度计算为
=5.63米,得到
=0.56和
=0.187。考虑到狭窄的障碍物通道,计算得到的编队调整因子为0.187<
=0.412<0.56,满足异构编队切换的条件。编队的运动时间段设置为
秒。
图14 异构编队切换的三个ATMR的实验结果
实验结果呈现在图14中。从图14(a)(b)可以看出,编队在大约-5米处从三角形过渡为列形,并在通过障碍区域时保持这种列形。一旦障碍物消失,它在大约-20米处恢复回原始的三角形编队。此外,图14(c)(d)显示了编队过渡和恢复阶段中跟踪误差和编队速度的显著波动,但这些波动保持在合理的范围内。
三种情况下的编队切换性能结果总结在表5中。在权重因子设定为
= 0.4,
= 0.4,
= 0.2的情况下,观察到没有编队切换表现出最佳的整体性能,而异构编队切换具有最低的整体性能。因此,在实际应用中,建议尽量减少对编队形状变化的需求。
5.3 示范应用
借鉴以上研究结果,我们在一个火灾实验基地进行了一个典型的示范应用。示范现场的细节如图15所示。该场地占地约40000平方米,呈梯形形状,包括一个室外实验场地,一个室内实验场地,一个火灾实验室,两个水池(每个深度为3米),三个木质障碍物,一个面积为1平方米的汽油池,一个地方指挥中心,两段土路和一段碎石路用于实验测试等等。
图15 应用场地的尺寸图示
图16 演示应用平台和过程的框图
示范应用的平台和流程如图16所示。首先,使用无人机进行高精度的三维重建实验场地,可以获得精度为0.05米的高精度地图。其次,利用基于卷积神经网络的深度学习方法预测遥感图像,提取空间三维模型场景中的道路区域,构建地面ATMR可行驶区域,并进行网格化和插值,得到占据格网地图。然后,根据领导者在出发区域的起始姿态和灭火作业区域的目标姿态,使用混合A*路径规划算法设计编队的跟随路径,并计划路径作为虚拟领航者的参考路径。最后,设计的编队控制器使得多ATMR系统能够实时跟踪虚拟领航者。
实验结果如图17所示。如图17(a)所示,编队能够在转弯前提前调整形状,并通过转弯时有效地保持当前形状。此外,图17(a)清楚地说明了编队能够在狭窄的碎石路上导航,同时保持其柱状形状,如图17(b)所示。在图17(c)中,从跟随者2的距离误差在两次编队切换过程中明显变化,这与实际情况一致,即距离误差会瞬间变化。
领航者的大偏航角误差是因为领航者主动跟踪虚拟领航者的位置,具体而言,在方程(2)中,
= 0和
= 0。如图17(d)所示,三个机器人的速度容易受到地面摩擦、不平地形、噪音等各种因素的影响而波动。然而,值得注意的是,这些波动在可接受的范围内。
在时间间隔
[0, 190]秒内,编队切换的性能产生以下结果:
= 0.3559,
= 0.7572,
= 0.3293,
= 0.5111。
图17 演示应用的实验结果
结论
在这项工作中,我们研究了在未知障碍环境中多个ATMR的编队切换优化问题。我们关注了三个关键组成部分:
(1)建立了一个虚拟领航者-领航者-跟随者的结构模型,将传统的领航者-跟随者模型和虚拟领航者-跟随者模型的优点结合起来;
(2)开发了一种动态优化的编队切换策略,充分考虑环境约束,并通过优化四种设计的编队切换模式来动态确定最佳的编队形状;
(3)创建了一个全面的性能评估指标体系,仅依赖于机器人的简单运动特性。
我们进行了大量的数值仿真和实际测试,证明了我们提出的方法的有效性。我们的自适应虚拟领航者-领航者-跟随者的编队切换策略不仅能够动态适应最佳编队形状,还能够与当前环境变化相匹配,实现最佳性能。此外,我们建立的性能评估指标体系为有效评估多智能体系统的编队切换效率提供了有价值的工具。
然而,本文研究的基于编队切换的避障方法主要应对的是大型障碍物或障碍物聚集导致通道宽度变化的情况,需要机器人团队改变形状通过障碍区域。
对于较小或动态的障碍物,如行人或移动车辆,单个机器人可以独立回避它们,无需改变整个编队。然而,由于不同编队形状之间的转换,形成参数的突然变化可能导致预期轨迹出现意外不连续性的问题,这是一个重要的挑战。为了缓解这个问题,平滑这些瞬时轨迹变化是必要的。
在未来的工作中,我们的目标是探索计划和优化不连续轨迹的方法。此外,我们努力研究集体和个体避障策略之间的相互转换机制,使机器人能够适应不同类型、大小和状态的障碍物。这一努力旨在增强我们的策略在各种真实环境中的实用性和适应性。