版权归原作者所有,如有侵权,请联系我们

关于智能避障的研究与科普

吉林大学
原创
吉林大学科普中国官方账号
收藏

传感器与避障算法的相关探究

摘要在本文中,我们基于自身智能车竞赛关于避障方面的已有研究深度,对传感器与避障算法知识面的广度进行了拓展,对现有避障算法、传感器类型与数据处理算法做了系统的归类总结

引言:

机器人技术的不断发展和应用给我们的生活带来了诸多便利,其中机器人导航是其应用之一。障碍物检测避障算法是机器人导航过程中的关键环节。在实际应用中,机器人需要准确地检测环境中的障碍物并避开它们。以确保寻迹的安全与有效。因此,障碍物检测与避障算法的研究对于机器人导航的发展至关重要。

在现实意义层面,随着全球范围内自动驾驶智能车辆的井喷式发展,智能驾驶程序的安全性问题也被推上了社会舆论的风口浪尖,就如2020年6月1日发生在我国台湾省地区的特斯拉失控直冲向侧翻的大货车一事,无论当时还是现在,此事在中文互联网上的讨论可谓是十分激烈, 有人说是算法缺陷,也有人归罪于驾驶员,说不应该完全依赖特斯拉所宣传的所谓“智能安全保证”,可无论如何争辩,这背后隐藏的都是社会普遍对智能避障算法的担心与不信任,就如知乎网友所担心的那样,如下图的货车或许就会成为算法的一大考验,而如何通过这一考验以赢取这位网友的信任,便需要我们今天所介绍的传感器与算法们的通力配合了。(在此,我认为可以借由距离探测类的传感器来解决下面图片所遇到的问题,我想这种提出问题并解决问题的尝试便是算法研究的魅力所在)

在国家发展战略层面,车辆的智能控制也是极为重要的一环,根据2022年2月10日国务院组织印发的《智能汽车创新发展战略》(以下又称“战略”)中提到的:“智能汽车已成为全球汽车产业发展的战略方向。”足见智能车辆这一科研方向的时代性与重要性;而正如战略中所言:“从应用层面看,汽车将由单纯的交通运输工具逐渐转变为智能移动空间和应用终端。”我们能够看出其对“智能”一词的强调是显而易见的。至于战略后篇中对“关键技术”的论述也可知,车路交互、复杂环境感知、智能决策控制这三方面也是国家层面需要重点进行科研突破的瓶颈,而这也正是我们本篇研究科普的意义所在。

关于接下来的正文部分,我们将从硬件到软件,逐一介绍避障传感器、姿态传感器、数据融合算法、避障算法与路径算法这五大点及其下属分支的各小点,力求做到细致入微,为您深度解析避障相关的发展现状与情景如何,建立起一套完整的智能避障知识体系。

避障传感器种类

环境信息采集系统是自动避障系统的关键组成部分,负责收集运动时环境中的障碍物信息。获取全面、准确的数据能够提升智能小车的自动避障性能,但也需要考虑信息处理的及时性和复杂度。视觉传感器、激光雷达、红外测距传感器和超声波测距传感器等是智能小车自动避障常用的探测器。

1.超声波传感器

超声波测距传感器发射特定频率信号,检测物体反射、散射的信号,判断是否有障碍物。超声波传播方向性强,直线传播且穿透力高,能集中能量。随频率增加,绕过障碍能力减弱,反射能力增强。超声波测距传感器速度快、处理简单、实时控制、计算方便、价格低廉,在智能小车中广泛应用于测距、测速、定位和环境建模。

1.1超声波测距原理

超声波有三种主要的测距方法:相位探测法、渡越时间探测法和声波幅值探测法。

相位探测法通过计算返回波与发射波之间的相位差来判断距离;声波幅值探测法通过计算二者间幅度差来判断距离;渡越时间探测法则通过计算两者间的时间延迟来判断距离。相位探测法精度高但范围小,声波幅值探测法受反射波影响大。文章选用最常见的渡越时间探测法。该方法指超声波发射后开始计时,当接收器接收到回波时停止计时,通过公式d=c∗t/2计算距离。温湿度对速度影响较小,因此常值c=340m/s。

1.2超声波传感器测距的优缺点

利用超声波传感器测距具有多重优点:

适应环境能力强,在恶劣光线或有灰尘的情况下依然精准;

不受颜色和光照影响,能穿透透光和粗糙表面的物体;

提供距离信息,比视觉传感器多了距离数据;

探测速度快,不受光速限制,比视觉传感器更迅速;

构造简单、价格低廉,数据处理简便,耐损坏。

然而,超声波传感器也有一些不足:

容易受干扰,多个传感器可能相互影响,甚至单个传感器也容易受到声波反射影响;测量准确性有限,波束角大,不能精准检测物体位置;

稳定性不佳,近距离测距时存在盲区和不稳定问题;只提供距离信息,无法获取物体尺寸和形状等信息。

尽管如此,超声波传感器在智能小车、汽车倒车雷达、物位探测、超声波开关和安防监控等领域仍被广泛应用,但在需要提供尺寸和形状信息的环境,或需要多个传感器同时在同一方向进行近距离测距时,其适用性可能较差。

2.红外测距传感器

红外测距传感器利用红外线的反射特性制成,属于光波的一种,具有光波反射传输的物理性质。通过发射红外信号并接收反馈信号,红外测距传感器获取距离信息。其测量精确度高、速度快等优势使其广泛应用于智能小车自动避障、地形测量、军事用途中对打击目标的测量、通信卫星等领域。

2.1红外测距传感器的原理

红外测距利用三角测量原理进行距离测量。图2.1显示了红外测距的原理,首先红外发射器发射一束红外光,形成一定角度的光束。当这束光遇到物体并被反射回来时,CCD检测器可以检测到返回的光束,进而得到偏移值。通过三角定理,可以得到距离公式 D=F(L+X)L+fctg(90。−a)所示的几何关系式。

在这个公式中,D代表红外传感器到目标物体的距离,F表示滤镜的焦距,L为偏移值,X为中心距,a表示发射角,c表示红外线在空气中的传播速度(c=3∗108m/s)。如图2.1所示,当目标物体距离红外传感器足够近时,偏移值L会非常大,甚至超过CCD检测器的最大检测值。相反,当D很大时,L则很小。因此,是否能够获取偏移值L的关键在于滤镜的焦距。

图2.1

2.2红外测距传感器测距的优缺点

利用红外测距传感器测量距离具有以下优点:

抗干扰能力强,多个红外传感器不会相互干扰。

测量精度高,优于超声波测距传感器。

测距速度快,反应时间短,因光速比声速快。

适用于长距离测距,不受光线在空气中传播的扩散影响。

具有更强的发射和接收能力,因为温度高于绝对零度的物体都会反射红外线。

然而,红外测距传感器的主要缺点是在强光直射的环境下会影响测量精度。

3.激光雷达测距传感器

市面上有多种类型的激光传感器,根据测距原理大致可分为四类:脉冲法、相位法、干涉法和三角法。前两种方法利用激光的飞行时间来计算距离,干涉法则是通过相干光源产生的干涉现象来计算,而三角法则通过三角关系计算距离。三角测距雷达的结构如图3.1所示,其中式中的f和s已知,可以通过像素点的位置来计算距离值q。通过对x求导,可以得到dqdx=−qfs2,三角测距原理的激光雷达测量噪声会随着测量距离的增加而增加,噪声水平与距离平方成正比。因此,三角测距原理的激光雷达适用于中短距离测量,成本较低。市面上的低成本商用激光雷达多采用此方案。将三角测距的模块在一个平面中进行回转,就可以生成周围场景的平面扫描图。

图3.1

二、姿态传感器种类

飞行器需要实时检测姿态并进行调整,以确保平稳飞行。常用的姿态检测器件包括加速度计、陀螺仪、磁力计、超声波传感器、气压传感器和GPS等。在当前的研究中,采用了复杂的多传感器数据融合方法来获取准确的姿态信息,但在嵌入式平台上的运算能力受限,因此需要选择一种轻量且廉价的惯性测量单元(IMU)来输出飞行器的姿态信息。本设计中选择只使用角速度和加速度两种传感器作为姿态测量器件。

加速度计

加速度计是一种用于测量加速力的传感器,通过测量重力引起的加速度来计算设备相对于水平面的倾斜角度。在三维空间中,可以利用重力和传感器的关系推导出三个姿态角:俯仰角(pitch)、横滚角(roll)、偏航角(yaw)。其中,俯仰角表示X轴相对于地面的角度,横滚角表示Y轴相对于地面的角度,偏航角表示Z轴相对于重力的夹角。这些角度可以通过测量重力在三个轴方向上的加速度来推导得出。

2.陀螺仪

陀螺仪是一种传感器,利用角动量守恒原理来维持方向并测量角度。一般分为Gimbal陀螺仪和MEMS陀螺仪两种类型。

Gimbal陀螺仪由三个平衡环和一个转子组成,通过转子的不断旋转和平衡环的响应来检测物体的状态。然而,它可能存在万向节锁的问题,需要更多机械部件来解决。

MEMS陀螺仪相比较体积较大的Gimbal陀螺仪有着更大的优势,利用科里奥利力来测量物体的角速度。

3.磁力计

三轴磁力计通过磁敏器件,获取地磁场在机体坐标系下的三维磁场矢量投影。通过磁力计对航向角解算时,无需进行积分运算,因此它是一种长期稳定的器件。

4.GPS

GPS可以提供位置和速度信息,但在某些情况下,如有遮挡物或信号折射时,定位精度可能下降。陀螺仪能够提供短期姿态角信息,但长期精度可能受误差影响。因此,结合加速度计、磁力计和陀螺仪数据进行姿态解算,可以获得长期稳定的姿态角信息。然而,单独使用GPS或气压计也存在一定局限性,所以需要传感器数据互补,以提高导航精度和稳定性。

三、传感器数据融合

多传感器信息融合(Multi-sensor Information Fusion, MSIF)是利用计算机技术,将来自多传感器或多源的信息和数据,在一定的准则下进行自动分析和综合,以完成所需的决策和估计的信息处理过程。

多传感器融合几个概念

硬件同步是利用相同的硬件同时发布触发采集命令,确保各传感器在同一时刻进行数据采集和测量,以获取相同信息。

软件同步包括时间同步和空间同步,前者是通过统一主机提供基准时间,为各传感器数据加上时间戳,后者是将不同传感器的测量值转换到同一坐标系中。

多传感器融合原理类似于人脑处理信息的过程,包括特征提取、模式识别、关联和利用融合算法得到一致性的目标解释与描述。

2.基本原理

多传感器融合的基本原理类似于人脑处理信息的方式,通过多层次、多空间的信息组合,产生对观测环境的一致性解释。在此过程中,充分利用多源数据,最终目标是从各传感器获得的观测信息中导出更多有用信息。具体步骤包括:

多个传感器收集目标数据。

提取观测数据的特征矢量。

对特征矢量进行模式识别处理,得到各传感器关于目标的说明。

将各传感器关于目标的说明数据按目标进行分组。

利用融合算法将传感器数据合成,得到一致性的解释与描述。

3.多传感器的前融合与后融合技术

3.1后融合算法:

每个传感器都独立地处理目标数据生成,拥有自己独特的感知方式,如激光雷达、摄像头和毫米波雷达。完成目标数据生成后,主处理器进行数据融合。

3.2前融合算法:

在单一感知算法中,将融合后的多维综合数据处理成一个超级传感器,它具备多种感知能力,如红外线、摄像头、RGB和LiDAR的三维信息,相当于一双超级眼睛。通过在这个超级传感器上开发自己的感知算法,最终可以输出一个结果层的物体描述。

4.融合算法

对于多传感器系统,信息多样且复杂,因此融合算法需具备鲁棒性和并行处理能力。此外,还需考虑运算速度、精度、接口性能、协调能力及信息样本要求。一般而言,具备容错性、自适应性、联想记忆和并行处理能力的非线性数学方法可作为融合方法。

多传感器数据融合方法主要分为随机类和人工智能类。

4.1随机类

常用的多传感器数据融合方法包括:

加权平均法:对多传感器提供的冗余信息进行加权平均,得到融合值。

卡尔曼滤波法:适用于实时动态多传感器数据融合,通过测量模型的统计特性递推,决定最优融合和数据估计。

多贝叶斯估计法:将每个传感器视为一个贝叶斯估计,合成一个联合的后验概率分布函数,提供多传感器信息的融合值。

D-S证据推理法:包含基本概率赋值函数、信任函数和似然函数,用于自上而下的推理,分为目标合成、推断和更新三级。

产生式规则:通过符号表示目标特征和传感器信息之间的联系,联合规则形成融合,但需要定义每个规则的置信因子,引入新传感器时需要相应的附加规则。

4.2.AI类

常见的多传感器数据融合方法包括:

模糊逻辑推理:通过指定0到1之间的实数表示真实度,允许直接在推理过程中表示不确定性,产生一致性模糊推理。相较于概率统计方法,模糊逻辑更接近人类思维方式,在高层次应用中较为适用。然而,由于逻辑推理存在主观因素,缺乏客观性,因此不够成熟和系统化。

人工神经网络法:神经网络具有容错性、自学习、自组织和自适应能力,能够模拟复杂的非线性映射。在多传感器系统中,各信息源提供的环境信息具有一定不确定性,神经网络可以根据当前系统接受的样本相似性确定分类标准,并通过学习算法获取知识,实现不确定性推理和多传感器数据融合。

四、避障常用算法

在介绍避障算法之前,我们先要明确避障算法和路径规划算法的区别。假设机器人已经通过导航规划算法规划了自己的运动路径,并开始按照该路径行进。避障算法的任务是在机器人执行正常行进任务时,如果传感器输入检测到障碍物,即时更新目标轨迹以避开障碍物。

1.Bug算法

4908551699895

图4.1.1 bug1算法 图4.1.2 bug2算法

图4.1.2 bug2算法

传感器与避障算法的相关探究

摘要在本文中,我们基于自身智能车竞赛关于避障方面的已有研究深度,对传感器与避障算法知识面的广度进行了拓展,对现有避障算法、传感器类型与数据处理算法做了系统的归类总结

引言:

机器人技术的不断发展和应用给我们的生活带来了诸多便利,其中机器人导航是其应用之一。障碍物检测避障算法是机器人导航过程中的关键环节。在实际应用中,机器人需要准确地检测环境中的障碍物并避开它们。以确保寻迹的安全与有效。因此,障碍物检测与避障算法的研究对于机器人导航的发展至关重要。

在现实意义层面,随着全球范围内自动驾驶智能车辆的井喷式发展,智能驾驶程序的安全性问题也被推上了社会舆论的风口浪尖,就如2020年6月1日发生在我国台湾省地区的特斯拉失控直冲向侧翻的大货车一事,无论当时还是现在,此事在中文互联网上的讨论可谓是十分激烈, 有人说是算法缺陷,也有人归罪于驾驶员,说不应该完全依赖特斯拉所宣传的所谓“智能安全保证”,可无论如何争辩,这背后隐藏的都是社会普遍对智能避障算法的担心与不信任,就如知乎网友所担心的那样,如下图的货车或许就会成为算法的一大考验,而如何通过这一考验以赢取这位网友的信任,便需要我们今天所介绍的传感器与算法们的通力配合了。(在此,我认为可以借由距离探测类的传感器来解决下面图片所遇到的问题,我想这种提出问题并解决问题的尝试便是算法研究的魅力所在)

在国家发展战略层面,车辆的智能控制也是极为重要的一环,根据2022年2月10日国务院组织印发的《智能汽车创新发展战略》(以下又称“战略”)中提到的:“智能汽车已成为全球汽车产业发展的战略方向。”足见智能车辆这一科研方向的时代性与重要性;而正如战略中所言:“从应用层面看,汽车将由单纯的交通运输工具逐渐转变为智能移动空间和应用终端。”我们能够看出其对“智能”一词的强调是显而易见的。至于战略后篇中对“关键技术”的论述也可知,车路交互、复杂环境感知、智能决策控制这三方面也是国家层面需要重点进行科研突破的瓶颈,而这也正是我们本篇研究科普的意义所在。

关于接下来的正文部分,我们将从硬件到软件,逐一介绍避障传感器、姿态传感器、数据融合算法、避障算法与路径算法这五大点及其下属分支的各小点,力求做到细致入微,为您深度解析避障相关的发展现状与情景如何,建立起一套完整的智能避障知识体系。

避障传感器种类

环境信息采集系统是自动避障系统的关键组成部分,负责收集运动时环境中的障碍物信息。获取全面、准确的数据能够提升智能小车的自动避障性能,但也需要考虑信息处理的及时性和复杂度。视觉传感器、激光雷达、红外测距传感器和超声波测距传感器等是智能小车自动避障常用的探测器。

1.超声波传感器

超声波测距传感器发射特定频率信号,检测物体反射、散射的信号,判断是否有障碍物。超声波传播方向性强,直线传播且穿透力高,能集中能量。随频率增加,绕过障碍能力减弱,反射能力增强。超声波测距传感器速度快、处理简单、实时控制、计算方便、价格低廉,在智能小车中广泛应用于测距、测速、定位和环境建模。

1.1超声波测距原理

超声波有三种主要的测距方法:相位探测法、渡越时间探测法和声波幅值探测法。

相位探测法通过计算返回波与发射波之间的相位差来判断距离;声波幅值探测法通过计算二者间幅度差来判断距离;渡越时间探测法则通过计算两者间的时间延迟来判断距离。相位探测法精度高但范围小,声波幅值探测法受反射波影响大。文章选用最常见的渡越时间探测法。该方法指超声波发射后开始计时,当接收器接收到回波时停止计时,通过公式d=c∗t/2计算距离。温湿度对速度影响较小,因此常值c=340m/s。

1.2超声波传感器测距的优缺点

利用超声波传感器测距具有多重优点:

适应环境能力强,在恶劣光线或有灰尘的情况下依然精准;

不受颜色和光照影响,能穿透透光和粗糙表面的物体;

提供距离信息,比视觉传感器多了距离数据;

探测速度快,不受光速限制,比视觉传感器更迅速;

构造简单、价格低廉,数据处理简便,耐损坏。

然而,超声波传感器也有一些不足:

容易受干扰,多个传感器可能相互影响,甚至单个传感器也容易受到声波反射影响;测量准确性有限,波束角大,不能精准检测物体位置;

稳定性不佳,近距离测距时存在盲区和不稳定问题;只提供距离信息,无法获取物体尺寸和形状等信息。

尽管如此,超声波传感器在智能小车、汽车倒车雷达、物位探测、超声波开关和安防监控等领域仍被广泛应用,但在需要提供尺寸和形状信息的环境,或需要多个传感器同时在同一方向进行近距离测距时,其适用性可能较差。

2.红外测距传感器

红外测距传感器利用红外线的反射特性制成,属于光波的一种,具有光波反射传输的物理性质。通过发射红外信号并接收反馈信号,红外测距传感器获取距离信息。其测量精确度高、速度快等优势使其广泛应用于智能小车自动避障、地形测量、军事用途中对打击目标的测量、通信卫星等领域。

2.1红外测距传感器的原理

红外测距利用三角测量原理进行距离测量。图2.1显示了红外测距的原理,首先红外发射器发射一束红外光,形成一定角度的光束。当这束光遇到物体并被反射回来时,CCD检测器可以检测到返回的光束,进而得到偏移值。通过三角定理,可以得到距离公式 D=F(L+X)L+fctg(90。−a)所示的几何关系式。

在这个公式中,D代表红外传感器到目标物体的距离,F表示滤镜的焦距,L为偏移值,X为中心距,a表示发射角,c表示红外线在空气中的传播速度(c=3∗108m/s)。如图2.1所示,当目标物体距离红外传感器足够近时,偏移值L会非常大,甚至超过CCD检测器的最大检测值。相反,当D很大时,L则很小。因此,是否能够获取偏移值L的关键在于滤镜的焦距。

图2.1

2.2红外测距传感器测距的优缺点

利用红外测距传感器测量距离具有以下优点:

抗干扰能力强,多个红外传感器不会相互干扰。

测量精度高,优于超声波测距传感器。

测距速度快,反应时间短,因光速比声速快。

适用于长距离测距,不受光线在空气中传播的扩散影响。

具有更强的发射和接收能力,因为温度高于绝对零度的物体都会反射红外线。

然而,红外测距传感器的主要缺点是在强光直射的环境下会影响测量精度。

3.激光雷达测距传感器

市面上有多种类型的激光传感器,根据测距原理大致可分为四类:脉冲法、相位法、干涉法和三角法。前两种方法利用激光的飞行时间来计算距离,干涉法则是通过相干光源产生的干涉现象来计算,而三角法则通过三角关系计算距离。三角测距雷达的结构如图3.1所示,其中式中的f和s已知,可以通过像素点的位置来计算距离值q。通过对x求导,可以得到dqdx=−qfs2,三角测距原理的激光雷达测量噪声会随着测量距离的增加而增加,噪声水平与距离平方成正比。因此,三角测距原理的激光雷达适用于中短距离测量,成本较低。市面上的低成本商用激光雷达多采用此方案。将三角测距的模块在一个平面中进行回转,就可以生成周围场景的平面扫描图。

图3.1

二、姿态传感器种类

飞行器需要实时检测姿态并进行调整,以确保平稳飞行。常用的姿态检测器件包括加速度计、陀螺仪、磁力计、超声波传感器、气压传感器和GPS等。在当前的研究中,采用了复杂的多传感器数据融合方法来获取准确的姿态信息,但在嵌入式平台上的运算能力受限,因此需要选择一种轻量且廉价的惯性测量单元(IMU)来输出飞行器的姿态信息。本设计中选择只使用角速度和加速度两种传感器作为姿态测量器件。

加速度计

加速度计是一种用于测量加速力的传感器,通过测量重力引起的加速度来计算设备相对于水平面的倾斜角度。在三维空间中,可以利用重力和传感器的关系推导出三个姿态角:俯仰角(pitch)、横滚角(roll)、偏航角(yaw)。其中,俯仰角表示X轴相对于地面的角度,横滚角表示Y轴相对于地面的角度,偏航角表示Z轴相对于重力的夹角。这些角度可以通过测量重力在三个轴方向上的加速度来推导得出。

2.陀螺仪

陀螺仪是一种传感器,利用角动量守恒原理来维持方向并测量角度。一般分为Gimbal陀螺仪和MEMS陀螺仪两种类型。

Gimbal陀螺仪由三个平衡环和一个转子组成,通过转子的不断旋转和平衡环的响应来检测物体的状态。然而,它可能存在万向节锁的问题,需要更多机械部件来解决。

MEMS陀螺仪相比较体积较大的Gimbal陀螺仪有着更大的优势,利用科里奥利力来测量物体的角速度。

3.磁力计

三轴磁力计通过磁敏器件,获取地磁场在机体坐标系下的三维磁场矢量投影。通过磁力计对航向角解算时,无需进行积分运算,因此它是一种长期稳定的器件。

4.GPS

GPS可以提供位置和速度信息,但在某些情况下,如有遮挡物或信号折射时,定位精度可能下降。陀螺仪能够提供短期姿态角信息,但长期精度可能受误差影响。因此,结合加速度计、磁力计和陀螺仪数据进行姿态解算,可以获得长期稳定的姿态角信息。然而,单独使用GPS或气压计也存在一定局限性,所以需要传感器数据互补,以提高导航精度和稳定性。

三、传感器数据融合

多传感器信息融合(Multi-sensor Information Fusion, MSIF)是利用计算机技术,将来自多传感器或多源的信息和数据,在一定的准则下进行自动分析和综合,以完成所需的决策和估计的信息处理过程。

多传感器融合几个概念

硬件同步是利用相同的硬件同时发布触发采集命令,确保各传感器在同一时刻进行数据采集和测量,以获取相同信息。

软件同步包括时间同步和空间同步,前者是通过统一主机提供基准时间,为各传感器数据加上时间戳,后者是将不同传感器的测量值转换到同一坐标系中。

多传感器融合原理类似于人脑处理信息的过程,包括特征提取、模式识别、关联和利用融合算法得到一致性的目标解释与描述。

2.基本原理

多传感器融合的基本原理类似于人脑处理信息的方式,通过多层次、多空间的信息组合,产生对观测环境的一致性解释。在此过程中,充分利用多源数据,最终目标是从各传感器获得的观测信息中导出更多有用信息。具体步骤包括:

多个传感器收集目标数据。

提取观测数据的特征矢量。

对特征矢量进行模式识别处理,得到各传感器关于目标的说明。

将各传感器关于目标的说明数据按目标进行分组。

利用融合算法将传感器数据合成,得到一致性的解释与描述。

3.多传感器的前融合与后融合技术

3.1后融合算法:

每个传感器都独立地处理目标数据生成,拥有自己独特的感知方式,如激光雷达、摄像头和毫米波雷达。完成目标数据生成后,主处理器进行数据融合。

3.2前融合算法:

在单一感知算法中,将融合后的多维综合数据处理成一个超级传感器,它具备多种感知能力,如红外线、摄像头、RGB和LiDAR的三维信息,相当于一双超级眼睛。通过在这个超级传感器上开发自己的感知算法,最终可以输出一个结果层的物体描述。

4.融合算法

对于多传感器系统,信息多样且复杂,因此融合算法需具备鲁棒性和并行处理能力。此外,还需考虑运算速度、精度、接口性能、协调能力及信息样本要求。一般而言,具备容错性、自适应性、联想记忆和并行处理能力的非线性数学方法可作为融合方法。

多传感器数据融合方法主要分为随机类和人工智能类。

4.1随机类

常用的多传感器数据融合方法包括:

加权平均法:对多传感器提供的冗余信息进行加权平均,得到融合值。

卡尔曼滤波法:适用于实时动态多传感器数据融合,通过测量模型的统计特性递推,决定最优融合和数据估计。

多贝叶斯估计法:将每个传感器视为一个贝叶斯估计,合成一个联合的后验概率分布函数,提供多传感器信息的融合值。

D-S证据推理法:包含基本概率赋值函数、信任函数和似然函数,用于自上而下的推理,分为目标合成、推断和更新三级。

产生式规则:通过符号表示目标特征和传感器信息之间的联系,联合规则形成融合,但需要定义每个规则的置信因子,引入新传感器时需要相应的附加规则。

4.2.AI类

常见的多传感器数据融合方法包括:

模糊逻辑推理:通过指定0到1之间的实数表示真实度,允许直接在推理过程中表示不确定性,产生一致性模糊推理。相较于概率统计方法,模糊逻辑更接近人类思维方式,在高层次应用中较为适用。然而,由于逻辑推理存在主观因素,缺乏客观性,因此不够成熟和系统化。

人工神经网络法:神经网络具有容错性、自学习、自组织和自适应能力,能够模拟复杂的非线性映射。在多传感器系统中,各信息源提供的环境信息具有一定不确定性,神经网络可以根据当前系统接受的样本相似性确定分类标准,并通过学习算法获取知识,实现不确定性推理和多传感器数据融合。

四、避障常用算法

在介绍避障算法之前,我们先要明确避障算法和路径规划算法的区别。假设机器人已经通过导航规划算法规划了自己的运动路径,并开始按照该路径行进。避障算法的任务是在机器人执行正常行进任务时,如果传感器输入检测到障碍物,即时更新目标轨迹以避开障碍物。

1.Bug算法

4908551699895

图4.1.1 bug1算法 图4.1.2 bug2算法

图4.1.2 bug2算法

图4.1.1 bug1算法 图4.1.2 bug2算法

图4.1.2 bug2算法

Bug算法是一种简单直观的避障算法,其基本思想是在发现障碍物后,机器人围绕其轮廓行走以绕开障碍物。其中,Bug1算法是一种最简单的形式,机器人首先完全绕行障碍物,然后从距离目标最近的点脱离。尽管Bug1算法效率低下,但可以保证机器人达到目标。在改进后的Bug2算法中,机器人开始时会跟踪障碍物的轮廓,但不会完全绕行一圈。当机器人可以直接移动至目标时,就会从障碍物处分离,以实现更短的路径。

除了Bug1和Bug2算法之外,还存在其他变种,如正切Bug算法等。在简单场景中,Bug算法易于实现和应用,但并未考虑机器人的动力学限制,因此在复杂实际环境中可能不够可靠。

2.势场法(PFM)

人工势场避障控制是一种仿生学方法,通过建立虚拟势场,在机器人工作空间中实现局部路径规划。构造目标位姿引力场和障碍物斥力场,搜索势函数的下降方向,寻找无碰撞路径。虽然在静态环境下表现良好,但在动态避障控制中存在局限性,未考虑障碍物的速度和加速度的影响。

势场法不仅用于避障,还可用于路径规划。机器人被处理为势场下移动的点,目标为势场中的低谷值,障碍物为势场中的高峰,共同作用于机器人,引导其走向目标并避免碰撞。更新势场并重新规划路径是检测到新障碍物时所需的操作。

4029710848360

图4.1.2 PFM势场图

图4.1.2 PFM势场图

势场法的扩展方法是添加转运势场和任务势场。转运势场考虑了机器人与障碍物的相对方位,任务势场排除了对近期势能无影响的障碍物,生成更平滑的路径。尽管理论上存在局限性,但在实际应用中效果良好且易于实现。3.向量场直方图(VFH)

VFH算法创建基于极坐标的局部地图,使用栅格图表示,根据传感器数据更新。极坐标直方图显示了机器人感知到的障碍物角度和对应的概率。首先识别允许通过的足够大的空隙,计算这些空隙的代价函数,并选择最低代价的通路。代价函数受目标方向、机器人当前方向和之前选择的方向的影响,通过调整权重调整机器人的选择偏好。

图4.3.1

VFH算法的扩展包括VFH+算法,考虑了机器人运动学限制和障碍物对运动能力的影响。传统避障方法还包括神经网络和模糊逻辑。神经网络方法训练整个行走路径模型,输入机器人位姿、速度和传感器数据,输出期望的目标或运动方向。模糊逻辑方法使用模糊控制器根据障碍物位置和距离提供转向建议,避免碰撞。

4.模糊逻辑控制

模糊逻辑方法在机器人避障方面的研究非常丰富,其中一个优点是无需创建可分析的环境模型。另一个优点是可以通过调整规则来适应不同情况,因为每条规则都有明确的物理意义。模糊控制规则是核心。

图4.4.1

当前研究的新趋势之一是模糊逻辑方法的渐增本质,特别是在模糊控制规则的自动生成方面。这意味着算法具有在线模糊规则学习能力,能够自动获取数据并生成规则,实现更智能的避障行为。

5.人工神经网络避障控制法

人工神经网络是一种具有并行计算能力的系统,由多个神经元按一定拓扑结构连接而成。它拥有强大的非线性拟合和多输入多输出处理能力。在机器人中,人工神经网络模拟人脑信息处理,以获取类似于人脑的能力。对于智能机器人,采用人工神经网络进行信息融合具有多重优势,包括大规模并行处理、分布式信息存储、自适应、自组织、学习、联想和容错功能,使其接近人脑的信息处理方式。

6. 栅格法避障控制法

使用启发式算法在栅格中搜索路径是常见方法。每个栅格都有通行因子,将路径规划转化为寻找最优路径问题。搜索过程利用四叉树或八叉树表示工作空间。栅格法以基本单元为最小栅格粒度,根据基本单元情况确定栅格通行性。栅格粒度越小,障碍物表示更精确,但可能占用更多存储空间且增加计算复杂度。

五、路径规划算法

在规划模块中,需要明确几个经常容易混淆的概念:

运动规划(Motion Planning)

路径规划(Path Planning)

轨迹规划(Trajectory Planning)

运动规划=路径规划+轨迹规划。

路径规划:在已知几何约束情况下(如障碍物、地图信息),求解一条无碰撞路径。

轨迹规划:在已知运动学约束情况下(如时间约束、速度约束等),求解轨迹。

目标

路径规划(Path Planning)的目标是找到成本最小的路径,需要考虑地图、起始地点、目标地点和成本函数等条件。

路径规划主要由两部分组成:路径搜索和轨迹规划。路径搜索是在地图中寻找一条避开障碍物的路径,而轨迹规划则对搜索到的路径进行优化,以符合机器人的运动学和动力学约束。

在示意图中,路径搜索得到的路径(标记为a)是一条无碰撞的路径,经过轨迹规划后(标记为b),路径满足机器人的运动学和动力学约束,成为一条可执行的路径。

2. 分类

路径规划(搜索)的算法主要可分成这三类,后续的章节也是按照以下的顺序进行介绍的。

2.1 基于搜索的算法

Dijkstra、A*、JPS

2.2 基于采样的算法

PRM、RRT、RRT*

2.3 满足动力学约束的搜索算法

Hybrid A*

六、SLAM

SLAM的英文首字母缩写是Simultaneous Localization And Mapping,通常翻译为同时定位与建图或同时定位与地图构建。

「同时定位与地图构建」听起来可能有些拗口,因此我们先用一个日常生活中形象的例子来说明。

1.初步认识SLAM

我们知道现在有不少家用的扫地机器人,可以代替人对室内进行自动清扫。早期的机器人只能简单地避障,效率低下。而现在随着SLAM技术在扫地机器人中的应用,现在的扫地机器人已经变的非常智能,可以实现智能的清扫路径规划和高级功能,如自动回充和断点续扫。

根据前面介绍,我们总结一下,要实现智能的清扫,扫地机器人需要具备以下能力。

定位(Localization):知道自己在房间的具体位置。

建图(Mapping):了解整个房间的地面结构信息。

路径规划(Route Planning):以最短路径到达指定地点(如充电器)进行自动充电。

具备以上能力后,扫地机器人可以智能地规划清扫路线,根据建立好的地图进行清扫,随着使用时间增长,建立的地图会越来越准确,清扫路线也会越来越高效。

看明白了上面的例子,我们给出SLAM的定义。SLAM是指在未知环境中,某种移动设备(如机器人、无人机、手机等)观测自身位置、姿态和轨迹,并根据此信息增量式地构建地图的过程。定位和建图相辅相成,地图提供更好的定位,定位又进一步扩建地图。路径规划是在此基础上的高级功能,不属于SLAM讨论范畴。

2.SLAM的应用

SLAM主要使用激光雷达和视觉两种传感器。早期SLAM研究主要采用激光雷达,其优点是精度高、解决方案成熟,但缺点也明显,如价格高、体积大、信息不直观等。

视觉SLAM则使用摄像头作为主传感器,利用视频流实现同时定位和建图。视觉SLAM广泛应用于AR、自动驾驶、智能机器人、无人机等领域。SLAM的核心是定位和建图。

SLAM在自动驾驶中的关键作用是精确定位汽车的位置,当然建图也同样重要。有人可能会问:现在手机上的地图应用(如百度、高德、腾讯等)已经可以定位了,为什么还需要SLAM来定位呢?这是因为目前的地图应用在室外定位和导航方面确实做得很好,并衍生出许多基于地理位置的游戏、社交和生活类应用。然而,现有的定位系统仍然存在以下两个主要问题。

地图App使用GPS定位,但其精度仅达数米,无法确定车辆所在车道。

图6.2.1

GPS仅室外有效,对于建筑内、洞穴等区域失效。

为了解决GPS失效区域的定位问题,目前最有效的方法之一就是使用SLAM技术。

同样的,对于室内使用的自主移动机器人来说,定位也完全依赖SLAM技术。如下图是单目SLAM的过程。此外像京东,阿里这种大型的电商已经在自己的仓库配备了仓储机器人,也称AGV(Automated Guided Vehicle),可以根据建立的地图确定自身的位置,然后根据任务需求进行路径规划来搬运货物。

近年来,消费级RGB-D相机的普及使室内三维重建成热门方向。使用这种相机可生成室内场景的三维模型,应用广泛。可用于小尺度三维建模,如手机单目摄像头扫描物体,也可用于较大尺度场景,如Google Project Tango利用鱼眼摄像头对室外场景进行三维重建。重建结果可用于多种功能,如室内移动机器人导航、增强现实游戏和三维漫游等。

图6.2.2