概述
自主机器人是其本体自带各种必要的传感器、控制器,在运行过程中无外界人为信息输入和控制的条件下,可以独立完成一定的任务的机器人。
随着国内生活水平的不断提高,原本一直在欧美市场销售的扫地机器人走入平常百姓家,并被越来越多的人所接受,扫地机器人将在不久的将来像白色家电一样成为每个家庭必不可少的清洁帮手。产品也会由现在的初级智能向着更高程度的智能化程度发展,逐步的取代人工清洁。
系统组成1.视觉系统:负责感知球场上的态势,视觉系统获得球场上的实时图像,对图像进行颜色分割,识别出球场上的各个目标,然后进行距离校正,将结果发给决策程序。
2.决策系统:接收视觉系统的辨识结果,对球场态势进行分析,然后做出合理决策,将命令发送给底层控制系统。
3.底层控制系统:通过串口接收上位机的命令,控制各轮走行电机按照指定速度运行,控制弹射和持球电机,将底层传感器的数据通过串口发送给上位机 。
4.通信系统:通过无线网络联系场内机器人和场外计算机,进行遥控测试,参数设置等操作以及控制比赛的开始和终止。1
一般分类中型机器人;
仿人机器人;
智能汽车;
舞蹈机器人;
营救机器人;
家庭机器人;
自主机器人的学习为自主机器人进行编程是一项非常困难的工作,主要表现在以下几个方面:
绝大多数的基于行为的实现方法都是对不同的任务进行手工编程的, 这需要编程人员能充分地考虑到各种可能出现的情况,对机器人与环境之间的交互有充分的理解, 虽然有些设计出的系统对于很多任务和环境而言性能都是鲁棒的,但系统对环境并不具有适应性。
人不能穷尽一切可能。机器人能否通过学习获得不能由程序员手工编码进去的知识,比如构建一个未知环境的地图,在任何环境的性质随时间变化的任务中都是必要的。
当机器人元件老化后,机器人的传感器和执行机构的性质是可能会发生改变的。
机器人在多机器人的环境中执行,由于需要对其他机器人作出反应,它的策略是需要改变的。学习方法在这些情况下都能发挥重要的作用。用学习方法为机器人进行编程,而无须告诉它怎样达到它的目标,只要告诉它目标是什么,让它通过学习去满足这个目标,无疑,这种方法具有很大的吸引力。它是提高机器人的适应性,降低编程人员编程强度的必由之路。
分类机器人有不同层次的行为,它们由不同层次的信息表达所决定,因此就存在着不同类型的学习。Broo ks和Mataric总结出了以下类型的学习:
为传感设备标定或则参数调节进行学习。这种类型的学习只在一个特定行为结构中优化操作参数。
学习真实世界的知识。 这种类型的学习构建与修改机器人对于真实世界的内部表达,以利于机器人作出行为规划和决策等高层的智能行为。
学习已有行为的协调。这种类型的学习中通过协调已经存在的行为被触发和被执行的顺序来改变它们对世界的作用。
学习新的行为。这种类型的学习建立新的行为结构。
实际问题机器人领域对任何学习算法而言都是一个挑战。在构建拥有学习能力,能自动进行知识获取的自主机器人的过程中必须面对许多烦琐的有关真实世界的问题。 Cnnell和Mahadev an归纳出了以下一些问题,涉及到机器人的设备,实验环境和学习任务等多个方面:
传感器噪声。 大多数机器人的传感器是不可靠的。 于是由传感器信号得到的状态描述注定是不精确的。学习算法必须能够处理噪声,因此经常需要用统计平滑技术克服噪音的影响。
算法的易驾驭性。机器人必须对不可预见的环境进行实时响应。 因此学习算法必须不能过于复杂,算法的每一次迭代都必须能实时地完成。
增量式的算法。 学习算法必须允许机器人边学习边改善自己的性能。 因为机器人必须一边收集经验一边进行学习. 形成经验的数据不能离线获得。
有限的训练时间。机器人的训练时间是非常有限的。学习算法必须在合理的运算次数中收敛,因为机器人需要完成任务,在真实的机器人上进行上百万次的动作是极为困难的。
坚实的信息来源。 所有机器人可以获得的信息都必须最终来至从它的传感器抽取得到的信息或初始状态时强行编码进去的知识。由于状态信息是由传感器数据计算得到的,学习算法必须能和感知设备的限制一起工作.明显地,能否解决以上提出的一些问题决定了用在真实机器人上的学习算法的成功与否2。
学习方法在机器人研究领域中有三种主要的学习方法变得越来越流行。它们是强化学习( RL) ,进化方法( GA和EP)和基于人工神经网络( ANN )的方法。其中应用得最为广泛的方法是强化学习方法.在学习新的行为和学习协调已经存在的行为两种情况下都可以用到强化学习的方法。 强化方法是一种无监督的学习算法,它比较好地符合人们解决问题的心理习惯,,和传统人工智能以及优化算法联系紧密, 有普遍适的用性, 因此获得了最广泛的关注。