足球机器人的决策子系统研究及其MATLAB仿真-精品

更新时间:2024-04-28 03:07:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

第I页

摘 要

足球机器人是当前机器人研究中的一个热点,涉及机器人学、人工智能、智能控制、计算机视觉等多个领域。足球机器人系统作为一个典型的多智能体协作系统,为机器人学、多智能体系统理论研究和技术应用提供了一个理想的实验平台。

本文以MiroSot机器人足球比赛为背景,以集控式微型足球机器人为研究对象,在分析了足球机器人系统的结构后,重点研究其智能实现的关键部分—决策子系统。对足球机器人策略库的设计、机器人的路径规划、轮式机器人的运动控制等问题进行研究。

首先,本文介绍了足球机器人目前的发展状况,以及足球机器人系统的组成,然后针对足球机器人问题的特点,对传统的决策系统的设计思想进行了研究,分析了常用的决策模型的优缺点,提出采用一种自上而下的分层递阶策略模型。接着在文中建立了差动轮式足球机器人的运动学和动力学模型,并给出了一种基于栅格建模的遗传算法路径规划与模糊PID运动控制方法。随后讨论了决策系统中策略知识库的组成,研究了策略知识库中策略的设计方法,采用以球为中心的区域控制法,设计了足球机器人进攻策略与防守策略等。最后进行了系统仿真实验,并总结了全文、提出了进一步研究的方向。

关键词:足球机器人;决策系统; 路径规划;运动控制;模糊PID;遗传算法

第II页

目录

摘 要 ................................................................................................................... I ABSTRACT ......................................................................... 错误!未定义书签。 目录 ........................................................................................................................ II 第一章 绪 论 ..................................................................................................... 5

1.1 引言 .......................................................................................................... 5 1.2 机器人足球的发展现状 .......................................................................... 5

1.2.1 国外的研究现状 ........................................................................... 5 1.2.2 国内的研究现状 ........................................................................... 6 1.3 足球机器人研究的目的与意义 .............................................................. 6

1.3.1 研究决策子系统的意义 ............................................................... 7 1.3.2 决策系统相关问题研究现状 ....................................................... 8 1.4 本论文的研究工作 .................................................................................. 8

1.4.2论文主要内容 ................................................................................ 9

第二章 足球机器人系统概述 ............................................................................. 9

2.1 足球机器人系统的分类 .......................................................................... 9 2.2 微型(MiroSot)机器人足球比赛系统的简介 .................................. 11

2.2.1 视觉系统 ..................................................................................... 13 2.2.2 决策子系统 ................................................................................. 14 2.2.3 无线通信子系统 ......................................................................... 15 2.2.4 机器人子系统 ............................................................................. 16 2.3 本章小结 ................................................................................................ 17 第三章 微型足球机器人决策子系统分析与设计 ........................................... 18

3.1 决策子系统分析 .................................................................................... 18

3.1.1 决策子系统的任务 ..................................................................... 18 3.1.2 决策子系统的特点 ..................................................................... 20 3.2 决策子系统的体系结构 ........................................................................ 21

3.2.1 决策子系统模型 ......................................................................... 21 3.2.2 自上而下的分层递阶决策推理模型 ......................................... 22

第III页

3.3 足球机器人动作设计 ............................................................................ 26

3.3.1足球机器人动作设计的目的 ...................................................... 26 3.3.2足球机器人动作的特点分析 ...................................................... 26 3.4 小结 ........................................................................................................ 32 第四章 足球机器人的运动控制和路径规划 ................................................... 33

4.1 足球机器人的运动学和动力学模型 .................................................... 33

4.1.1坐标系的建立 .............................................................................. 33 4.1.2运动学模型 .................................................................................. 33 4.1.3动力学模型 .................................................................................. 34 4.2 基于模糊PID的足球机器人运动控制 ............................................... 36

4.2.1 控制系统设计 ............................................................................. 37 4.2.2 PID控制器设计 .......................................................................... 37 4.2.3 模糊控制器的设计 ..................................................................... 38

4.2.3.1 模糊控制器的基本原理 .................................................. 38 4.2.3.2 模糊控制器I的设计 ...................................................... 39 4.2.2.3 模糊控制器II的设计 ..................................................... 44 4.2.3 控制算法流程图 ......................................................................... 45 4.2.4 用MATLAB 设计FIS及仿真 ................................................. 46 4.3 基于遗传算法的机器人路径规划 ........................................................ 48

4.3.1 遗传算法简介 ............................................................................. 48 4.3.2利用遗传算法进行路径规划 ...................................................... 49

4.3.2.1 规划空间的栅格法建模 .................................................. 49 4.3.2.2 路径规划方法 .................................................................. 50 4.3.3 仿真研究 ..................................................................................... 53 4.3.3 结论 ............................................................................................. 53 4.4 小结 ........................................................................................................ 54 第五章 策略知识库的设计 ............................................................................... 55

5.1 引言 ........................................................................................................ 55 5.2 策略知识库的组成 ................................................................................ 55 5.3 机器人足球比赛中的策略 .................................................................... 56

5.3.1基本比赛策略的设计 .................................................................. 56 5.3.2球队队形的选择 .......................................................................... 56

第IV页

5.3.3角色分配与转换 .......................................................................... 63 5.3.4基本比赛策略 .............................................................................. 64 5.4 策略库的几种高层策略方案 ................................................................ 66 5.5 小结 ........................................................................................................ 67 第六章 仿真结果与分析 ................................................................................... 68

6.1 概述 ........................................................................................................ 68 6.2 仿真环境和内容 .................................................................................... 68 6.3 仿真试验结果 ........................................................................................ 69

6.3.1 基于遗传算法的机器人路径规划仿真 ..................................... 69 6.3.2 足球机器人基本比赛策略的仿真 ............................................. 69 6.4 小结 ........................................................................................................ 71 回顾与展望 ........................................................................................................... 72 攻读硕士学位期间发表的学术论文及取得科研成果 ...... 错误!未定义书签。 参考文献 .............................................................................. 错误!未定义书签。 致 谢 .................................................................................... 错误!未定义书签。 附 录 ..................................................................................................................... 74

第5页

第一章 绪 论

1.1 引言

机器人技术是在新技术革命中迅速发展起来的一项高新技术,它己在众多的科学领域与工业部门中得到应用,并显示出强大的生命力。机器人技术是一门综合性学科,它综合了多种基础学科、技术学科及新兴科技领域的多方面知识,突出地体现了当代科学技术发展的高度分化而又高度综合这一特点。近年来,有关多智能体系统(Multi-Agent System)的研究,已经成为人工智能领域的重要研究方向之一,足球机器人系统作为多智能体的典型问

[1] [2]

题,是当今国际上人工智能的研究热点。在人工智能领域,多智能体系统是指包含两个或以上的机器人以合作的方式完成给定任务的系统。而机器人足球赛既是人工智能一个很好的研究模型,又是体现多个机器人合作的范例,因此它的兴起便倍受关注。 1.2 机器人足球的发展现状 1.2.1 国外的研究现状

机器人足球是由加拿大大不列颠哥伦比亚大学教授Alan Mackworth 在

[3]

1992年的一次国际人工智能会议首次提出的,他的目的是通过机器人足球赛,为人工智能和智能机器人学科的发展提供一个具有标志性和挑战性的课题。此想法一经提出,便得到了各国科学家的普遍赞同和积极响应,国际上许多著名的研究机构和组织开始开展研究,将其付诸实现并不断推动其发展。

目前,国际上机器人足球已经发展为两大系列,一是由国际机器人足联(FIRA-Federation of International Robot-soccer Association)组织的微型机器

[7]

人世界杯足球赛(MiroSot), FIRA成立于1997年6月,总部设在韩国科学院 [8]

,其成员单位遍及 50 多个国家和地区,有近百个学校与科研院所参加,主要分布在亚洲、澳洲、南美洲等地区。FIRA 自成立以来,也组织了 7 届机器人足球世界杯赛(FIRA Robot-soccer World Cup)。国内院校参加的主要

第6页

是 FIRA 的 MiroSot 比赛。它采用集中视觉系统,机器人尺寸限制为 7.5cm×7.5cm×7.5cm,其中每方为3个机器人的3:3项目的场地大小为 150cm×130cm,比赛用球为高尔夫球。在成功举办了首届机器人足球世界杯赛后,决定每年组织一次比赛;另一个是国际人工智能学会组织的机器人世界杯足球赛(RoboCup),总部设在日本的名古屋,自 1997 年起每年举办一次机

[4] [5] [6]

器人足球世界锦标赛,至今已组织了七届世界杯赛。1996年首届MiroSot世界杯机器人足球赛只有7个国家23支代表队参赛,而到了2002年的第七届比赛,有25个国家、地区的207个代表队参加汉城举办的赛事,可见各国对本项比赛关注程度。目前,国外机器人足球比较发达的国家主要有美国、韩国、日本等国。 1.2.2 国内的研究现状

我国的足球机器人事业起步比较晚,但是充分利用后发优势,发展迅速,有些方面已经接近或者达到国际水平。我国的科研工作者于1997年才开始涉足机器人足球比赛相关领域的研究与探索,1997年东北大学人工智能与机器人研究所加入FIRA并研制开发出微型足球机器人系统。1999年4月,中国机器人足球协会在哈尔滨成立,并正式加入FIRA。同年10月在哈尔滨工业大学举行首届中国机器人足球比赛。1999年8月,东北大学作为中国第一支代表队参加了在巴西举办的第四届机器人世界杯足球赛,并取得了较好的成绩。在RoboCup比赛项目上,清华大学和中国科技大学代表了中国的最高水平。清华大学在2001的RoboCup仿真组中第一次参加比赛即一举夺得金牌,实现了中国RoboCup金牌零的突破,我国对机器人足球的研究起步较晚,但整体水平提高较快。今天中国的机器人足球正在逐渐发展和壮大起来,引起社会各界的极大兴趣,国内己有几十所大学和科研团体在开展这方面的研究。 1.3 足球机器人研究的目的与意义

机器人足球涉及多个学科和技术:智能机器人、多智能体系统、实时规划与推理、机器学习、实时图像处理与模式识别、传感器与数据融合、无线

[9] [10]

通讯等。机器人足球已成为人工智能领域发展的历史性目标和智能机器人发展的代表方向。机器人足球之所以受到如此厚爱,就是因为足球机器人涵盖了诸多的高新技术,是一项人工智能与机器人领域的应用基础研究课题。利用足球机器人这个优秀平台,可以最大程度地把当前人工智能和智能控制领域的新方法和新理论应用于系统开发过程中,从而检验所采用方法的

第7页

有效性,这对理论研究有很明确的指导意义。机器人足球比赛将研究对象从过去计算机象棋的单智能体发展到分布式多智能体,将研究环境从静态环境发展到动态环境,并且将非实时知识处理发展到实时处理,有巨大的理论价[11]

值。最重要的是,机器人足球项目的深入开展,带动了其它各方面智能技

[12]

术的推广,如:

1)产业应用:将机器人足球所包含得各种硬件和软件技术具体应用到产业,用以改造旧的传统企业技术或开发新型高技术产品。 2)军事应用:将机器人足球所包含得多智能技术及战略、战术具体应用到机器人部队的协同作战或救灾机器人部队的协同救护系统上。

3)教育应用:将机器人所包含的具有趣味性和观赏性的人工智能技术具体应用到教学之中,使其各种工具与手段智能化,促进教育改革。此外,在自动控制、智能交通、信息处理、系统分析与集成等技术领域也有广阔的发展前景。

因此可以说,机器人足球比赛是继计算机象棋后出现的人工智能发展的

[13]

第二个里程碑,它将人工智能技术发展到新的境界,使人工智能技术更加成熟,加速人工智能技术的商品化、产业化进程。 1.3.1 研究决策子系统的意义

足球机器人系统作为研究多主体系统的典型课题,它的智能性主要体现在决策系统中,足球机器人智能水平的高低主要取决于决策系统的先进性、合理性和实时性。决策系统在整个足球机器人系统中,处于非常重要的地位,就好比人脑对于人这个系统一样,决策系统的优劣将直接关系到比赛的结果,关系到整个系统的成败。最为重要的是,对决策系统的深入研究有重大的理论意义和现实应用价值。在决策子系统的开发过程中,可以最大程度地把当前人工智能和智能控制领域的新方法和新理论应用足球机器人这个优秀平台上,对通过这个实验平台检验所用理论的可行性和先进性。决策系统的开发过程就是对多智能体系统的基本问题,诸如工作任务描述、任务分解

[14]

与分配、智能体间的一致性及协调性等的求解过程 。

足球机器人决策系统的研究成果可具有巨大的应用价值。例如,可利用决策系统中的协作控制和决策技术来自动指挥无人驾驶飞机群完成诸如编队、攻防对抗等作战任务。在制造领域,引入智能体技术可大大增加制造系统的柔性、智能性和可重构性,并为解决动态问题的复杂性和不确定性提供新的思路。此外这些研究成果还可以运用到交通控制、软件开发、网络管理

第8页

和信息处理等众多领域当中。 1.3.2 决策系统相关问题研究现状

(1) 机器人路径规划及障碍回避问题

动态环境的路径规划,是机器人足球的另一个关键问题。有大量的文献

[15]

讨论了机器人自主导航和避碰问题,如文献[16]中就总结了如下一些方法:边缘检测法、拓扑法、势场法及确定网络法等;文献[17]通过运动轨迹预测(假设为直线运动)来规划出一条无碰路径,并通过控制机器人加、减

[18] [19] [20] [21]

速来避开运动障碍。此外一些智能算法诸如遗传算法和神经网络方法等也在机器人路径规划中得到了应用。如何在存在高度对抗和动态的比赛环境下,快速有效地进行机器人路径规划是需要进一步研究的课题。 (2) 实时决策问题

为了解决足球机器人实时决策问题,学者们提出了大量的控制结构和决策模型。如文献[22]采用角色分配方法;文献[23]提出了一种文化(culture)算法,认为要进行机器人足球比赛,首先要训练每一个机器人踢足球,然后进行多个机器人无对手情况下的训练,再进行小规模的比赛;文献[24]通过状态空间到行为空间映射的方法,让足球机器人作出适应性动作选择;文献[25]提出了六步推理模型。不少方法仅具有理论指导意义。如文献[22]的角色划分过分依赖机器人所分配的区域,缺少灵活性;文献[24]只考虑了几种简单的状态,无法适应复杂的比赛要求;而文献[23][25]所提方法理论上很完美,但实现起来有一定的难度。在高度动态和存在对抗的机器人足球比赛环境下,如何进行实时、高效的决策,仍是需要进一步研究的核心课题。 1.4 本论文的研究工作

机器人足球系统研究的主要内容包括:视觉技术,通讯技术,机器人小车技术,决策技术及仿真实现。目前,在决策系统的研究方面,韩国学者提出区域防守法,加泰罗尼亚大学提出人工势场法用于路径规划,英国学者提出人自为战法,东北大学徐心和教授提出智能控制决策和六步推理模型。就目前而言,决策系统的研发还有待完善,如决策库中的各种防守策略中,其中各机器人职责分明,当其他队员被阻时,该机器人只停留致使全局僵住。人自为战法选择每个机器人各自为战,利于进攻,但碰撞机率大。再如路径规划的各种算法中,全局规划方法有位形空间法、栅格空间法,局部规划方法主要有人工势场法,这些方法都有一定的优点,但实用中受限制。

第9页

1.4.2论文主要内容

本文研究的主要内容是: 1. 本文对足球机器人系统的决策特点进行了分析,提出了自上而下的分层

递阶决策推理模型,该模型涉及到队行、角色和动作层次,给出了微型足球机器人系统体系结构。并针对机器人足球策略系统的技术实现,进行了各类动作的设计。 2. 机器人的路径规划及障碍回避。其中心内容就是找到到达目的地并能避

开障碍的最优路径,针对目前机器人足球比赛的障碍规划算法的不足,提出了基于栅格建模的遗传算法来进行躲避障碍的路径搜索,遗传算法是基于自然选择和自然遗传推理的一种路径搜索方法,它可以通过对历史信息的有效搜索来推测具有更好期望性能的新信息。 3. 讨论了差动轮式足球机器人运动控制问题,建立了差动轮式足球机器人

运动学、动力学模型,给出一种基于模糊PID的足球机器人运动控制方法,并设计了模糊PID控制器,给出了仿真实验结果。 4. 策略知识库的建立,在机器人足球比赛系统中,知识和规则是策略知识

库的重要组成部分,因此如何表示他们是很重要的,本论文采用了产生式系统来设计基于规则的专家系统。本文通过对策略的选择、队形变换、角色分配等方面,实现了攻防兼备的策略。

本论文的研究重点是足球机器人的决策子系统。本文的各种策略及设计都将通过VC++6.0及MATLAB编制程序来实现,并利用现有实验室里的FIRA微型足球机器人比赛平台及仿真系统,针对几种不同模型,验证了这几种算法的效果,并能够最终达到比赛的目的。

第二章 足球机器人系统概述

2.1 足球机器人系统的分类

足球机器人系统是机器人研究的一个分支,属于可行走智能机器人系统。目前研究的方向为集中控制式足球机器人系统、分布控制式足球机器人系统,以实现机器人足球运动员为发展目标,研究运动分析、自动控制、人工智能、计算机视觉及无线通信、传感器技术等学科领域。对于设计者来说

第10页

选择什么样的硬件和软件与整体的工作模式有关,一般来说,根据决策部分

[26][27]

所处的位置将工作模式分为以下三种

1.基于视觉的集中控制式足球机器人系统,简称“集控式足球机器人”,又称“基于视觉的遥控无智能足球机器人系统 (vision-base Remote brainless soccer robot system)”。系统采用全局视觉,视觉处理、策略决策以及机器人的行为控制都在主计算机上完成,场上机器人仅作为执行装置,由主计算机发送数据(左右轮速)控制它们运动。在这种系统中,安装在球场上方的摄像头摄取赛场上的信息,送至主机图像分析与识别;由充当教练员的决策软件统一决策,形成机器人的控制命令字,然后通过无线通信的方式发给机器人,每个足球机器人只要负责根据主机发送来的运动指令实现要求的动作即可,类似于遥控车。每个机器人具有驱动模块、通信模块和CPU板,它能够根据接受到的主机发来的数据控制其运动方向和速度,视觉数据处理、策略决策及机器人的位置控制都在主机上完成。此类集控式系统包括FIRA微机器人赛(MiroSot)、超微机器人赛(NaroSot)和RoboCup的小型机器人赛(F180)等。

图2.1 基于视觉的集中控制式足球机器人系统示意图

2.基于视觉的半自主型足球机器人系统,又称“基于视觉的有智能集中控制足球机器人系统(vision-base Brain on board soccer robot system)”。在这种系统中,采用全局视觉且只有全局视觉数据处理在主计算机上完成,然后把处理结果发给场上每个机器人,机器人自己据此做出策略决策,进行运动控制机器人具有速度控制、位置控制、自动避障等功能,在RoboCup的小型机器人赛(F180)常采用这种模式。

第11页

图2.2 基于视觉的半自主型足球机器人系统示意图

3.全自主型足球机器人系统,又称“基于机器人的足球机器人系统(Robot-base soccer robot system)”。如图2.3所示,机器人具有完全的自主行为,自身具有感知系统,一般装有多种传感器,所有的计算(传感信息处理、决策)都由机器人自身来完成。各个机器人分别感知,感知器官不仅局限于视觉,还可辅以红外和声纳等,进行距离和障碍检测。这样信息融合成为首当其冲的技术难题;机器人间的信息沟通则要靠无线通信网络;网络形式与通信协议也成为制约系统性能的关键技术。RoboCup的中型足球机器人比赛(F2000),和四足机器狗比赛(Sony Legged League)及人形足球机器人比赛(Humanoid)就属于此类系统。

图2-3 全自主型足球机器人系统示意图

以上三种模式的系统,从智能的角度讲,第一、二、三种模式呈递增趋势,从控制方式来看,第三种属于分布式控制,第一、二种属于集中控制。而在集中控制方式下,每个机器人的行动完全由中央控制器控制,相对来说,对每个微型机器人要求不高,只要执行命令即可,机器人的结构相对比较简

[28]

单,设计与实现更为容易一些 。针对我们实验室的足球机器人系统,本文研究的MiroSot机器人足球比赛系统属于第一种模式,即集中控制式足球机器人系统。

2.2 微型(MiroSot)机器人足球比赛系统的简介

第12页

微型机器人足球的赛场长1.5米,宽1.3米,比乒乓球台略小,场地画有中线、中圈和门区。每队由三个边长不超过7.5 厘米的立方体形的遥控小车(机器人)组成。它们的任务就是将橘红色的高尔夫球(足球)撞入对方的球门而力保本方不失球或少失球。比赛规则与人类足球相似,也有点球、任意球和门球等。只是因电池容量有限,每半场为5分钟,中间休息10分钟。下半场结束时若为平局,则有3分钟的延长期,也实行突然死亡法和点球大战。与人类足球的明显不同之处在于球场四周有围墙壁,所以没有界外球,而在相持10 秒后判争球。在整个比赛中没有人的参与,完全是计算机指挥机器人自主的比赛。比赛场地如图2.4所示。

图 2.4 MiroSot 机器人足球比赛场地全视图

足球机器人系统,在硬设备方面包括机器人小车、摄像装置、计算机主机和无线发射装置。从功能上分,它包括机器人小车、视觉、决策和无线通信四个子系统。从自动控制理论角度来看,这四个子系统构成了一个大的闭环控制系统。各个子系统之间关系如图2.5所示。

视觉子系统 CCD摄像机 图像识别 图像处理 图像捕获 决策子系统 比赛场地 主机 RS232 无线通信子系统 无线发射 机器人子系统 无线接收 第13页

图 2.5 微型机器人足球系统结构图

一旦进入比赛,系统通过视觉子系统对整个比赛现场进行监控,由彩色CCD (Charge Couple Device)摄像头获取比赛场上的比赛状况,经视频处理卡采集数据后,由主计算机对这些数据进行识别和处理;根据处理得到的双方机器人和球的信息,决策子系统从策略库中调用相应的比赛策略,分配各机器人角色,确定各机器人的目标位置,进行轨迹规划,从动作函数库中调用相应的动作函数,产生各个机器人的速度控制命令;无线通讯子系统将速度控制命令发送给己方足球机器人,足球机器人完成作战任务,直到比赛停止或比赛时间到为止。 2.2.1 视觉系统

视觉子系统是机器人的眼睛,由CCD摄像头、图像采集卡等硬件设备和图像处理软件组成。它由悬挂在球场中圈上空约2米的摄像头获取赛场上的情况,产生连续帧(或场)的视频图像,由装在主机内的图像采集卡进行A/D转化,生成对应的数字图象,再利用图像识别算法对这些数字图象进行辨识,生成比赛场上的运动物体的位置数据,传给主机。由于双方各有不同颜色的队标(如黄色和蓝色),而机器人也有不同的队员色标。这样计算机就可以通过颜色分割辨识出全部机器人与球的坐标位置与朝向,并将辨识数据提供给决策子系统供其进行分析决策使用,视觉子系统结构如图2.6所示。

与普通的计算机视觉相比,足球机器人的视觉系统有自己的特点。首先,对系统的实时性要求高,Mirosot系统工作在60Hz时,每个控制周期时间为16ms,在此时间内4个子系统必须串行运行一遍。其次,系统辨识精度要求高。第三,系统需具备一定的适应性和抗干扰性。

人机交互 预处理

实 际 结果输出 目标识别 图像分割 图像获取 场景 图像处理 视觉主流程; 数据流程; 命令流程 第14页

图2.6 视觉子系统结构

由于视觉系统所提供的数据是用来供决策系统进行决策分析以及发出指令的,而场上情形多变,小车运动速度很高,视觉系统获取和处理数据的速度直接影响发出指令的速度,进而影响场上机器人小车运动的灵活性和准确性。因此,视觉系统的实时性是决定整个系统实时性的重要因素。

视觉系统需具备一定的适应性和抗干扰性.对于比赛现场的理想要求是比赛现场光线充足,辨识物体无影,机器人小车和球的颜色、形状特征明晰,比赛场地和各物体颜色饱和度高。而实际上赛场的环境很容易受到各种因素的干扰而难于达到理想状况,而且比赛时的现场环境与调试环境也不尽相同,系统必须要具备快速初始化能力以适应比赛需要,这就要求视觉系统要

[29]

有一定的稳定性和适应性

系统识别精度的高低和速度的快慢是衡量视觉子系统性能的两项主要指标,直接影响到整个系统的性能和比赛结果。应尽可能在节约成本的基础上选择高性能的摄像头和图像采集卡等硬件资源,重点研制开发识别处理速度快、效果好的图像处理软件。 2.2.2 决策子系统

决策子系统是足球比赛的核心子系统,根据视觉子系统送来的现场信息,如当前得分、谁控制球、对手的水平等因素,安排相应的策略,决定是进攻还是防守,确定机器人队形及角色分配。策略存在策略库中,根据比赛情况和经验进行提取,各种智能算法如神经网络、模糊算法、遗传算法等也可以应用到策略编程以及策略选择中。系统根据所选择的策略,计划机器人的任务,从动作函数库中调用相应的动作函数,产生各足球机器人左、右轮的速度控制命令,然后通过无线通信子系统发送给比赛场上的足球机器人。决策子系统流程图如图2.7所示。

机器人动作 信息预处理 动作

态势分析 机器人管理队形确定 角色分配 策 略 库 第15页

图 2.7 决策子系统流程图

决策子系统的载体是一台计算机,其决策功能由计算机内运行的决策程序实现。策略应根据比赛规则和经验来进行提取,并存在策略库中.策略库中应有一个学习智能体,用于对指令的执行效果做出评估,对策略库做必要的修改以不断丰富策略。策略库越丰富和完善,取胜的可能性越大。

机器人应具备一定的自适应、自学习及察觉周围环境变化的能力,这种能力要由决策控制子系统来实现,因此决策子系统应满足适应性好、具有自学习能力、实时性好等几方面的要求。 2.2.3 无线通信子系统

通信子系统是联系主机与机器人的桥梁和纽带,主要负责主机和足球机器人之间的通信。通信系统分为无线发射装置系统和车载接收装置系统,发射装置与主机相连,接收装置在足球机器人上,来自主机决策系统的控制指令通过计算机的串口送至通信发射模块,经过调制后发射出去,机器人的通

无线接 收装置 电动机 控 制 足球机 器 人 计算机 主 机 RS232 无线发 射装置 图 2.8 通信子系统流程图

信接收模块接收到命令并解调后传给车载微处理器进一步处理,解码后获得左右轮速度设定值,送入电动机控制部分驱动左右轮转动。足球机器人比赛系统是一个快速实时系统,数据传输的快慢将影响机器人接收命令,进而影响系统的快速性和比赛结果,因此要求通信子系统有较高的通信速率。

信号以无线电波的方式传输时比较容易受到外界信号(各种噪声以及近频带信号)的干扰而产生误差;同时由于机器人上的接收机与机器人的控制

第16页

电路安排在一起,还装有驱动电路和电机,电磁环境恶劣,也容易受到干扰而产生误差。如果在通信过程有误差,它将导致机器人错误的动作,所以要求通信系统具有较高的抗干扰能力和可靠性。

无线通信子系统是机器人足球闭环控制系统的一个重要组成部分,其通

[30]

信性能的好坏,将严重影响机器人的运动和比赛的顺利进行。为了提高通信质量和通信效率应精心设计通信系统,重点是通信芯片的选择和通信协议的制定。

2.2.4 机器人子系统

足球机器人的形式为机器人小车,机器人小车是系统的执行机构,其任务是准确接收来自上位机的运动指令,并根据指令的要求迅速、准确地完成决策子系统所要求的动作。机器人小车在场中的表现直接体现了整个系统的好坏。

机器人小车由车体、动力驱动装置、通信接收器、CPU板和能源系统组成。概括地说,机器人小车应具备三大功能:指令的接收能力、调速及转弯的控制能力、红外检测与障碍回避的能力。由于尺寸限制及受到场外各种光线的干扰,并为减轻车载CPU的负担,红外检测与避障环节可以省去,这部分可由决策系统根据视觉子系统所提供比赛场上的信息,通过轨迹规划来实现。

根据比赛规则的要求,Mirosot机器人小车的尺寸应不大于7.5㎝×7.5㎝×7.5㎝,而小车上要安装各种装置,所以要求机器人小车包括各功能模块尽可能小型化和集成化,同时由于在比赛过程中会不可避免地发生激烈的碰撞,因此要求车体结构强度好,重量和转动惯量小,车体采用铝合金。为了获取较好的机动性和灵活性,本系统采用双电机分别驱动左右轮的方式。

机器人小车一般由动力驱动装置、通信接收器、CPU板和能源系统组成,为了满足足球机器人比赛的要求,机器人小车的运动性能显得尤为重要,能够快速实现前进、后退、转角、停车等基本动作。选择合适的电动机及其减速机构、驱动芯片,设计合理的驱动电路是很重要的。能源系统对直流电机提供驱动电压及向整个机器人小车控制系统提供逻辑电压。必须存储足够的能量,并保持电压的稳定。概括地说,机器人小车应能准确地接收上位机指令,并根据指令要求迅速完成决策子系统的意图(带球、射门、拦截等技术动作),为此机器人应具有以下两大功能:

◆ 指令的接收

第17页

◆ 调速及转角控制

P1.0 无 P1.1 线 接 RXD P1.2 驱动1 电机1 码盘1 P1.3 80c196kc 驱动2 电机2 8254 计数器 GATE0 GATE1 码盘2 P1.4 P1.5 图 2.9 机器人小车子系统流程图

2.3 本章小结

本章简要介绍了机器人足球系统的分类和三种工作模式,分析了Mirosot 集控式机器人足球比赛系统及其构成;对各个子系统包括视觉子系统、决策子系统、通信子系统和足球机器人子系统的结构、功能和设计要求进行了分析。要想在机器人足球比赛中战胜对手,取得比赛胜利,机器人足球系统的每个部分都必须具有优良的性能,并能协调可靠地工作。决策子系统上接视觉子系统,下接通信子系统,它是整个系统的中心枢纽,在本文下面的章节中,将对决策子系统的设计进行详细的研究。

第18页

第三章 微型足球机器人决策子系统分析与设计

3.1 决策子系统分析 3.1.1 决策子系统的任务

在机器人足球比赛系统中,决策子系统上接视觉子系统,下接通信子系统,它是整个系统的中心枢纽。视觉子系统传来场上机器人和球的位置坐标和方向角,这些数据信息作为输入量进入决策子系统。决策子系统的任务就是如何根据这些信息,经过决策处理,得出各个机器人的运动控制命令,提高无线通信子系统发送给各个机器人。决策子系统的优劣将直接影响到比赛的成败。

足球机器人的决策系统扮演着教练员和运动员的职责。在真实的绿茵场上,作为教练员要根据球场上的实际情况来部署球员,同时也根据不同的对手,选择不同的队形。足球机器人赛场上,决策者也应该根据不同的球队采取不同的策略,对于错综复杂的球场形势,运用灵活的策略。作为人类,球员与教练的思维通常包括形象思维和逻辑思维两部分,在激烈的体育比赛中通常以形象思维为主。如当比赛场上具有如图3.1所示的态势: R1~R3为我方机器人在左半场,向右进攻,人类教练员会立即看出R1队员进攻位置比

321 图3.1 反映比赛瞬间态势的示意图

第19页

较好,应该进行射门。而机器人决策系统从视觉子系统得到的信息只是一个包含机器人姿态和球位置的数据矩阵,这使人类形象思维的优势荡然无存。

人类对球场信息的处理通常是在模糊概念上,如:远、近、快、慢、有利、无利??,用自然语言进行推理、决断。而决策子系统面对的是精确的数据和呆板的程序语言。如何将教练员的决策思维过程形式化、规范化,并用计算机程序表现出来,这属于知识工程的范畴,崭新的前沿领域。这也是机器人足球比计算机下国际象棋更具挑战性的要点所在,也是决策子系统的难点所[31]

在。

视觉系统 微型足 辨识数据 球机器 机器人左人决策

右轮速度系统 人机界面

设定 设定

图3.2决策系统输入输出模块图

[32]

如图3.2所示,决策系统是一个知识型系统,有如下关系:

O=f (I)

其中,I(2n?1)?3矩阵是视觉输出的数据,为场上物体的位姿,On?2矩阵是决策输出数据,为我方机器人的左右轮速设定,n为我方机器人的数目。对于Mirosot 3VS3的足球机器人系统,场上实体的位置信息,它可由一个7×3的矩阵来表示:

?XR1?X?R2?XR3???XOR1?XOR2??XOR3?X?BYR1YR2YR3YOR1YOR2YOR3YBI7?3?R1??R2???R3???OR1? ?OR2???OR3??B??其中,前3行分别表示我方机器人R1、R2、R3的坐标值(x, y)及方向角

值,第四行至第六行分别表示对方机器人OR1、OR2、OR3的坐标值(x, y)及方向角值,最后一行表示球的坐标值及方向角值。

决策系统的输出量用来指挥本方球员的行动,它由3×4的矩阵组成:

第20页

O3?4?VLR1VRR1???VLR2VRR2??VLR3VRR3DLR1DLR2DLR3DRR1?DRR2?? DRR3??其中第一行向量分别表示我方机器人R1的左右轮速度和左右轮的位移

量,第二行向量分别表示我方机器人R2的左右轮速度和左右轮的位移量,第三行向量分别表示我方机器人R3的左右轮速度和左右轮的位移量。

显然f是一个复杂的、非线性、非结构化的函数关系,决策系统的任务就是构建并实现这个复杂的函数模型。

决策子系统的输入是场上足球机器人与球的位姿信息和比赛统计信息,输出为我方队员运动速度的给定值。从以上分析可以看出,在输入与输出之

[33]

间建立一种数学映射关系是不可能的,它是一种知识型的非线性映射关系[34]

。 3.1.2 决策子系统的特点

足球机器人决策系统具有如下特点:

? f是非常复杂、非结构化的函数关系,体现教练员、运动员的决策过程,显然解不唯一。

? 需将模糊的形象思维转化为严谨的逻辑推理与数学计算过程一一知识工程领域的前沿课题。

? 体现了智能控制系统的分层结构:

上层智能决策——队形、角色、动作选择; 下层快速控制——目标、轨迹、轮速。

上下层的区别与关系:上层进行决策对策为下层提供任务规划和目标点设定,下层是具体任务实现。上层的信息更具有模糊性和知识性,精度要求不高,下层的轨迹规划和机器人控制更注重精确性。 ? 经验要逐渐的积累,知识要逐渐丰富,策略在逐步发展。

通过以上的分析和足球机器人的特点,对决策子系统提出了以下要求: ? 决策系统设计要兼顾实时性和精确性;

? 保证系统功能实现,提高系统鲁棒性和可控性; ? 使系统具有一定的冗余度,提高容错性; ? 程序设计要结构化、层次化、模块化; ? 开放式结构,具有良好的可扩展性;

? 可多路选择,使系统操作具有较大的灵活性(开球方式、本队策略等);

第21页

? 设法使得系统有自组织自学习的功能。 3.2 决策子系统的体系结构

目前参与比赛的机器人不多,采用集中式决策结构对整体优化、实时性能优于分布式决策结构。为此本文仍以集中式的决策结构来研究机器人足球系统相关问题。对于基于视觉的Mirosot机器人足球系统,全队机器人的统一决策,相当于全局控制器,产生控制足球机器人的命令,各个机器人仅作为决策控制的执行机构。全局控制器内部采用分层结构,控制流程是从上至下的,数据流是单向的,执行过程流畅高效。 3.2.1 决策子系统模型

在目前开发的足球机器人系统中,人们提出了许多决策子系统模型与算法,如角色分配法、时间区域控制法、人自为战法等。

[35]

1. 角色分配法:角色分配法又分为基于现场情况的角色分配和基于区域

[36]

的角色分配。基于现场情况的角色分配,顾名思义,就是根据现场情况,比如对方的水平强弱来为我方队员分配角色,如确定某个队员为防守者或进攻者。基于区域的角色分配就是将机器人的比赛场地划分为一些区域,在不同的区域中,每个机器人的优先级不同,具有最高优先级的机器人有权选择动作,而其它机器人的动作要配合最高优先级机器人,以避免机器人之间的冲突。

该方法的优点是每个机器人都被分配了固定的角色,避免了角色变换环节中可能出现的问题,每个机器人的任务十分明确。但是,由于每个机器人的角色固定,使得球队的战略决策显得有些死板,特别是基于区域的角色分配方法,由于每个机器人被安置在固定区域中,机器人在本区域中尽忠职守,不越“雷池”半步,即使小球处于自由状态,但只要小球不在本区域中,机器人也不会去组织进攻。

[37]

2. 时间区域控制法:该方法主要用来判断哪个机器人是持球者,通过持球者采决定下—步的策略。可控区域指一个选手能优于其他选手达到的所有区域。如果球是静止的,球的位置被包括在选手的控制区域内,则可判定该选手控制了球。若小球是移动的,则在控制区域内引入时间约束,此时,根据小球进入和离开控制区域的时间、球的路径是否包括在时间约束的区域内、并持续了某一有限长度时间,来判断选手是否真正地控制球。当没有选手控制球时,离球最近的机器人去追球。

第22页

该方法可以很好的判断出小球的控制权,但是它却增加了策略的运行计算时间。在机器人足球比赛中,机器人的形状为一正方体,它的侧面和边角撞球后小球的运动特性是不同的,因此小球的运动变化预测很难做到十分精确,再加上双方队员拼抢十分激烈,使用该方法必须将大量时间用在控球权的频繁计算上,加大了策略运行时间的开销。

3. 人自为战法:在持球者确定后分两种情况决定下一步的策略:—是,如果持球者成功控球,此时球队为进攻方,可确定球队的进攻策略;二是持球者控球失败,此时由进攻方转为防守方。

该方法中,决策控制条件简单易于实现,不足是攻防转换过于频繁。在攻防转换的期间,机器人动作需要多次变动,除了机器人的体能被大量消耗外,多机器人之间合作和协调也会出现一些问题。 3.2.2 自上而下的分层递阶决策推理模型

谈到足球机器人决策系统的设计,有人认为这比绿茵场止的足球简单得多。因为球场小,攻守态势一目了然,球员少,动作简单,队形变化与战术构成也都相对简单,大不了就是一场三人足球赛。其实这是对机器人足球赛的误解。由于比赛过程中人不直接参与,而机器人的眼、脑、腿又是相对分离的,这时的比赛过程就犹如三个盲人在场上踢球。他们每个人腿脚灵活,但不知球在哪里,他们完全靠教练员每时每刻的指令来决定自己行动方向、速度和位移量。教练员也是一个盲人,他要靠一个明眼人来“观敌掠阵”,每时每刻告诉他敌我双方运动员及球的位置,然后做出判断与决策,指挥盲人运动员行动。由此可见,这一过程相当繁琐。

如果说决策子系统充当的是教练员的职责,那么对于机器人足球而言,教练员是个盲人,他不是用眼睛看到比赛场景,反映到大脑进行形象思维,而是根据队员在比赛场上的位姿和球位置的精确数据对比赛场上的形势进行分析,所以更多的是依靠逻辑思维来完成推理过程。这样决策子系统在制定决策时就应该参照盲人教练的思维过程展开,认真抽象推理链上的每一个环节,从而实现专家知识与决策过程的形式化。

推理模型在足球机器人决策系统设计中占有很重要的地位,为足球机器人决策系统设计的提供整体思路上的指导。它研究的内容是决策系统的推理

[25] [38]

的一般过程和步骤,东北大学徐心和教授提出的六步推理模型,是决策子系统自上而下分层递阶推理模型的代表,它的推理步骤为:

输入信息预处理(计算有关实体速度、相对距离等);

第23页

? ? ? ? ?

态势分析与策略选择; 队形确定与角色分配; 目标位置确定; 运动轨迹规划; 左右轮速确定。

一般说来,第一、第四与第五和第六步屈于演绎推理,可由数学模型进行计算;而第二步和第三步属于产生式推理,智能由模糊推理、专家系统等方法完成。

下面重点阐述各推理的内容和算法: 第一步:输入信息预处理

其内容包括:与时刻前的输入矩阵进行比较,以计算出各实体(双方机器人和足球)的线速度和角速度;计算各实体的相对距离。 第二步:态势分析和策略选择

根据第一步所得到的信息,判断出球是在我方半场还是在对方半场,是我方控球还是对方控球。如果在我方半场,对方控球,则采取防守策略;如果在对方半场,我方控球,则采取进攻策略等等。 第三步:队形确定和角色分配

为使足球机器人在比赛中互相配合,协同作战,更好的完成任务而不至于冲突,需要给每个机器人分配角色。如:球在对方半场,我方机器人控球,则离球近的机器人为主攻,另一个机器人为协攻;球在我方半场,对方机器人控球,则我方离球近的机器人为主防,另一个机器人为协防;等等。这些任务都由角色分配来完成,角色分配模块的关系图如图3.3所示。

动 视觉信息 角色分配 作 选 输入信息预处理 决策库

图3.3 足球机器人角色分配示意图

第四步:目标位置确定及动作选择

这一步是赛场战术的前提。当策略确定后,就可确定每一个机器人的目标位置。被分配任务和指定目标位置的机器人要求能够快速地到其活动区域。每个机器人都被训练具有一定的能力,比如守门员的主要职责就是力保城门

第24页

不失,所以守门员的一个主要技术特点就是门前移动必须灵活和准确。守门员应能根据球的运动状态预测出球的运动趋势,并能迅速移动到指定点将球扑出,确保大门安全。

机器人的动作由低到高分为三层结构:基本动作——技术动作——战术动作。基本动作包括到定点(直线运动和弧线运动)、转角(原地转动和边转边走)、按照指定方向运动等。技术动作包括守门、射门、拦截、抢点、传球和障碍回避等。这些动作为机器人的个人动作,可以由基本动作支持完成。战术动作是更高一层的动作,指队员之间的协调和协作。每个战术动作的完成,需要调用多个技术动作,如一传一射、二过一等。 第五步:机器人运动轨迹规划

设计机器人的轨迹,从面上看就是机器人在哪些条件下要直接运动到定点,什么时候走曲线,曲线的弧度如何,哪些情况下要避障等等。机器人的路径规划方法很多,如人工势场法、中垂线法、遗传算法和神经网络等。 第六步:机器人左右轮速的确定

在确定了机器人的运动轨迹后,可以计算出机器人左右两轮的速度。在轮速计算上,应该充分考虑机器人的机械特性和平台特性,同时轮速的计算也涉及足球机器人的底层运动控制方法的选择。

根据六步推理模型,可以得到如下推理过程:(1)态势分析;(2)队形确定;(3)角色分配;(4)动作选择;(5)动作实现。足球机器人决策系统的体系结构就是根据此推理过程设计的。体系结构是决策系统的主心骨,它的设计好坏直接关系到整体性能的发挥和智能水平的高低。目前,构造足球机器人系统的体系框架主要有以下三种方法: 1.分层递阶式结构。 2.包容式结构。 3.分布式结构。

本文所研究的足球机器人的决策系统就是典型的分层递阶式模型,分层递阶式结构是把各种模块安排成若干个层次,在不同层次上的模块具有不同

[39] [40]

的动作性能和操作方式。一般来说,位于高层的模块负责复杂的判断和推理操作,其智能化程度较高,而较低层次的模块用于与外界交互,其智

[41]

能化程度较低。分层递阶式结构最有代表性的是Saridia提出的三级模型,他把整个结构按功能从高到低分成三个层次:执行级、协调级和组织管理级。如图3.4所示,在此结构中,底层的执行级用于与控制对象和环境交互;最高层用于组织管理,中间层连接上下两层,进行操作行为和协调。

第25页

视觉子系统 管 理 层 全局管理

协 调 层 任务分配

执 行 层 硬件驱动

足球机器人轮速设定 图3.4 分层递阶式结构的三级模型

可以看到在这种决策模型下,机器人的智能部分由统一的全局控制器来实现,使各个机器人仅作为全局控制器的执行机构,决策的流程是从上至下的,数据流是单向的,下层充分执行上层意图,执行过程流畅。为此,根据上面的推理模型,我们设计了如图3.5的决策子系统的结构图。 视觉信息 态势分析 高队形集 层队形选择

决 策角色集 角色分配 推 理 动作集 动作选择 动作执行 左右 轮速 底层 运动控制 小 车

图3.5 足球机器人决策子系统体系结构

第26页

3.3 足球机器人动作设计 3.3.1足球机器人动作设计的目的

动作是决策系统的最终体现,是决策的基础和保证,机器人动作完成的好坏是系统整体性能的最好验证。动作是比赛活动的基本单元,任何精彩激烈的比赛都是由球员的一系列动作构成的。可以说动作设计与完成的水平在是比赛胜负的关键因素,因此全面规范的动作设计,准确有效的动作实现在足球机器人决策系统设计中就显得尤其重要。一支球队如果球员动作粗糙,即使有超级教练指挥,也是难以赢得比赛的。

动作设计主要有两种途径:一是向人类足球比赛模仿学习,进行抽象得到动作定义;二是分析机器人足球比赛的特点,以目标为引导,采用自顶向下逐层分解的方法,按照功能划分机器人的动作。例如,最顶层目标是比赛胜利,即多进球,少输球,那么就要有能完成进攻和防守功能的两类动作:再逐层分解下去,直至基本动作单元为止。动作设计完成后,还要在仿真和实际的比赛中不断的改进完善。

3.3.2足球机器人动作的特点分析

机器人的动作是对人类智能行为的一种模拟,可以在功能上模仿人类的射门动作、拦截动作等。机器人通过动作来改变环境和自身的状态,每个动作都具有发生的条件和发生后的效果。总的来说足球机器人的动作有如下特点:

1)各种动作都是通过机器人的速度、位移和轨迹来实现的。如机器人转身动作需要有角速度控制来完成,再如障碍回避动作是由轨迹来体现的,而射门、防守等动作要控制机器人的速度和进行轨迹规划。

2)所有的动作最终都是由机器人小车的速度控制来体现的。速度包括线速度和角速度,足球机器人小车常采用双轮差动结构,因此这里的机器人小车速度控制也就是左、右轮速(VL , VR)函数的设计。

3)由于机器人在矩形场地进行足球比赛,实际上是机器人小车在平面上自主运动,这使得问题描述被极大地简化了。动作设计的主要问题也就非常清晰了,即如何设计快速平滑控制算法使得机器人从初始状态(初始位姿,初始速度)运动到期望状态(期望位姿,期望速度)。

4)动作设计和实现可行方案很多,颇具有灵活性。精彩激烈和富于变化的足

第27页

球比赛(包括人类和实际的机器人比赛)是足球机器人动作设计灵感的主要源泉。有关射门、传球配合等动作设计既可以体现创造性,又能结合受非完整约束机器人各种轨迹规划和控制的应用研究,这也正是足球机器人的魅力所在。

动作的结构化分层设计,应满足动作在不断发展的需要,当比赛规则、车体结构或驱动方式发生改变时,只需要改变底层动作控制。对人类足球训练过程进行抽象,即基本动作、技术动作以及战术动作。基本动作对应于运动员的基本素质训练,包括跑位(到定点)、转身(转角)等;技术动作包括射门、守门、传球以及大脚破坏等技巧性动作;战术动作是指由两个或两个以上的机器人通过相互配合完成的动作,如一传一射、二过一以及底线传中等。可以看出技术动作是在基本动作基础之上的,而战术动作又是以技术动作为基础的,动作空间组成如图3.6所示。

动作空间

战术动作

技术动作

基本动作

图3.6 动作空间组成示意图

一、 基本动作函数

基本动作函数对应的是底层控制中的位置控制和角度控制,位置控制就是到一个固定点;角度控制就是转向固定角度或转向一固定点。根据距离偏差和角度偏差利用模糊PID控制算法来控制左右轮速度。

1. TurnToAngle (dbROBOTPOSTURE *pRobot, double dbAngle, dbLRWheel Velocity *pSpeed)

函数功能:其基本思想也是误差消除法,将机器人与指定角度之间的误差消除为0。根据传入的小车位姿和指定角度,快速使小车转动到指定角度。 基本算法:

? 计算机器人Robot角度和期望角度dbAngle的差值theta; ? 将theta转换为(-90?,90?)之间的值,因为机器人是正方形,前后是对称的,因此以正方向或反方向为参考来转动效果相同。 ? 调用模糊PID控制算法,算出的左右轮速值。

第28页

?2 ???2??1 其中?=角度差 ??1:为指定的角度, ?1 ?2:为机器人的角度

图3.7转角动作图

2. ToPosition(dbROBOTPOSTURE* PROBOTPOSTURE, dbPOINT Target, dbLRWheelVelocity* pSpeed)

dx

函数功能:根据目标机器人的位姿和所要到机器人方 目标点 向角 dy 的目标点坐标值,可算出机器人移动到目标? d?dx2?dy2 点时实时的左右轮速值。

机器人 图3.8到定点动作图

基本算法:

? 计算机器人Robot角度与Robot坐标和目标点Target连线的角度值的差值theta,然后再将差值theta转化为(-90?,90?)之间的值。

? 判断theta绝对值如果大于60?,则调用原地转角函数TurnToAngle。 ? 根据theta判断机器人所应采取的运动方式:正转或反转、正向移动还是反向移动。

? 调用模糊PID控制算法,算出左右轮速度。

3. Move2pt(dbROBOTPOSTURE *pROBOTPOSTURE, dbPOINT Target, dbLRWheelVelocity* pLRWheelVelocity)

第29页

4. ToPositionNew(dbROBOTPOSTURE* robot, ballInformation ball, dbPOINT directionpt, double samespeed, int Endprocess, dbLRWheelVelocity* pSpeed) 函数功能:其基本思想也是误差消除法。根据传入的机器人位姿、球的信息、定点和同向速度使机器人迅速到达定点,并使其方向对准directionpt。 五、技术动作函数

技术动作函数是基于基本动作函数之上的。它是模仿真实世界里的足球运动员的动作设计出来的动作集合,包括:射门、防守、守门、边界处理、大脚解围等等。

5. Vect_midshoot1(dbROBOTPOSTURE*Robot,BallInformation &ball, dbPOINT Target ,dbLRWheelVelocity *pSpeed) 函数功能:传入参数Robot,ball,Target的实时信息值可算出并返回机器人的运动目标点N的坐标值和机器人左右轮速度。

本文设计了基于中分线的射门方法,机器人中分线射门算法的基本思想是:如果将机器人当前位置与球的位置连线,取这条连线的中分线,这条中分线与球和球门中点的直线有一个交点,假设在当前系统运行周期内,机器人向这个交点运动,而在下一个系统周期里,按同样的方法计算出新的交点,机器人再向新的交点运动,这样,机器人走出了一条平滑的曲线进行射门,如图3.10所示。

基于中分线的射门算法有两种,其一是基于角度的算法求出机器人应该运动的方向,调用机器人移动动作算法沿目标方向运动;其二是基于直线交点的射门算法,算法求出机器人射门需要设定的目标点,然后调用机器人到定点动作使机器人向目标点运动。在此我们利用第二种方法来研究中分线射门算法。基于中分线的轨迹规划方法,如图3.10,将小球B作为目标点,对

图3.9定向运动图

函数功能:根据传入的机器人小车位姿和指定角度,使机器人转到指定的角度向前移动,使机器人迅速到达定点,到定点时不减速。

第30页

方球门G作为方向点。调用中分线轨迹规划,得到规划目标点Ti作为机器人移动的目标点。经过N个周期规划点系列?T1,T2,T3.......Tn?引导机器人沿一条平滑轨迹线完成射门动作。

在利用中分线算法时,根据机器人、球和球门的位置,有两种情况:一是机器人在比较有利的位置如图3.10(设为状态S1),这时中分线与球和球门的连线的交点在球的后方;二是非有利位置,如图3.11(设为状态S2),此时中分线与射门线交点在球的前方。在第二种情况下,我们先让机器人运动到有利位置A点,然后按第一种情况处理。 Ti B B Ti T1 T 1 G G Ci Ci C C R R A

图3.10中分线射门方法示意图1 图3.11中分线射门方法示意图2

由图3.6可见,C为R与B的中点,关键是计算出T点的坐标。

直线BG的方程为:y?k1x?b1 (3-1) 直线CT的方程为:y?k2x?b2 (3-2)

则交点T坐标为:x?(b2?b1)(k1?k2) y?(k1b2?k2b1)(k1?k2) (3-3) 6. Vect_ midshoot2(dbROBOTPOSTURE*Robot, BallInformation &ball, dbPOINT Target ,dbLRWheelVelocity *pSpeed) 函数功能:传入参数Robot,ball,Target的实时信息值可算出并返回机器人的运动目标点N的坐标值和机器人左右轮速度。

本文设计了另一个关于切入圆算法的射门函数,球点B、射门目标点T(对方球门的中点)和机器人点R,连接TB直线,在TB延长线上确定一点M,使MB长为L,以M为切点,以R为半径作圆,此圆即为机器人进

第31页

入射门角度的切入圆,做MR的垂直中分线,与切入圆的交点为N1,则N1就可作为机器人当前行进的目标点,当机器人更新后,按此法又可以确定新的目标点N2,依次类推。

L BT 0N2

N1R1 R2

图3.12 射门函数的切入圆算法示意图

7. ClearBall(dbROBOTPOSTURE *pRobot,ballInformation dbLRWheelVelocity *pSpeed)

函数功能:调用函数ToPositionNew(),完成扫球动作。

图3.13 扫球动作

ball,

8. GoalKeep(dbROBOTPOSTURE*Robot,BallInformation&ball,dbLRWheel Velocity *pSpeed)

函数功能: 输入机器人信息足球位置和速度信息,算出守门员移动的目标点。

第32页

X?X0 拦截点 Lf>L>Lm 拦截点 拦截点 LLf 图3.14守门动作中拦截点的选取

守门动作是让守门员去拦截球,以免对方进球得分。由于守门要求的安全性更高,所以需要从以下两个方面考虑:一是根据球与我方球门之间的距离而采用不同的公式计算目标点。二是拦截位置只局限于禁区内。在具体实现时,我们根据球与球门之间的距离不同而分别处理。见图3.14所示,当距离较远时,拦截点选在球与球门中心的连线L与直线X?X0的交点;(Xi,Yi)当距离较近时,拦截点为:Xi?X0,Yi?Yb,Yb为球的纵坐标;当距离非常近时,拦截点就是球了。

9. BoundPushBall(RobotInford charRobot,dbPOINT ballPt,dbLRWheelVelocity &rbV) 函数功能: 根据传入的机器人位姿、球的信息定出球所在的边界,使机器人转动到平行于边界,调用函数ToPosition ()沿边线推球。

上面进行了基本动作和技术动作的设计,战术动作实际上使基本动作和技术动作的综合统一,这里就不进行介绍了。 3.4 小结

本章介绍足球机器人决策子系统的模型,首先分析了角色分配法、时间区域控制法、人自为战法等常见模型缺点。然后重点分析了一种自上而下的分层递阶决策推理模型,最后对机器人动作进行了分析和设计,并设计了些动作函数。

第33页

第四章 足球机器人的运动控制和路径规划

4.1 足球机器人的运动学和动力学模型

足球机器人的运动学和动力学模型是研究足球机器人运动控制乃至策

[42]

略系统的基础和关键,也是建立足球机器人仿真系统的基础。 4.1.1坐标系的建立

在微型足球机器人系统中机器人是在一个二维平面上运动,通过垂直悬挂的摄像机获取平面场地图像,使用二维直角坐标系就可以描述机器人的位置。有如下坐标系定义:

(1)视觉坐标Vision Coordinates (VC)

表示:?V?,或OXY亦称为像素坐标。其坐标原点为一幅图像的左上角。其X轴方向自左向右,Y轴方向自上向下。 (2)球场坐标Field Coordinates (FC) 表示:?F?,也称为基础坐标系OXY.

本文研究的是以一种差轮驱动的足球机器人对象,在一个近似矩形的场地里做平面运动。在以场地为标准的基础坐标系?F?内,机器人质心坐标?x,y?代表机器人的位置,机器人正方向与基础坐标系X轴的夹角?表示机器人的姿态。在这里机器人的位姿P和位置PC分别定义为:

P?[x,y,?]T PC?[x,y]T (4-1) 4.1.2运动学模型

足球机器人采用独立双轮驱动模式,通过控制左右轮速差来完成各种基本的动作,对机器人要进行有效的运动控制,首先要对其进行运动学分析,足球机器人是一个具有非完整约束的两轮驱动小车,如图4-1所示。

图4.1中,v为机器人质心的线速度,vL和vR分别为左右轮的线速度, r为左右轮的半径, L为两轮的间距, x和y分别为机器人质心的二维平面坐标,机器人的运动包括两个部分:小车中心的平动和绕小车中心的转动。足球机器人满足刚体运动规律,

第34页

图4.1 足球机器人的运动示意图

运动方程(4-1)和(4-2)成立。

vL?rwL , vR?rwR (4-2)

w?vR?vLv?v, v?RL (4-3)

2L式中,?R和?L分别代表左右轮的角速度, w为质心的角速度, v为质心

的线速度, 由式(4-3)可知, 当vL=vR 时, 质心的角速度为0, 机器人走直线; 当vL= -vR 时, 质心的线速度为0, 机器人可实现原地转动。 而机器人的质心运动方程为:

??? (4-4) ??v?cos?,y??v?sin?,?x因为?只与质心的角速度有关,x,y只与质心的线速度有关, 故可将控制变量转为质心的线速度和角速度。 则机器人的运动学方程可表示为:

???cos??x????sin?y ????????????00??v?0???w? (4-5) ??1??定义速度向量U为:

?v??1/21/2??vL? (4-6) U?????????????1/L1/L??vR???S?q??U其中,S?q?为机器人的雅可比或记为P(Jacobian)矩阵,速度向量U为系统的输入向量(控制向量)。

4.1.3动力学模型

足球机器人小车是一类典型差轮驱动的移动机器人,它由两个独立驱动

第35页

轮组成,两驱动轮是由两台直流伺服电机提供动力。利用分析力学中的拉格

[43]

朗日方程,可以推导出差轮驱动的移动机器人动力学方程的统一形式为

???C(q,q?)q??F?q???G(q)??d?B(q)T?AT(q)? (4-7) M(q)q??0 (4-8) A(q)q?)?Rn哥氏力其中q?Rn为广义坐标向量。M(q)?Rn?n惯性力矩矩阵,C(q,q???Rn和G(q)?Rn分别表示摩擦、重力向量,B(q)?Rn?r输和离心力向量。F?q入变换矩阵,?d是包括有界的未建模动力学的未知扰动,T控制输入向量,??Rm乘积因子向量,A(q)?Rm?n满秩约束矩阵。选择一满秩矩阵S?q???S1?q?,?,Sn?m?q??为A?q?零空间的一组基,既有A?q?S?q??0,则存在

Tv??v1,?,vn?m?表示新的控制输入,使得约束方程(4-8)可以写成:

??S?q?v (4-9) q对(4-8)求导得:

??q?v (4-10) ???S?q?v??Sq将(4-10)代入(4-7),并将方程两边同时乘以ST以消去约束项AT?q??。 非完整约束使得移动机器人只能在与驱动轮轴垂直的方向上运动,即约束方程为:

?sin??y?cos??0 (4-11) x移动机器人的动力学方程为:

1????T1?T2?cos???sin?mx??r?1????T1?T2?sin???cos? (4-12) y ?m?r????L?T?T??I?12?r?我们可将上述移动机器人的动力学方程改写成如式(4-2)、(4-3)的一般

形式,在笛卡儿坐标系下,机器人的位姿、速度、角速度用(x, y,?,v,w)来表示,其中m为足球机器人质量,I为轮子的转动惯量,q??x,y,??T为状态向量,T??T1,T2?T为驱动电机产生的控制力矩,则相应的矩阵M,B,A分别为:

?m00??cos??,B?1?sin?M??0m0??r????00I???Lcos??sin???,A???sin??L??cos?0?

我们选择矩阵A的零空间基矩阵S?q?为:

第36页

?cos?S?q????sin???00?0?? (4-13) 1??则按照上面方法可将系统表示为如下的状态空间形式:

?1??1?m?v? ?????r?L?????m1?I?T (4-14) L???I?在建模过程中,我们必须考虑到各种因素的影响。为了提高控制性能,电机动力学不能轻易忽略,控制设计中必须考虑到电机模型的影响。 直流电机的通用模型为:

ldi?r?i?kew?u (4-15) dt其中l,r,ke分别为电机电枢的电感、电阻和反电动势常数,u为输入端电压。将驱动力矩Ti和wi角速度折合到电机轴上,有:

l?r??ui (4-16) Ti?Ti?ke???kT?kT其中,?为齿轮减速比,kT为电机力矩常数,i对应左右轮。联立上述(4-14),

(4-15)可得以电机电压u为控制量的移动机器人动力学模型:

??S?q?vq? (4-17) ????Hv?Bv?Kv?u?其中H?rl2L?kT?LmI?rr, B??Lm?I?2L?kT??ke??1L??LmI?,。 K??Lm?I???r?1L???4.2 基于模糊PID的足球机器人运动控制

足球机器人是一个集环境感知、动态决策和行为控制于一体的综合系

统。底层运动控制是其最基本、也是非常重要的一环,对于足球机器人来说,本决策控制的目的就是使之能精确并且快速地实现所在地跑到目的地。目前, 较常用的控制方式主要是PID 控制法和模糊逻辑控制法。由于图像采集的滞后和图像识别的不精确性、控制机器人左右轮的电机的不完全对称性以及场上的各种干扰因素等, 使得机器人的运动具有时变、非线性、干扰大和不确定等特性, 用传统的PID 控制器已不能达到较好的控制效果,而模糊控制无需建立精确的数学模型, 具有较强的鲁棒性, 可用于非线性、时变及时滞系

第37页

统的控制, 是一种对模型要求不高但又有良好控制效果的控制新策略。可是,任何一种纯模糊控制器本质上是一种非线性PD控制, 不具备积分作用,

[46]

控制过程有时会出现不平滑现象, 稳态误差也较难减至理想程度。因此, 模糊PID 控制方法无疑可以取得比传统PID 控制或单一的模糊逻辑控制更好的控制效果. 其具体的控制策略思想是通过一个控制器切换指标来协调在两种控制器之间的切换,使两种控制器在不同范围内发挥其优势,在大偏差范围内采用模糊控制,而在小偏差范围内则转换成PID控制,两者的转换

[47]

由微机程序根据事先给定的偏差范围自动实现。 4.2.1 控制系统设计

下面设计一种模糊PID控制系统,本文提出模糊PID控制器由4个控制器组成:两个模糊控制器和两个PID控制器,这4个控制器分为两组,一组用于控制机器人的角度转动,一组用于机器人的位置移动。其控制原理结构图,如图4.2所示。图中r?为角度的输入,w为为质心的角速度,,e?为所在地与目的地之间的角度差,ed为所在地与目的地之间的距离差,v为质心的线速度。 |e?|?|e0| 模糊控制器I _ d/dtwr被e ?+ ?控 PID控制器 ?对 rd 象?vPID控制器 ed+ _ d/dt 模糊控制器II |ed|?|e0| 图4.2 控制系统结构图

[44][45]

4.2.2 PID控制器设计

数字PID控制方法是在工业过程的发展史上历史最悠久,生命力最强的控制方式,PID控制器以其结构简单、稳定性好、调整方便而成为工业控制的主要的技术工具,它是一种线性控制器,将偏差的比例(P)、积分(I)和微分(D)通过线性组合构成控制量其原理框图如图4.3所示。

第38页

图中r(t)为给定输入信号,e(t)为偏差信号,u(t)为控制信号,c(t)为实际输出信号,其控制规律为

?1u?t??KP?e?t??TI??t0e?t?dt?TDde?t??? (4-18) dt?KP为比例系数,TI为积分时间常数,TD为微分时间常数。

r(t) + e(t) 比例KP c(t) + 被控对象 积分KI

- +

微分KD 图4.3 数字PID控制原理

在FIRA Mirosot 机器人足球比赛系统中,视觉采集卡以每秒30帧的速率提供比赛场地信息,是一种采样控制方式,只能根据采样时刻的偏差值计算控制量,因此在上式的积分微分不能直接使用,需要进行离散化处理,可得离散PID表达式为

u(k)?KPe(k)?KI?e(k)?Kd[e(k)?e(k?1)] (4-19)

k?0k+ u(t) 式中k为采样序号,即第几拍,u?k?为第k次采样时刻得计算输出值;e?k?为第k次采样时刻输入得偏差值;e?k?1?为第k?1次采样时刻输入得偏差值;KI为积分系数;KD为微分系数。 4.2.3 模糊控制器的设计 4.2.3.1 模糊控制器的基本原理

模糊集理论是美国加利福尼亚大学的自动控制理论专家L. A. Zadeh教授率先提出的。1965年他在Information & Control杂志上发表了“Fuzzy set”一文,首先提出了模糊集合的概念,用模糊集合来描述模糊事物。这种方法很快被广大的学者所接受,模糊数学及其应用得到了快速的发展。1974年,英国伦敦大学教授E.H.Mamdani首先将模糊理论用于工业控制,取得了

[48]

良好的效果。

第39页

在自动控制技术产生之前,人们在生产过程中只能采用手动控制方式。手动控制过程首先通过观测被控对象的输出,其次是根据观测结果做出决策,然后手动调整输入,操作工人就是这样不断地观测→决策→调整,实现对生产过程的手动控制。这三个步骤分别是由人的眼-手-脑来完成的。后来,由于科学和技术的进步,人们逐渐采用各种测量装置(如磁放大器,由直流运算放大器加阻容反馈网络构成的PID调节器等)部分地取代人脑的作用,实现比较飞综合被控制量与给定量之间的偏差,控制器所给出的输出信号相当于手动控制过程中人脑的决策;使用各种执行机构(主要是电动的、气动的,如伺服电机、气动调节阀等)对被控对象(或生产过程)施加某种控制作用,这就起到了手动控制中手的调整作用。经过人们长期研究和实践形成的经典控制理论,对于解决线性定常系统的控制问题是很有效的。然而,经典的控制理论对于非线性时变系统难以凑效。随着计算机尤其是微机的发展和应用,自动控制理论和技术获得了飞跃的发展。基于状态变量描述的现代控制理论对于解决线性或非线性、定常或时变的多输入多输出系统问题,获得了广泛的应用。但是,无论采用经典控制理论还是现代控制理论实际一个控制系统,都需要事先知道被控对象(或生产过程)精确的数学模型,然后根据数学模型以及给定的性能指标,选择适当的控制规律,进行控制系统设计。然而,在许多情况下被控对象(或生产过程)的精确数学模型很难建立。

通过总结人的控制行为,人们了解到其遵循反馈和反馈控制的思想。人的手动控制决策可以用语言加以描述,总结成一系列条件语句,即控制规则。运用微机的程序来实现这些控制规则,微机就起到了控制器的作用。在描述控制规则的条件语句中的一些词,如“较大”、“稍小”、“偏高”等都具有一定的模糊性,因此可以用模糊集合来描述这些模糊条件语句,即组成了模糊控制器。

4.2.3.2 模糊控制器I的设计

模糊控制器的组成如图4.4所示,它包括有:输入量模糊化接口、数据库、规则库、推理机和输出解模糊接口五个部分。

第40页

数据库 知识库 规则库 数据输入 模糊化接口 推理机 解模糊接口 数据输出

图4.4 模糊控制器的组成

一般地,模糊控制器的设计步骤包括以下几点: ? 模糊控制器的输入和输出变量的模糊化; ? 设计模糊控制器的控制规则; ? 确定模糊推理和去模糊化的方法;

? 选择模糊控制器的输入变量及输出变量的论域,并确定模糊控制器的参数(如量化因子、比例因子等)。

以下就模糊控制器的设计步骤加以说明。

1. 定义变量的模糊集

输入变量是通过视觉采采集后经过计算得到的精确数值,模糊控制要求输入量为模糊化之后的值,因此需要对它们模糊化处理,在系统设计中要注意,模糊化的等级不宜分得过细过密,否则它不仅失去某些信息,体现不出模糊量的长处,而且会大大增加运算与推理过程的工作量,使之计算机实现更为困难,模糊化的等级分得太粗又得不到较好的控制精度。所以本文对角度误差选择8个模糊子集,量化等级数为14;角度误差的变化量和输出量w都选择7个模糊子集,量化等级数为13。对应的各模糊子集分别为:

EC1={PB,PM,PS,ZO,NS,NM,NB} U1={PB,PM,PS,ZO,NS,NM,NB} E1={PB,PM,PS,PO,NO,NS,NM,NB}

其中角度误差的模糊子集描述为负大、负中、负小、正零、正小、正中、正大,另外两个类似。在足球机器人系统中,机器人小车可以双向踢球,所以角度误差e?的基本论域为(-90,90)模糊子集E1论域为 (-6,-5,-4,-3,-2,-1,-0,+0,1,2,3,4,5,6),模糊子集EC1和U1论域为(-6,-5,-4,-3,-2,-1,0,1,2,3,4,5,6)。

隶属函数是对模糊概念的定量描述,常用的有高斯函数三角函数钟形函数S形函数等。本文中各模糊变量的子集都采用高斯型隶属函数:

本文来源:https://www.bwwdw.com/article/a49g.html

Top