约束切换与阻抗显示力反馈设备的稳定性研究x 王

更新时间:2023-04-24 08:39:01 阅读量: 实用文档 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

约束切换与阻抗显示力反馈设备的稳定性研究x 王

第26卷第2期2004年3月

文章编号:100220446(2004)0220097205

机器人 ROBOT

Vol.26,No.2

March,2004

约束切换与阻抗显示力反馈设备的稳定性研究

王党校1,张玉茹1,王玉慧1,吕培军2,王勇2

Ξ

(1.北京航空航天大学机器人研究所,北京 100083; 2.北京大学口腔医学院计算机应用中心,北京 100081)

摘 要:研究了虚拟现实力觉交互系统中基于阻抗显示原理的交互设备丧失稳定性的原因以及振荡抑制方

法.通过分析单边约束的特点,将复杂虚拟物体形状的感知和交互过程归结为动态单边约束的接触问题.采用力反馈设备Phantom(R)建立试验平台,通过分析不同类型的单边约束下虚拟力信号的时间和空间分布规律,发现了动态单边约束交互仿真中产生振荡的原因.给出了基于虚拟力信号空间梯度的消除振荡的方法.试验表明,该方法可以有效抑制振荡,实现稳定的力觉交互控制.

关键词:单边约束;阻抗显示;力信号空间梯度;稳定性中图分类号: TP24    文献标识码: B

ConstraintSwitchingandStabilityIssuesinImpedance

DisplayForceFeedbackDevice

WANGDang2xiao1,ZHANGYu2ru1,WANGYu2hui1,LU¨Pei2jun2,WANGYong2

(1.RoboticsInstitute,BeijingUniversityofAeronauticsandAstronautics,Beijing100083,China;

puterizedDentistryCenter,StomatologySchool,PekingUniversity,Beijing100081,China)

 Abstract:Thispaperdiscussesstabilityproblemofhapticdeviceinhapticdisplaysystems.Basedontheanalysisofimpedance

displaydevice,ingPhantomRastheexperimentplatform,forcedistributionrelativetotimeandtodevicepositioninseveraltypicalunilateralconstraintsiscompared,paredwithpassivity2basedstabilityanalysismethod,aforcefilteringmethodbasedonforce2positiongradientisproposed.Experimentre2sultsindicatethattheproposedmethodcaneffectivelyeliminatevibrationandstableinteractioncanberealized.

()

 Keywords:unilateralconstraint;impedancedisplay;gradientofforcesignalinspacedomain;stability

1 引言(Introduction)

力觉交互系统通过带有力反馈功能的人机交互设备,使操作者操作计算机内的虚拟环境,感受到交

互过程的操作力.借助于计算机提供的三维图形显示和力觉设备的力觉显示,增强操作真实感,提高操作效率.力觉交互技术在机器人遥操作、手术模拟和培训、虚拟现实游戏娱乐、计算机辅助产品设计等领域具有广泛的应用前景[1].

力觉交互系统主要由操作者、力觉交互设备、虚拟仿真环境几部分组成,属于一种特殊的机器人系统.交互设备一般为串联或并联的机械臂,操作者抓持设备,通过虚拟仿真环境生成不同的力控制规律,模拟人与不同虚拟物体交互的力觉感受.与传统机器人控制相比,力觉交互系统具有两个特点:一是

Ξ基金项目:国家自然科学基金资助项目(50275003).收稿日期:2003-07-12

由于人与机器人直接接触,人成为机器人的环境,操作者操作方式和抓持方式不同,导致对机器人的约束状况的改变;二是虚拟仿真环节类似机器人控制器,由于交互系统模拟的操作类型差别很大,控制器可能表现出时变、非线性等特点,因此,在力觉交互设备控制时,会出现振荡、噪音等丧失稳定性的情况.这种振荡不仅导致力觉感受真实感的丧失,还可能会对操作者造成伤害,所以力觉交互系统的稳定性是系统设计的重要指标[2].

力觉交互系统的稳定性主要取决于力觉交互设备的设计和控制、虚拟环境模型的设计[3].前者主要包括控制器的超边界行为、交互设备未知的动力学模型、编码器的量化噪声、零阶保持器的能量滞后等,都会导致控制系统不稳定[4].本文基于商用力

约束切换与阻抗显示力反馈设备的稳定性研究x 王

98 机 器 人2004年3月

觉交互设备Phantom(R)讨论稳定性问题,控制器和机

械系统参数均已经确定.

在分析稳定性时,虚拟环境的模型大都集中在“虚拟墙壁”问题上,通过分析单边约束来描述交互模型和振荡问题.Gillespie建立了人的可重复运动的动力学显式模型,将这个模型作为系统传递函数的一个环节,指出“能量泄漏”是导致虚拟墙壁模拟时产生振荡的原因[4].Adams等提出基于被动性的控制方法,不要求建立人的显式模型,将人看作被动环节时,基于被动性假设,忽略人的因素对稳定性的影响,采用虚拟匹配或能量方法,保证力觉交互系统对于任意被动虚拟环境的稳定性[2,5].在工具与复杂形状的三维物体交互时,单边约束不能描述交互过程环境阻抗变化的非线性因素,因此本文重点考虑虚拟环境模型造成的失稳和振荡问题,讨论复杂虚拟环境计算模型对稳定性的影响.

泛的研究[6].虚拟墙壁的计算模型如图

3.

图2 阻抗显示设备Phantom(R)

Fig.2 PhantomRimpedancedisplay

device

()

2 单边约束交互(Unilateralconstraintinter2action)

力觉交互系统为如图1所示的连续和离散环节

混合系统.交互设备根据工作原理不同分为阻抗显示和导纳显示两种类型

.

其式为:

Fe=Ke(Xh-X0)…Xh≥X0Fe=0…Xh<X

(1)

图3 虚拟墙壁交互模型

Fig.3 Virtualwallinteractionmodel

其中Xh为装置的位置信号,X0为虚拟墙壁边界的位置坐标,Ke为虚拟墙壁的接触刚度,Fe为虚拟力

信号.

()

PhantomR作为阻抗显示原理的设备,通过测量运动来衡量人的运动趋势(即主动力方向和大小),由于交互设备刚度的有限性[6],在模拟单边约束(虚拟墙壁)时,力觉装置末端位置(HIP)必定嵌入约束

图1 力觉交互系统组成简图

Fig.1 Componentsofforceinteractionsystem

目前研究界主要采用基于阻抗显示原理的力觉

装置,图2所示为美国Sensable公司产品Phantom(R)Desktop.使用时,操作者抓持设备末端的手柄,位置传感器测量装置末端位置信号,送入虚拟仿真环境,计算得到虚拟力,发送给设备控制器,通过力控制将交互力施加给操作者,实现逼真的力觉感受.

单边约束是自然界中一种广泛存在的运动约束[6],力觉交互系统的目标是模拟物理交互过程,因此“,虚拟墙壁”作为一种典型的单边约束,得到了广

边界内部.当装置位置处于约束外侧,称为装置位于

自由空间内.当装置进入约束内部时,称为装置位于约束空间内.当装置进入约束空间内,虚拟力计算需要保证虚拟力信号和装置运动之间的关系,反映物体交互属性的变化要求(如挤压深度对接触力幅值的影响、接触力方向、摩擦、纹理等).

在虚拟墙壁模拟中,动态工具采用质点描述,静态墙壁采用解析模型,属于基本单边约束的求解问题[7].在与复杂形状物体交互时,如牙齿交互仿真系统中,工具为球体形状,牙齿为采用三角片模型表达的复杂形体,如图4所示.

约束切换与阻抗显示力反馈设备的稳定性研究x 王

 第26卷第2期王党校等: 约束切换与阻抗显示力反馈设备的稳定性研究99

ΔF‖F(t)=‖/Δt

其中

Δt=tk-tk-1ΔF=Fk-Fk-1

.

(2)

(3)

tk、tk-1分别为当前采样时刻和上一个采样时刻;Fk、Fk-1分别为当前采样时刻和上一个采样时刻计

图4 牙齿的三角片网格模型

Fig.4 Trianglemeshmodeloftooth

算得到的虚拟力向量.

定义力的空间梯度,即离散力信号随装置末端位置变化率为Kec,计算过程如下:

ΔX=Xk-Xk-1ΔF=Fk-Fk-1

→→

为了获得逼真的仿真效果,需要对球体外形和三角片网格进行实时碰撞检测,计算嵌入深度,然后基于弹簧力模型计算接触力.在切削过程中,牙齿三角片网格的边界随着牙齿材料的去除在实时改变.与基本单边约束区别在于:①虚拟力计算的离散化,导致单边约束对应的等效接触刚度在变化,即式(1)中的Ke成为变量;②由于切削导致约束的空间位置

X0在变化,因此,可以将工具与复杂形状物体交互

 

(4)(5)(6)

ΔX′=ΔXΔF/‖ΔF‖ΔF‖ΔX′Kec=‖/‖‖

其中,Xk、Xk-1分别为当前采样时刻和上一个采样

时刻力觉装置末端的位置向量.3.2 不同单边约束试验比较

抽象为动态的单边约束交互问题.给出如下两个定义:物理约束边界———自由空间和约束空间分界

点;虚拟约束边界———在物理约束空间的内部,不同接触刚度的分界点.接触刚度的变化可能由于被接触物体本身的非线性刚度造成(如生物体组织接触刚度非线性),也可能由于虚拟力计算方法造成等效接触刚度的变化而造成.

基于上述分析,牙齿交互问题变成动态单边约束的模拟问题.为了分析动态单边约束模拟中力和运动的关系,下一节针对几种典型的动态单边约束,分析力信号的时间和空间分布,以便得到动态单边约束交互时产生振荡的原因.

几种典型单边约束试验设计如下:

(1)按照等刚度变化,即经典虚拟墙壁的模型,

记为约束交互模型1;

(2)随位置变化,由小刚度进入大刚度的虚拟墙壁模型,记为约束交互模型2;

(3)基于球体工具外形的碰撞检测,球形工具和牙齿三角片网格接触交互,记为约束交互模型3;

(4)基于球体工具外形的碰撞检测,球形工具和牙齿三角片网格切削交互,即牙齿三角片网格发生动态变形,导致约束边界的变化,记为约束交互模型4.

约束1的计算模型如式(1)所示,分别选取Ke=1N/mm,Ke=3N/mm,试验发现,前者可以稳定交互,后者发生振荡.

约束2的计算模型为:

Fe=Ke(Xh-X0)…Xh≥X0Fe=0…Xh<X0Ke=Ke1…Xh≥X1

Ke=Ke2…X0≤Xh<X1

(7)(8)

3 动态单边约束交互(Dynamicunilateral

constraintinteraction)

3.1 力的时间和空间梯度

如图1所示,虚拟环境对稳定性的影响体现在虚拟力和运动的关系(力的空间分布和时间分布)上,本节通过比较几种单边约束交互模型的区别,来分析不同的力的空间和时间分布规律对力觉交互稳定性的影响.

在力觉仿真中,位置信号和虚拟力信号通过离散采样和计算得到.定义离散力信号随时间的变化率F(t),即力的时间梯度为:

.

其中,|Ke1|>|Ke2|.按照如下参数进行试验,Ke1=-1N/mm,Ke2=-0.5N/mm,X0=0,X1=2.5mm,交互时产

生振荡.

对比上述四个模型,分别计算交互过程中,离散力信号的时间梯度Ket、力的空间梯度Kec,图58给

约束切换与阻抗显示力反馈设备的稳定性研究x 王

出了模型2和模型4的试验结果,其他试验结果表

现出类似特性,由于篇幅所限没有给出

.

对试验结果分析,可以得到如下结论:

固定刚度虚拟墙壁在刚度过大时,在墙壁边界处由于自由空间和约束空间的切换发生振荡;变刚度虚拟墙壁在约束空间内,不同刚度切换位置处(即虚拟约束边界)产生振荡;

虚拟墙壁模拟属于基本单边约束的交互问

题,特点是交互力Fk和装置运动信号Xk之间存在线性关系,只要保证线性比例系数小于某一给定值,即可避免振荡;

在复杂形状物体交互时,虚拟力计算方法导

图5 模型2力的时间梯度

Fig.5 Force2timegradientinmodel

2

致从力觉设备的运动到交互力成为非线性映射关系,因此装置在约束空间内运动时,仍然会因为等效接触刚度的变化,导致装置不断穿越“虚拟约束边界”,虽然虚拟力模型中弹性系数小于给定阈值,但计算造成的等效刚度在变化,可能会超出给定阈值;

比较不同交互模型下F(t)的变化,发现保证力随时间的连续性并不能保证稳定交互,据此判断振荡不取决于力信号随时间变化规律;

在工具与牙齿的接触和切削交互中,力的空间梯度呈现大幅度阶跃变化,据此判断力的空间梯度超过给定阈值Kelimit是导致振荡的原因.基于该判

.

图6 模型2力的空间梯度

Fig.6 Force2positiongradientinmodel

2

据可以研究消除振荡的方法.

4 振荡消除方法(Vibrationelimination

method)

目前消除力觉设备振荡的方法主要有虚拟匹配方法[2]和时间域被动性控制方法[5].

虚拟匹配方法的基本原理是对进入虚拟环境的运动信号和虚拟环境输出的力信号同时进行处理,使最终信号关系满足双端口网络无条件稳定的范围.具体实现形式表现为由弹簧和阻尼元素串并联构成信号处理环节.对解析形式表示的一维虚拟墙壁,可以推导出解析的信号处理计算表达式,但对于采用三角片模型描述的物体,计算算法比较复杂.

时间域被动性控制方法基于被动性假设,将操作者、力觉交互设备、虚拟环境分别看作电网络端口环节,定义能量观测器来描述一个端口元件被动性损失的程度,在被动性损失时,对力信号进行修正,达到保证整个系统被动性的目的.这种方法在计算能量时需要进行速度微分,在低速操作时会引入比较大的计算噪声,造成力觉设备的振荡和噪音.

图7 模型4力的时间梯度

Fig.7 Force2timegradientinmodel

4

图8 模型4力的空间梯度

Fig.8 Force2positiongradientinmodel4

本文基于力的空间梯度概念,设计一种消除振荡的简化方法,以便实现稳定的力觉交互仿真.

约束切换与阻抗显示力反馈设备的稳定性研究x 王

基于力觉交互设备Phantom(R)的性能参数,选择力的空间梯度阈值Keclimit,对力信号进行修正,保证力信号空间梯度与力觉交互设备的阻抗范围相匹配,达到消除振荡的目的.修正模型如下:

ecec

Fk=Fk+ΔF(Klimit/Kc)…Kc>Klimit→→

′′

→→

Fk=Fk…Kc≤Klim

ec

(9)

it

其中F′k为修正后的虚拟力信号.

对于3.2节的模型2的变刚度虚拟墙壁,选择ec

Klimit=1.5N/mm,试验测量得到力觉装置位置信号随时间的变化曲线如图9所示,图10为交互力的空间梯度变化曲线.由图可见,信号处理后力的空间梯度变化幅度大大减小,有效地抑制了振荡

.

图11 表面探测交互力信号

Fig.11 Forcesignalduringsurfaceprobing

图12 切削过程交互力信号

Fig.12 Forcesignalduringcutting

图9 模型2经力滤波处理后的位置信号

Fig.9 Positionsignalafterforcefilteringinmodel2

5 结论(Conclusion)

本文基于阻抗原理交互设备,讨论复杂形状物

体感知和切削时振荡问题的产生原因和消除的方法.首先将复杂物体形状的感知和交互过程归结为动态单边约束的接触问题;然后通过分析力的时间和空间分布梯度,对比基本单边约束和复杂单边约束的区别,指出由于约束切换,导致力信号空间梯度过大,这是复杂单边约束交互产生振荡的原因;通过对虚拟力信号进行滤波,保证力信号空间梯度与力觉交互设备的阻抗范围相匹配,达到了消除振荡的

图10 模型2经力滤波处理后的力空间梯度

Fig.10 Force2positiongradientafterforcefilteringinmodel2

本文的方法集成在牙科手术力觉交互仿真系统中,实现了操作球形工具对牙齿进行滑动接触和表面切削的模拟.在工具沿牙齿表面滑动的接触试验中,交互过程中嵌入深度的变化如图11所示,在工具沿牙齿表面切削试验中,交互过程中嵌入深度的变化如图12所示.采用该方法前后,操作者感受的效果存在明显的差别,试验结果表明,该方法可行地实现了仿真系统稳定性和逼真度的折衷

.

目的.通过试验验证了该方法的有效性.未来的研究将探讨基于力的空间梯度修正方法对于力觉仿真系统逼真度的影响,对该方法进行优化.

参考文献 (References)

[1]SrinivasanMA,BasdoganC.Hapticsinvirtualenvironments:taxono2

my,researchstatus,andchallenges[J].Computer&Graphics,1997,21(4):393-404.

[2]AdamsRJ,HannafordB.Stablehapticinteractionwithvirtualenviron2

ments[J].IEEETransactionsonRoboticsandAutomation,1999,15(3):465-474

(下转第106页)

约束切换与阻抗显示力反馈设备的稳定性研究x 王

106 机 器 人2004年3月

从实验结果不难看出,该方法不但可以使月球

车完全适应陌生的动态环境,还可以在线进行学习,满足系统的实时性.为了验证此方法对于系统可靠性的提高,将它与模糊控制和强化学习方法进行了比较.将月球车分别放置于障碍物稀疏和密集两种环境下,为其任意制定起始点,实验结果如表2.

表2 实验结果

Table2 Experimentsresults

稀疏环境成功率

模糊控制方法标准强化学习方法模糊Q学习方法

89%92%98%

5 结论(Conclusion)

本文给出了多月球车的分布式定位/通讯网络.基于模糊学习的月球车行为决策方法不但克服了模糊控制方法完全依靠参数的调节和不具备记忆功能的缺点,又解决了强化学习方法行为搜索过程相对缓慢的问题.计算机仿真试验表明,此方法既利用模糊控制算法简便的特性,完成实时行为选择,又可利用强化学习,完善自身行为的适应能力.

参考文献 (References)

[1]王巍,梁斌,夏玉华,等.月球漫游车关键技术初探[J].机器人,

2003,1(3):280-284.

[2]SchwartzA.Areinforcementlearningmethodformaximizingundiscount2

edrewards[A].ProceedingsoftheTenthInternationalConferenceonMachineLearning[C].Amherst,MA:MorganKanfmannPublishers,1993.298-305.

[3]WhitleyD,DominicS,DasR,etal.Geneticreinforcementlearningfor

neurocontrolproblems[J].MachineLearning,1993,13(4):259-284[4]PiggottP,SattarA.Reinforcementlearningofiterativebehaviorwith

multiplesensors[J].JournalofAppliedIntelligence,1994,4(2):381-365.

[5]KaelblingLP.Associativereinforcementlearning:functioninK2DNF

[J].MachineLearning,1994,15(2):279-298.

[6]TesauroGJ.TemporaldifferencelearningandTD2Gammon[J].Com2

municationsoftheACM,1995,38(3):58-68.

密集环境

成功率

78%85%94%

平均通过时间

243626

从实验结果可以看出,无论在障碍物稀疏还是密集的情况下,模糊Q学习方法的通过率均高于其它两种方法.由此可见,该方法具有较强的鲁棒性.另外,从平均通过时间的比较可以看到,基于模糊Q学习的方法所需时间大约比纯粹的强化学习方法缩短30%,这在很大程度上是因为处于底层的模糊算法缩减了计算量,为高层的强化学习算法指明了搜索方向.需要指出的是,虽然所提出的方法比纯粹的强化学习方法所需时间短,但是要比模糊控制方法所需时间长.这主要是因为当环境情况较为复杂时,月球车容易陷入局部最小点,这也是我们在以后的研究过程中需要进一步改进的地方.

作者简介:

 孟 伟(19742),女,博士研究生.研究领域:智能机器人,

智能控制.

(上接第101页)

[3]ChoiSM,TanHZ.Anexperimentalstudyofperceivedinstabilityduring

haptictexturerendering:effectsofcollisiondetectionalgorithm[A].11thInternationalSymposiumonHapticInterfacesforVirtualEnviron2mentandTeleoperatorSystems[C].2003.197-204.

[4]GillespieB,CutkoskyM.Stableuser2specificrenderingofthevirtualwall

[A].ProceedingsoftheASMEInternationalMechanicalEngineeringConferenceandExposition[C].Atlanta,GA:1996,vol.58.397-406.

[5]HannafordB,RyuJH.Time2domainpassivitycontrolofhapticinterfaces

[J].IEEETransactionsonRoboticsandAutomation,2002,18(1):1-10.

[6]ColgateJE,BrownJM.FactorsaffectingtheZ2widthofahapticdisplay

[A].ProceedingsoftheIEEEInternationalConferenceonRoboticsandAutomation[C].LosAlamitos,CA:1994.3205-3210.

[7]ColgateJE,SchenkelG.Passivityofaclassofsampled2datasystems:

applicationtohapticinterfaces[A].ProceedingsofAmericanControlConference[C].Baltimore,MD:1994.3236-3240.

作者简介:

 王党校(19762),男,博士.研究领域:力觉交互虚拟人现实

技术,医用机器人等.

 张玉茹(19572),女,教授.研究领域:人机交互技术,虚拟样

机技术等.

本文来源:https://www.bwwdw.com/article/z4xq.html

Top