倒立摆英文文献.doc
- 文档编号:8905318
- 上传时间:2023-05-16
- 格式:DOC
- 页数:14
- 大小:684KB
倒立摆英文文献.doc
《倒立摆英文文献.doc》由会员分享,可在线阅读,更多相关《倒立摆英文文献.doc(14页珍藏版)》请在冰点文库上搜索。
信息与控制工程学院毕业设计(论文)英文翻译
13
基于神经系统控制的一种非线性系统:
倒立摆受激运动的稳定性分析
Q.Wu,N.Sepehri和S.He
加拿大曼尼托巴省曼尼托巴大学温尼伯机械和工业工程部
摘要:
这篇论文将要介绍一种基于多层神经网络在线控制的受激倒立摆运动的新颖的应用,这种倒立摆拥有两个旋转方向的自由度并且它的基点可以在三维空间中自由移动。
我们的目标是在有来自基点的移动干扰的情况下通过控制扭矩使摆杆到达期望的方位。
在一个控制器里包涵代表相反的动力学情况的四个专门的联机三层神经网络系统。
在要求的精确度的情况下,要保证这样一个非自发的闭环系统稳定,决定使用李雅普诺夫稳定性理论。
要使用的神经系统控制器要通过仿真的检验。
他的性能也要和最新发布的李雅普诺夫控制器进行对比。
显示被提议的控制方案的实现是简单的,就已摆杆为目标建立数学模型或者测量基点移动的意义上讲是不需要的。
与此同时,它成型快,在有阻尼相应时控制扭矩平滑。
这种方案对比如说类人机器人的稳定移动等的实际问题提供了一种可能。
1.简介
对倒立摆控制进行研究可以分为2个情况,第一种情况,广义研究情况,主要研究倒立摆在什么基点能达到直坐式的位置,第二种情况,主要研究摆杆的在基点运动的情况下不稳定时要达到稳定所需的扭矩条件。
第二种情况下的倒立摆的稳定是所有研究和学习程控的关键。
就以前对倒立摆基点控制而言,Chow和Jacobson发展了一种控制策略可以让倒立摆在二维自由旋转的程度上稳定。
控制器包含开关扰动并且基点可以在规定的情况下在垂直方向运动。
Levi提出一种拓扑说明并证明倒立摆在规定垂直方向上运动时的稳定性。
Wu和Thornton-Trump对摆杆在二维自由度服从一般基点垂直运动的情况下在李雅普诺夫稳定性判据的基础上提出了一种不连续控制器。
其结果后来扩展到对一般的基点三维运动设计一个平滑控制器的情况并证明这样一个控制器对任何的轨迹接近垂直运动的都有效。
其模型也被用来研究在类似人行走时的控制机构。
结果显示模型可以产生类似人体行走时的运动,这对解决一些实际问题有着十分重要的意义。
在人造神经网络领域的发展对于控制非线性系统的新方案提供了可能,神经网络控制器吸引人的地方在于不需要对目标进行数学模型的建立,神经网络广泛研究于控制第一种情况下的倒立摆通过基点的运动达到平衡。
这篇论文将第一次研究倒立摆第二种情况在基点运动扰动的情况下靠控制扭矩使摆杆达到所要求的位置。
神经网络在建立非线性模型函数时的性能使得它在解决该类问题是要任何期望精确度这类问题非常吸引人。
此外,模型可以以输入输出的测量数据位基础自始至终通过神经网络进行建立。
这里提供的方法可以用来训练一组网络的,在线的,在未知的基点运动面前近似非线性倒立摆行为。
有误差后增殖式多层神经网络预算法则用来训练。
这些网络用来详细了解跟踪输出控制已达到抵消非线性系统基点运动的效果。
在神经模型有误差的闭环控制系统的稳定性也被证实。
注意包含基点运动使动力系统不自主。
一般而言神经网络训练提供关于系统早期的每一个采样周期的信息状态。
然而,非自主系统在时域和状态域都在变化。
在线质量学习计划的集中点被要求对各种明确的与时间相关的类型应该是适应的,未被发现的误差应该确保稳定。
在这样的要求下,这篇论文使用李雅普诺夫稳定原理假定基点在轻微的激发下可以用一个光滑的时间有界函数来描述。
在我们已知的知识里,这样的理论还未曾报道。
对于所提到的控制器进行模拟检验,证实所提到的方法论展现出很多积极的方面,这些积极的方面不能从最近在同样的问题控制器的发展上取得。
这些方面包括快速性,对于平滑控制扭矩有很好阻尼相应。
此外,所提到的神经控制器不需要一个相关目标摆杆的数学模型或者是对基点运动的测量。
李雅普诺夫控制器满足对于摆杆的参数或者在线测量基点加速度的知识需要。
本片论文的大纲如下.在第二部分,基于受激的摆杆被描述为一个非线性模型并且选出相应的神经网络控制器。
控制器与神经网络的安装也将在第二部分进行阐述。
在第三部分,对于网络在线测试的标准将要被导出并用来保证控制系统的稳定性。
总之这是很重要的,对于非自制的神经控制系统稳定性分析是很困难的。
仿真和比较研究将在第四部分提及。
最后第五章对整个进行总结。
2.控制系统的设计
2.1.摆杆模型
这篇论文所研究的倒立摆是一个如图1所示的严格的单臂模型。
它是一个惯性调节系统,坐标轴和身体坐标系,坐标轴在图中显示出来。
身体坐标系的原点在重心c。
摆杆的旋转被描述成欧拉角和。
平滑有界函数,和用来描述基点在惯性坐标系中的加速度。
动力学方程如下:
(1)
(2)
其中,,。
是摆杆的集合,是重心到基点的距离。
代表身体坐标系x轴或z轴的质量惯性矩,表示在身体坐标系中轴上的惯性矩。
在等式
(1)中g表示重力加速度、是控制转矩。
用矢量表示为,用来表示控制转矩矢量。
等式
(1)改写如下:
其中:
图1基于受激的倒立摆模型
2.2控制器设计
定义输出矢量,等式
(2)可以写成如下形式:
(3)
其中(b是一个正常数)并且,表示系统的参数集。
给出的控制方案如下:
(4)
对于等式(4),控制器由两个部分组成:
前馈控制和反馈控制。
前馈控制包含和,其作用是消除非线性扰动。
在保证非线性动力系统稳定性中起到很重要的作用。
表示反馈环节并由下面的关系决定:
(5)
其中表示期望值是赫尔维兹多项式输出值的系数。
2.3神经网络的实现
控制算法如等式(4)工作在假定函数和已知的情况下。
然而在实际情况下,这些函数是未知的或不确定的。
我们在这是使用神经网络来鉴定和提出这些控制器函数。
注意,虽然现在的控制系统是非自发的,和是关于时间t的平滑有界函数。
以结果分析为基础提出关于多层神经网络近似非线性函数的条件,假设如下:
图2基于神经网络控制框图
假设:
给出了连续函数 ,,和在,这里有重量集合,,和还有,,和这样的网络,这些函数可以在上近似精度,如此一来
在这项研究中,每个网络包含一个隐藏层这个隐藏输出层具有线性神经结构。
在数学上,他们描述如下:
(6)
在等式(6)中,集合分解为,和。
与此相同,分解为,和。
和分别表示隐藏层中的神经元数量和,其中选择双曲正切函数。
然后使用这些网络在反馈控制律时如下:
(7)
图2显示神经控制系统框图和培训网络和。
在这个图中,在每个采样时刻时,系统的输出量被测量并且神经网络进行培训从而得出输出矢量。
网络权值的调整基于达到可接受和的平方差,,其中z是包含在矢量里的权值,q=1,2,…,n,表示修正模式误差e表示实际价值之间的差额的加速度(和)并且这些量(和)决定使用网络的输出(,,和)等式3相当于:
和是输入控制矢量的元素。
这种李文博格算法用于神经网络的训练,是一种近似的牛顿法,牛顿法求和的最小值方程如下:
其中显然是牛顿步(和方向),是矢量和的雅克比矩阵。
在高斯—牛顿理论中,假设,上式变为
经过李文博格算法修正后,高斯—牛顿理论变为
表示单位矩阵。
参数增加一个步骤是会导致增加一个性能指标E。
当一个步骤会导致E变小时则需要将变小。
当时,该算法成为最快降算法。
当时,该算法成为高斯—牛顿法。
马夸特的李文博格算法被认为是一个可以信赖的修正过的高斯—牛顿法。
该算法被认为在速度收敛领域比最陡下降法更加的有效,被训练过的神经网络用于控制器。
3.仿真结果
通过一连串的模拟用来验证本文所开发的控制器。
其结果也与最新发布的李雅普诺夫控制器进行对比。
在仿真中,摆杆参数选择m=36.86kg,=0.29m,=2.9kg和=0.348kg。
首先,详细的操作。
然后,神经控制器的性能评价。
仿真程序已经写入C++并且四阶龙格库塔法已用于整合执行微分方程。
这个程序被称为MatlaB神经网络工具箱,用来识别和控制。
3.1网络的建立
选择三层S功能隐藏层和输出层的线性函数神经网络。
根据逼近原理,单隐层神经网络和线性输出激活功能可以近似用一个连续的非线性函数表示。
隐藏在网络和的节点个数,被分别选为14和5。
这些数字在许多初步的模拟程序运行后被发现可以满足生产所需的精度要求。
类似的结构被选为网络和。
马夸特的李文博格算法如2.3所述用于神经网络的建立。
网络的建立有两种方法。
在第一种方法中,初始建立对进行离线捕捉系统的主要特点。
被允许的摆角在范围内角速度在rad/s范围内,基点在惯性坐标系内随机运动。
从这个最初的建立中获得的权重用于神经网络的在线建立。
在第二种方法中,神经网络的初始权被选为在[-1,1]中的随机数,网络的建立可以直接使用这些随机初始。
注意:
对每个采样点都要进行在线训练,在基于减少实际与理论角加速度轨迹的近似误差上进行研究。
因此,为了保证神经网络控制系统的稳定性,神经网络的逼近误差应满足不等式(31)。
在确定和的边界时,在不等式(30)中选择。
因此,在解决李雅普诺夫等式(16)时,和被确定为。
注意:
和可以任意选择,只要它们是正定并能进一步建立正定矩阵和。
最后,和分别选择1和10。
3.2测试结果
第一次测试是研究神经控制器的可行性并与之前开发的控制器进行对比。
摆杆的初始值定为=0.3rad和=0.5rad。
运动基点被描述为,和,所有描述在坐标系中(见图1)我们的目标是把摆杆稳定在一个直立的位置,如前所述,最初的训练是在离线下完成的。
经过1000和741次更新,平方误差和和分别为0.011和0.01。
对于和,经过100次更新,指令集达到小于0.0001.在重心通过初试测试后,将其使用在前馈控制器。
然后网络在每个采样周期进行训练。
在本次测试中,被选定的窗口长度为1。
在(7)中控制器反馈系数选为则闭环系统的根为。
对于等式(5)赫尔维兹多项式的系数为和。
图3(a)的角位移响应(b)稳定后的截图实线:
基于神经网络控制器的响应虚线:
连续控制器(6)的响应
图3和图4显示的是输出角位移和(实线)。
图5显示的是控制的扭矩和(实线)。
这些结果与连续的李雅普诺夫控制器(6)的最佳响应进行对比。
从图3和图4可以看出,神经控制器的响应有显著的改善,有较小的震荡和较小的稳态误差。
此外,神经网络控制器应用的扭矩也很有意思。
在图5中,可以看出比以前开发的控制器(6)控制器控制力矩的幅度较小,这使得神经控制器在实际中动态补偿的范围更大,并能更准确的消除非线性。
此外,在控制器(6)中需要测量基点加速度;但神经网络控制器则不需要。
图4(a)的角位移响应(b)稳定后的截图实线:
基于神经网络控制器的响应虚线:
连续控制器(6)的响应
第二次试验是研究神经网络控制系统的跟踪能力。
一个幅度为1的0.2Hz的正弦函数的期望轨迹输出为和。
本次测试和前面的测试使用相同的控制参数,初始条件和建立过程。
图6和图7结果显示。
正如所看到的,这是一个满意的输出跟踪性能达标的神经网络控制方案。
图5力矩控制测试图(a)(b)
图6(a)神经控制器正弦跟踪误差(角度)(b)控制力矩
图7(a)神经网络控制器的正弦跟踪误差(角)(b)控制力矩
图8神经网络控制器在没有初始训练的正弦跟踪误差(a)角(b)角
最后,为了检测该方法在实际中的可行性,所有的网络权值被初始化在-1和1之间,在线训练在没有前期训练的情况下进行管理。
正弦函数的跟踪问题在第二次测试中重新审视。
和的初始值分别为0.3rad和0.5rad。
我们发现在这种情况下为了取得更好的效果我们把窗口长度增加到5。
图8用来显示跟踪误差。
可以看出通过训练神经控制器的性能得到跳。
模拟10秒后,控制器执行先前测试。
4.总结
本文讨论了一个基于受激倒立摆的控制问题。
通过研究神经网络的功能和对非线性函数的建模来开发用来实现这类非自治非线性系统。
该控制器由一个基于神经网络的前馈项和一个简单的反馈控制。
网络被在线建立。
神经网络得到必需的训练精度要求,因此,通过在每个采样点的数据可以使整个的非自治控制系统稳定。
既,输出误差收敛到原点的一个无穷下的邻域。
然后对控制器的功能进行模拟测试。
仿真结果与最新发布的作品进行对比,证明确实改进了性能和所作出的技术承诺。
结果显示,该控制系统试试简单,在这个意义上,它不需要数学模型的建立和对动态受激基点的测量。
其性能优于先前发布的控制器(6),这种控制器需要对摆杆参数和基点加速度的测量。
将来的工作重点要放在控制器的实际执行上。
首先,要认真研究如实时建立,收敛性以及采样时间和所需计算量之间的关系等问题。
其次,要实验验证算法。
一般来说,我们正在研究通过马奎特的李文博格算法建立一层又一层的网络。
这种方法已经被证实在学习速度和准确度上优于马奎特的李文博格反向传播技术。
注:
英文原文出自智能与模糊系统杂志(JournalofIntelligent&FuzzySystems)发表时间为2002年
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 倒立 英文 文献