下载贝博网址:MIT与斯坦福大学联合开发机器学习技术 有效学习控制机器人

发布时间:2023-11-05 22:36:58 来源:足彩贝博 作者:ballbet

  盖世汽车讯 据外国媒体报道,麻省理工学院(MIT)和斯坦福大学(Stanford University)的研究人员设计出新的机器学习方法,可用于在条件快速变化的动态环境中更有效地控制机器人,例如无人机或无人驾驶汽车。

  这项技术能帮助自动驾驶汽车学会补偿湿滑的路况以避免打滑,允许机器人自由飞行器(free-flyer)在太空中牵引不同的物体,或者使无人机能够在强风的冲击下紧紧跟随下坡滑雪者。

  研究人员的方法是将控制理论中的某些结构融入到学习模型的过程中,从而产生一种控制复杂动力学的有效方法,例如风对飞行器轨迹的影响。思考这种结构的方法之一是作为一种提示,能够在一定程度上帮助指导如何控制系统。

  麻省理工学院机械工程系和数据、系统与社会研究所(IDSS)Esther和Harold E. Edgerton助理教授、信息与决策系统实验室(LIDS)成员Navid Azizan表示:“我们工作的重点是了解系统动力学的内在结构,从而设计出更有效、更稳定的控制器。通过从数据同学习系统的动力学和独特的面向控制的结构,我们也可以自然地创建在现实世界中更有效地运行的控制器。”

  在学习模型中用这种结构,研究人员的技术能立即从模型中提取有效的控制器,这与别的需要通过额外步骤单独导出或学习控制器的机器学习方法不同。通过这种结构,新研究方法还可使用更少的数据(与其它方法相比)来学习有效的控制器。因此新基于学习的控制管理系统可在快速变化的环境中更快地实现更好的性能。

  主要作者、斯坦福大学研究生Spencer M. Richards表示:“这项工作试图在识别系统结构和从数据中学习模型之间取得平衡。受机器人学家利用物理学推导出更简单的机器人模型的启发,我们开发出该新技术。对这些模型的物理分析通常会产生用于控制目的的有用结构,例如如果只是试图将模型与数据拟合,则可能会错过这个结构。相反,我们尝试从数据中识别类似有用的结构,以指示怎么来实现控制逻辑。”

  即使研究人员知道怎么对系统的所有内容做建模,确定控制机器人完成给定任务的最佳方法也可能是一个难题。

  例如,控制器是使无人机能够遵循所需轨迹的逻辑。该控制器将告诉无人机如何调整其旋翼力,以补偿风的影响,风可能会将其吹离稳定的路径以到达目标。

  这架无人机是一个动态系统——一个跟着时间推移而演变的物理系统。在这种情况下,它的位置和速度在飞过环境时会发生明显的变化。如果这样的系统足够简单,工程师就可以手动推导出控制器。

  手动对系统来进行建模本质上捕获了基于系统物理特性的特定结构。例如,若使用微分方程手动建模机器人,则可以捕获速度、加速度和力之间的关系。其中加速度是速度随时间的变化率,由机器人的质量和施加的力决定。

  但系统通常过于复杂,无法通过手工精确建模。Richards解释说,众所周知,空气动力学效应,例如旋风推动飞行器的方式,很难手动推导出来。研究人员会跟着时间推移测量无人机的位置、速度和旋翼速度,并使用机器学习将该动态系统的模型与数据相匹配。

  但这些方法通常不会学习基于控制的结构。这种结构对于确定如何最好地设置旋翼速度以引导无人机随时间的运动很有用。一旦对动力系统来进行了建模,许多现有方法也会使用数据来学习系统的单独控制器。

  Richards表示:“其他方法,即试图从数据中学习动力学和控制器的方法,作为在哲学上与我们一般为更简单系统所做的方式有点脱节。我们的方法更让人想起从物理中手动导出模型,并将其与控制联系起来。”

  来自麻省理工学院和斯坦福大学的团队开发出使用机器学习来学习动力学模型的技术,但通过这一种方式,该模型具有一些对于控制管理系统有用的规定结构。通过这种结构,他们能够直接从动力学模型中提取控制器,而不是使用数据来学习控制器的完全独立的模型。

  Azizan表示“我们得知,除了学习动力学之外,学习支持有效控制器设计的面向控制的结构也很重要。我们学习动力学的状态相关系数分解的方法在数据效率和跟踪能力方面优于基线。事实上,它能够成功地高效且有效地控制系统的轨迹。”

  当他们测试这种方法时,该控制器严格遵循期望的轨迹,超过了所有基线方法。从他们的学习模型中提取的控制器几乎与地面实况控制器的性能相匹配,该控制器是使用系统的精确动力学构建的。

  Richards补充道:“通过做出更简单的假设,我们得到了一些实际上比其他复杂基线方法更有效的方法。”

  研究人员还发现他们的方法具有数据效率,这在某种程度上预示着即使数据很少,它也能实现高性能。例如,该方法仅使用100个数据点就可以轻松又有效地对高动态转子驱动车辆进行建模。使用多个学习组件的方法在数据集较小时性能直线下降得更快。凭借这种效率,他们的技术在无人机或机器人需要在快速变化的条件下快速学习特别有用。

  此外,他们的方法是通用的,能应用于多种类型的动力系统,从机械臂到在低重力环境中运行的自由飞行航天器。

  Richards称未来研究人员有兴趣开发更具物理解释性的模型,还可以识别有关动力系统的非常具体的信息。这可能会带来性能更好的控制器。

上一篇:中经谈论:酸奶消费晋级中的变与不变 下一篇:冒险岛2都有哪些飞翔器 飞翔神器器介绍