物理科技生物学-PHYICA

足球模拟中为行走机器人生成镜头的Q学习算法

技术工程 2022-02-14 21:53:51

A Q-learning algorithm to generate shots for walking robots in soccer simulations Credit: C M,Unsplash RoboCup,原名J-League,是由国际RoboCup联合会组织的年度机器人与人工智能(AI)比赛。在RoboCup期间,机器人与其他机器人进行足球比赛。这项比赛的想法起源于1992年,当时加拿大不列颠哥伦比亚大学的艾伦·麦克沃斯教授写了一篇题为《看机器人》的论文1993年,日本的一个研究小组从这篇论文中得到启发,组织了第一次机器人足球比赛。

虽然RoboCup可能非常有趣,但它的主要目标是在现实环境中展示机器人和人工智能的进步。参加比赛的机器人系统是全世界许多研究人员深入研究的结果。

除了现实世界的比赛,计算机科学家和机器人专家可以在RoboCup 3D足球模拟联赛上测试他们的机器人足球计算工具。这本质上是一个在模拟中复制RoboCup环境的平台,作为人工智能技术和设计用于踢足球的机器人系统的虚拟“健身房”。

中国烟台理工学院和伊朗拉赫居延大学的研究人员最近开发了一种新技术,可以增强参与足球比赛的机器人在行走时射门的能力。这项技术发表在斯普林格·林克的《环境智能和人性化计算杂志》上,基于一种被称为Q学习算法的计算方法。

“参加RoboCup3D联赛的球队最重要的目标之一是增加射门次数的能力,”开发这项技术的三位研究人员云霖、宋一斌和阿明·雷扎伊帕纳在论文中写道。“之所以如此重要,是因为对对手的优势需要强大而精准的投篮。”

大多数在模拟中生成镜头的技术都基于两种方法,称为反向运动学(IK)和点分析。这些数学方法既可用于创建计算机动画,也可用于机器人技术,以预测机器人达到给定位置或完成动作所需的关节参数。

“这些方法的假设是机器人和球的位置是固定的,”研究人员在论文中解释道。“然而,拍摄并不总是这样。”

为了克服以前提出的方法的局限性,林和他的同事创建了一种新的基于Q学习算法的投篮策略,该策略可以增强机器人在行走时投篮的能力。q学习算法是基于强化学习的无模型计算方法。这些算法在代理试图学习如何优化其环境或执行复杂操作的情况下特别有用。

研究人员在论文中写道:“设计了一条弯曲的路径,让机器人朝着球移动,这样它最终会有一个最佳的拍摄位置。“一般来说,RoboCup3D中的视觉教师会有噪音。因此,通过Q学习算法可以更精确地调整机器人的运动参数,如速度和角度。最后,当机器人相对于球和球门处于最佳位置时,将IK模块应用于射击策略。”

林、宋和热扎伊帕纳在一系列实验和模拟中评估了他们的Q学习算法。值得注意的是,他们发现,这使得机器人在行走的同时也能投篮,比大多数参加机器人足球锦标赛和伊朗机器人足球锦标赛的球队中的机器人都要好。最终,它可以显著提高机器人在RoboCup足球比赛中的表现。

来源:由phyica.com整理转载自PH,转载请保留出处和链接!

本文链接:http://www.phyica.com/jishugongcheng/10280.html

发表评论

用户头像 游客
此处应有掌声~

评论列表

还没有评论,快来说点什么吧~