AI已能「踢足球」,可AI机器人为何还不行?
今年11月,世界杯又要开赛了。
临近那个时候,无论输赢,不论表现优劣,总会有大批人开始谈论球赛。
没办法,谁叫足球是世界第一大运动呢。
然而,与世界杯相比,科研人员对年度机器人杯3D模拟联盟更为关注。
最近,英国某人工智能企业的一个研究小组,借助一种快速版体育训练项目,借助电脑模仿数十载足球竞技场面,让机器掌握了精准操控虚拟足球员的技能。
相关研究发表在《科学·机器人》杂志上。
论文地址:
显然,这已经不是第一次「AI足球运动员」进入大众视野了。
AI足球运动员的进化简史
早在二零一六年,战胜了李世石之后没过多久,就着手研究让人工智能踢球了。
六月时,科研人员操作人工智能,驱动一个形似蚂蚁的装置,去捕捉小球,随后带着球前进,最终将其送入球门完成得分。
据小组主管David透露,运用当时谷歌新推出的异步Actor-算法A3C,人工智能不仅顺利完成了该任务,而且整个运作期间无需他教授任何力学方面的内容。
这项实验,让「AI踢足球」迎来了开门红。
2019年时,已研发出大量不同方案,这些方案依据各自计划生成,从中挑选出10支双人足球队伍。
这十个组合各自具备两千五百分之一百亿级别的训练积累,共计累积了一百万场彼此间的竞技数据。
接下来配置条件,让众多人工智能相互进行足球比赛,并且事先制定了章程,对整个「足球队」给予回馈,而不是单独奖励某个「AI球员」的突出表现,以此促进团队整体的提升。
用这种方式证明了,AI是可以互相合作的。
看起来一切顺利,然而到了2020年,的AI球员出问题了。
依据脑极体披露的内容,有场赛事中,某个队伍的足球机器人整齐列队,朝着球门进行进攻,然而负责把守球门的机器人却毫无防备,直接瘫倒在地,并且开始毫无章法地抖动双腿。
你以为这就完了?too naive!
随后,担任前锋的机器人球员做出了一段非常费解的动作,上下跳动,左右摆臂,突然扑倒在地。
这一幕让观众极为震惊:见过放水的,没见过这么放水的!
为何会这样呢?
这还要从背后的原理说起。
「AI踢足球」的开始,研究人员就采用了强化学习这条道路。
早先的练习,是借助标注完毕的资料来完成的,采用的是监督训练的方式。
这种方式对数据的质量标准十分严苛,一旦数据存在瑕疵,AI系统就会产生偏差。
相比之下,强化学习借鉴了人类的认知方式,AI依靠不断尝试来掌握知识,成功时获得奖励,失败时遭受惩罚,借此形成正确的反应模式。
看起来比传统的监督学习智能了不少,但还是有漏洞。
比如,AI会对奖惩措施产生错误的理解,因而生成奇怪的策略。
曾经设计了一个赛艇游戏,AI原本的任务是完成比赛。
研究者设定了两种激励措施,一个是赢得竞赛,一个是累积环境中的积分。最终智能体发现某个区域,在此地反复绕圈获取分数,最终虽然没有赢得比赛,但累积的积分反而更多。
这次,AI踢出了什么新花样
虽然AI踢足球出现过翻车现场,但研究人员没有放弃。
该文起始部分指出,相关科研集体在培育虚拟足球队员方面获得了新的进展。
根据文献记载,该研究团队虽然简化了游戏规则,并且将双方球员数量控制为2到3名,但「人工智能足球选手」仍能执行运球过人、肢体碰撞、准确射门的操作。
那研究人员是怎么训练「AI足球运动员」的呢?
简单来说,是将监督学习与强化学习结合起来。
AI首先观看人类踢足球的视频片段,接着掌握正常行走的方式,由于AI最初不清楚要在球场上执行何种任务。
第二步,AI在强化学习的算法下,练习运球和射门。
这两步,AI大约能在24小时内完成。
第三步,采用竞技方式开展训练,让AI机器人进行两对两的对抗,这个阶段大约需要两到三周时间,目的是帮助AI掌握团队配合,并学会预判传球等复杂运动操控。
这次「AI 足球运动员」的表现还是让研究团队觉得比较满意。
团队觉得,这项探索促进了人造体系朝向人类体态运作能力的发展。
不过,团队还是比较清醒,他们知道,这次突破还是有局限性的。
例如,即便对抗形式是两对两,而非现实足球比赛通行的十一对十一,这仍然无法证明人工智能能够参与更为复杂的足球竞赛。
此外,即便是简单的2v2比赛,也没法直接用在机器人硬件上。
换句话说,科学家们还不能研制出可以踢足球的机器人。
参考资料: