前沿资讯
当前位置: 首页 > 信息动态 > 前沿资讯 > 正文

AI生成的虚拟“生物”,居然能进化出身体

发布日期:2021-11-03     点击量:

看下面这个视频,一群虚拟生物正在屏幕上四处游走,各显神通,有的在努力跨越障碍物,还有的在朝着目标拖小球。它们看起来就像没 “香肠” 做的螃蟹 —— 可能还有点像《阿达家族》里那个叫 “东西”(Thing)的手型生物。但实际上这些 “非动物”(unimals,是 universal animals 的缩写)可以帮助研究人员开发用于机器的更具通用性的人工智能。

斯坦福大学的阿格里姆・古普塔(Agrim Gupta)和他的同事们(包括 ImageNet 创始人、斯坦福以人为本研究院联合主任李飞飞)运用非动物来探究 AI ,研究过程中有两个问题经常被忽视:其一是智能与身体结构之间的联系;其二是如何通过进化与学习实现能力习得。

并未参与此项研究的乔什・邦加德(Josh Bongard)任职于佛蒙特大学,专注研究进化机器人,他表示:过去几十年来,我们一直在尝试更好地理解机器人的身 - 脑关系,这项研究把相关工作向前推进了一大步。

古普塔表示,研究人员想在机器中复刻智能,可能会忽视一些东西。在生物学意义上,智能来自思维和身体的共同运作。动物的行为能力和学习能力取决于身体计划的各个方面,比如肢体的数量和形态。以指猴为例,这种狐猴进化出了细长的中指以便于探入洞中找虫子吃。

通常情况下, AI只关注思维的部分,构建机器来完成不需要身体参与的任务,比如使用语言、识别图像以及打游戏。但这些有限的功能马上就会过时。通过把 AI 和适用于特定任务的身体相结合会它们更容易习得一系列新技能。邦加德称:这个星球上所有智慧生物都有身体。如果想制造出既聪明又安全的机器的话,赋予它们身体是我们唯一的希望。

这种奇异的生物有一个脑袋和多个肢体。该团队开发了一种叫做深度进化强化学习(DERL)的技术来测试它们的能力。一开始,研究人员运用强化学习来训练非动物在虚拟环境中完成任务,例如在不同的地形上行走或移动物体。

之后,他们会选出表现得最出色的非动物,并向其引入变异规则。变异后的非动物会被放回此前的虚拟环境中,再从头开始学习同样的任务。这一过程会重复数百次:进化,学习;再进化,再学习。

视频|Embodied Intelligence via Learning and Evolution

这些非动物进行的变异包括添加或移除肢体,以及改变肢体的长度或可动性。可选的身体配置方案数量惊人:在最多拥有 10 个肢体的情况下,可能的组合方式数高达 10 的 18 次方。渐渐地,非动物的身体与不同的任务进行了适配。有些非动物进化为通过向前跌倒来在平坦地形上移动;有些进化成了像蜥蜴一样匍匐前行;还有些为了抓取箱子而进化出了钳肢。

研究人员也对进化后的非动物应对此前未见过的新任务的能力进行了测试,这种能力是通用智能的一个基本特征。结果显示,进化环境更复杂(包括障碍物或不平坦地形)的非动物学习新技能(比如之前是推箱子而现在是滚球)的速度更快。他们还发现,在并没有任何选择压力的情况下,DERL 会倾向于选择能更快地进行学习的身体计划。古普塔表示:我觉得这非常令人激动,因为它表明身体形式与智能之间的存在很深的关联。

邦加德说:“我们已经了解到,某些特定的身体形式会加快学习的速度。这项研究表明,AI 可用于寻找这类身体。 邦加德的实验室已经开发出了用于特定任务的机器人身体,比如用于为脚步涂上类似老茧的涂层以减少磨损和消耗。

古普塔表示,有朝一日,这项技术可以扭转我们对于建造实体机器人的想法。人们可以用 DERL 来让适应某项任务的身体自行进化为最优形态然后再把它建造出来,而不是像现在这样先建造出固定不变的身体然后再训练它去做特定的任务。

在更广的尺度上,研究人员对于 AI 的看法正在发生转变,古普塔的非动物正是这种转变的一部分。此前,研究人员会依据特定任务对 AI 进行训练,例如下围棋或者对医学影响进行分析,但现在,他们开始把 AI 放进虚拟沙箱 —— 例如 OpenAI 的虚拟捉迷藏竞技场 POET 以及 DeepMind 的虚拟活动场 XLand—— 让其学习如何在不断变化的开放式训练环境中解决多种问题。用这种方式进行训练的 AI 可以学习到通用技能,而非仅掌握解决单一问题的技巧。

古普塔认为,自由形式的探索将会是次世代 AI 的关键。他表示:我们需要真正的开放式环境来创造智能。

参考:https://www.technologyreview.com/2021/10/19/1037555/weird-virtual-creatures-evolve-bodies-ai-general-intelligence

作者:姜晓鲲      审校:高潭清

原文链接:AI生成的虚拟生物,居然能进化出身体-麻省理工科技评论APP


联系我们

地址:中国山东省济南市山大南路27号

邮编:250100

传真:(86)-531-88565657