物理科技生物学-PHYICA

激发人工智能的“想象力太平洋软件”

技术工程 2021-12-20 21:55:13

artificial intelligenceCredit:CC0 Public Domain南加州大学的一组研究人员正在帮助人工智能想象看不见的东西,这项技术也可能带来更公平的人工智能、新药物和更高的自动驾驶汽车安全性。想象一只橙色的猫。现在,想象一下同一只猫,但是有着煤黑色的皮毛。现在,想象一下猫在中国长城上昂首阔步。这样做,你大脑中的一系列快速神经元激活会根据你以前对世界的了解,产生不同的图像。

换句话说,作为人类,很容易想象出一个具有不同属性的物体。但是,尽管深度神经网络在某些任务中的表现与人类相当或超过人类,但计算机仍在与人类的“想象力”技能作斗争。

现在,南加州大学的一个研究小组由计算机科学教授劳伦特·伊蒂和博士生郝云·格、萨米·阿布·埃尔·海贾和甘新组成,他们开发了一种人工智能,利用类似人类的能力来想象一个从未见过的具有不同属性的物体。这篇题为“基于群体监督学习的零镜头合成”的论文于5月7日在2021国际学习表征会议上发表。

该研究的第一作者葛说:“我们受到人类视觉概括能力的启发,尝试在机器中模拟人类的想象力。

“人类可以通过属性——例如,形状、姿势、位置、颜色——来分离他们所学的知识,然后重新组合它们来想象一个新的物体。我们的论文试图用神经网络来模拟这个过程。”

人工智能的泛化问题

例如,假设你想创建一个生成汽车图像的人工智能系统。理想情况下,您将为该算法提供一些汽车图像,它将能够从多个角度以任何颜色生成多种类型的汽车——从保时捷到庞蒂亚克再到皮卡。

这是人工智能长期追求的目标之一:创建可以外推的模型。这意味着,给定几个例子,模型应该能够提取底层规则,并将它们应用到大量它以前没有见过的新颖例子中。但是机器通常是在样本特征上训练的,例如像素,而不考虑物体的属性。

想象力的科学

在这项新的研究中,研究人员试图用一个叫做解纠缠的概念来克服这个限制。解开可以用来生成深度假像,例如,通过解开人脸运动和身份。葛说,通过这样做,“人们可以合成新的图像和视频,用另一个人代替原来的人的身份,但保持原来的运动。”

类似地,新方法采用一组样本图像——而不是像传统算法那样一次一个样本——并挖掘它们之间的相似性,以实现所谓的“可控解纠结表示学习”。

然后,它重组这些知识,以实现“可控的小说图像合成”,或者你可以称之为想象。“比如以《变形金刚》电影为例,”葛说,“它可以采取威震天汽车的形状,黄色大黄蜂汽车的颜色和姿势,以及纽约时代广场的背景。结果将是一辆大黄蜂颜色的威震天汽车在时代广场行驶,即使这个样本在训练期间没有被目击。”

这类似于我们人类的推断方式:当人类看到一个物体的颜色时,我们可以通过用新的颜色替换原来的颜色,轻松地将其应用到任何其他物体上。利用他们的技术,该小组生成了一个包含156万张图像的新数据集,这可能有助于该领域的未来研究。

了解世界

虽然解开纠缠不是一个新的想法,但研究人员表示,他们的框架可以兼容几乎任何类型的数据或知识。这扩大了申请的机会。例如,将种族和性别相关的知识分开,通过从等式中完全去除敏感属性来使人工智能更加公平。

在医学领域,它可以帮助医生和生物学家发现更多有用的药物,方法是将药物功能从其他属性中分离出来,然后重组它们以合成新药。赋予机器想象力也有助于创造更安全的人工智能,例如,允许自动驾驶汽车想象和避免训练中以前看不到的危险场景。

“深度学习已经在许多领域展示了无与伦比的表现和前景,但这往往是通过肤浅的模仿发生的,并且没有更深入地理解使每个对象独特的单独属性,”Itti说。“这种新的解开纠缠的方法,第一次真正释放了人工智能系统中新的想象力,使它们更接近人类对世界的理解。"

来源:由phyica.com整理转载自PH,转载请保留出处和链接!

本文链接:http://www.phyica.com/jishugongcheng/6280.html

发表评论

用户头像 游客
此处应有掌声~

评论列表

还没有评论,快来说点什么吧~