激发人工智能的“想象力太平洋软件”

artificial intelligence Credit:CC0 Public Domain南加州大学的一组研究人员正在帮助人工智能想象看不见的东西，这项技术也可能带来更公平的人工智能、新药物和更高的自动驾驶汽车安全性。想象一只橙色的猫。现在，想象一下同一只猫，但是有着煤黑色的皮毛。现在，想象一下猫在中国长城上昂首阔步。这样做，你大脑中的一系列快速神经元激活会根据你以前对世界的了解，产生不同的图像。

换句话说，作为人类，很容易想象出一个具有不同属性的物体。但是，尽管深度神经网络在某些任务中的表现与人类相当或超过人类，但计算机仍在与人类的“想象力”技能作斗争。

现在，南加州大学的一个研究小组由计算机科学教授劳伦特·伊蒂和博士生郝云·格、萨米·阿布·埃尔·海贾和甘新组成，他们开发了一种人工智能，利用类似人类的能力来想象一个从未见过的具有不同属性的物体。这篇题为“基于群体监督学习的零镜头合成”的论文于5月7日在2021国际学习表征会议上发表。

该研究的第一作者葛说:“我们受到人类视觉概括能力的启发，尝试在机器中模拟人类的想象力。

“人类可以通过属性——例如，形状、姿势、位置、颜色——来分离他们所学的知识，然后重新组合它们来想象一个新的物体。我们的论文试图用神经网络来模拟这个过程。”

人工智能的泛化问题

例如，假设你想创建一个生成汽车图像的人工智能系统。理想情况下，您将为该算法提供一些汽车图像，它将能够从多个角度以任何颜色生成多种类型的汽车——从保时捷到庞蒂亚克再到皮卡。

这是人工智能长期追求的目标之一:创建可以外推的模型。这意味着，给定几个例子，模型应该能够提取底层规则，并将它们应用到大量它以前没有见过的新颖例子中。但是机器通常是在样本特征上训练的，例如像素，而不考虑物体的属性。

想象力的科学

在这项新的研究中，研究人员试图用一个叫做解纠缠的概念来克服这个限制。解开可以用来生成深度假像，例如，通过解开人脸运动和身份。葛说，通过这样做，“人们可以合成新的图像和视频，用另一个人代替原来的人的身份，但保持原来的运动。”

类似地，新方法采用一组样本图像——而不是像传统算法那样一次一个样本——并挖掘它们之间的相似性，以实现所谓的“可控解纠结表示学习”。

然后，它重组这些知识，以实现“可控的小说图像合成”，或者你可以称之为想象。“比如以《变形金刚》电影为例，”葛说，“它可以采取威震天汽车的形状，黄色大黄蜂汽车的颜色和姿势，以及纽约时代广场的背景。结果将是一辆大黄蜂颜色的威震天汽车在时代广场行驶，即使这个样本在训练期间没有被目击。”

这类似于我们人类的推断方式:当人类看到一个物体的颜色时，我们可以通过用新的颜色替换原来的颜色，轻松地将其应用到任何其他物体上。利用他们的技术，该小组生成了一个包含156万张图像的新数据集，这可能有助于该领域的未来研究。

了解世界

虽然解开纠缠不是一个新的想法，但研究人员表示，他们的框架可以兼容几乎任何类型的数据或知识。这扩大了申请的机会。例如，将种族和性别相关的知识分开，通过从等式中完全去除敏感属性来使人工智能更加公平。

在医学领域，它可以帮助医生和生物学家发现更多有用的药物，方法是将药物功能从其他属性中分离出来，然后重组它们以合成新药。赋予机器想象力也有助于创造更安全的人工智能，例如，允许自动驾驶汽车想象和避免训练中以前看不到的危险场景。

“深度学习已经在许多领域展示了无与伦比的表现和前景，但这往往是通过肤浅的模仿发生的，并且没有更深入地理解使每个对象独特的单独属性，”Itti说。“这种新的解开纠缠的方法，第一次真正释放了人工智能系统中新的想象力，使它们更接近人类对世界的理解。"

来源：由phyica.com整理转载自PH，转载请保留出处和链接！

本文链接：http://www.phyica.com/jishugongcheng/6280.html

物理科技生物学-PHYICA

激发人工智能的“想象力太平洋软件”

发表评论

评论列表

最新发布

热门排行

物理科技生物学-PHYICA

激发人工智能的“想象力太平洋软件”

猜你喜欢

发表评论

评论列表

最新发布

热门排行