物理科技生物学-PHYICA

研究人员微调桃木崎对人工智能图像生成的控制

技术工程 2021-11-21 21:53:24

Researchers Fine-Tune Control Over AI Image Generation新的AI方法使系统能够创建和保留背景图像,同时添加新的图形。此外,该方法允许人工智能移动或改变图像中的元素,同时保持它们可识别地相同。例如,它可以以多种姿势展示相同的滑雪者。学分:北卡罗来纳州立大学吴天福来自北卡罗来纳州立大学的研究人员开发了一种新的最先进的方法来控制人工智能系统如何创建图像。这项工作在从自主机器人到人工智能培训等领域都有应用。争论的焦点是一种称为条件图像生成的人工智能任务,其中人工智能系统创建满足特定条件集的图像。例如,系统可以被训练来创建猫或狗的原始图像,这取决于用户请求的动物。最近的技术已经在此基础上结合了关于图像布局的条件。这允许用户指定他们希望在屏幕上的特定位置出现哪些类型的对象。例如,天空可能在一个盒子里,一棵树可能在另一个盒子里,一条小溪可能在另一个盒子里,等等。

这项新的工作建立在这些技术的基础上,让用户对结果图像有更多的控制,并在一系列图像中保留某些特征。

“我们的方法是高度可重构的,”吴天福说,他是这项工作的论文的合著者,也是数控国家计算机工程的助理教授。“像以前的方法一样,我们的方法允许用户让系统根据一组特定的条件生成图像。但是我们的也允许你保留那个图像并且增加它。例如,用户可以让人工智能创建一个山景。然后,用户可以让系统将滑雪者添加到场景中。”

此外,新的方法允许用户让人工智能操作特定的元素,使它们可识别地相同,但以某种方式移动或改变。例如,人工智能可能会创建一系列图像,显示滑雪者在穿越风景时转向观众。

“这方面的一个应用是帮助自主机器人在开始一项特定任务之前‘想象’最终结果会是什么样子,”吴说。“你也可以使用该系统为人工智能训练生成图像。因此,您可以使用该系统创建图像来训练其他人工智能系统,而不是从外部来源编译图像。”

研究人员使用COCO-Stuff数据集和视觉基因组数据集测试了他们的新方法。基于图像质量的标准测量,新方法优于以前的最先进的图像创建技术。

“我们的下一步是看看我们是否可以将这项工作扩展到视频和三维图像,”吴说。

新方法的训练需要相当大的计算能力;研究人员使用了一个4 GPU工作站。然而,部署该系统的计算成本较低。

“我们发现一个GPU可以给你几乎实时的速度,”吴说。

“除了我们的论文,我们还在GitHub上提供了这种方法的源代码。也就是说,我们始终愿意与行业合作伙伴合作。”

来源:由phyica.com整理转载自PH,转载请保留出处和链接!

本文链接:http://www.phyica.com/jishugongcheng/4581.html

发表评论

用户头像 游客
此处应有掌声~

评论列表

还没有评论,快来说点什么吧~