物理科技生物学-PHYICA

离逼真的头像又近了一步

技术工程 2022-03-15 21:53:41

One step closer to lifelike avatars新的基于AI的方法可以创建逼真的虚拟人,执行从未见过的动作,如狂野的舞蹈。C redit:徐晨/ETHürich很快,网民们就能在网络空间里以动画3D头像的形式见面了。苏黎世联邦理工学院的研究人员开发了新的算法,可以更容易地创建虚拟人。如今,人们盯着屏幕的频率越来越高——尤其是自从疫情冠状病毒爆发以来。与同事的会议和讨论都是通过视频通话进行的。如果大型科技公司如愿以偿,得益于3D眼镜和专门的计算机程序,这种邂逅最早将于明年在所谓的元宇宙变成一种身临其境的体验。

在虚拟现实和增强现实应用中实现自然用户体验的关键是创建所谓的化身,这是计算机生成的人的动态表示。头像的外观和行为越逼真,人们就越有可能获得真实的社交互动感。

然而,对人进行详细的动态建模是一项持续挑战这些应用程序开发人员的任务。今天的图形程序已经可以创建逼真的静态头像。但是,举例来说,为了给一张笑脸制作动画,图形设计师必须在电脑上手动编辑几乎每一张图像,以纠正皱纹和阴影等细微差别。

苏黎世联邦理工学院计算机科学教授奥特马尔·希里格斯领导的研究人员在2021年10月举行的国际计算机视觉呼叫会议上展示了如何更容易地做到这一点。他们没有对每一个细节进行建模,而是使用智能算法,通过观察人类在几个姿势下的3D图像,学会在每一个可能的姿势下自动渲染动画化身。

信用:徐晨/苏黎世联邦理工学院计算机模型甚至可以处理手动打印

利用人工智能创造逼真虚拟人的计算机程序只存在了几年。这些程序学习使用真实人物的3D扫描现实地描绘不同的身体位置,这些扫描是预先使用复杂的摄像系统记录的。

人工智能算法通过测量人体内外的无数点来处理扫描,将人体轮廓定义为数学函数。这样,算法就建立了人体的模板形状。为了将化身移动到新的姿势,算法学习记忆从移动姿势到模板的路径。

然而,对于已知动作范围之外的极端姿势,这种算法没有知识并且预测错误的路径,导致清晰可见的伪影:手臂可能从身体上分离或者关节位于错误的位置。这就是为什么今天的模型被训练成尽可能多的不同姿势——这需要巨大的3D扫描努力和巨大的计算能力。

到目前为止,人工智能化身几乎不适用,尤其是对于交互式应用。“捕捉所有可能的动作是不切实际的,”该研究的主要作者、博士生徐晨说。

One step closer to lifelike avatars Credit: Xu Chen/ ETH苏黎世陈开发的新方法采用了相反的方法:模型计算从模板到移动姿势的路径。因为这意味着计算总是有相同的起点,它让智能算法更好地学习如何概括运动。

事实上,这是第一次,它把这样一个计算机模型放在一个位置,也很容易代表新的运动模式。它甚至可以产生杂技动作,如翻跟头或背桥。

从一张图片中选择任意数量的新面孔

新的全身头像还不能个性化;表示仅限于在原始3D图像中扫描的人。陈和他的同事们希望进一步开发他们的计算机模型,以便它可以随意创建新的身份。

希里格小组的另一名博士生马塞尔·比勒(Marcel Bühler)已经找到了个性化头像人脸并根据需要进行更改的解决方案。像陈在他的全身模型中一样,布勒使用智能算法从3D人脸模型和大量人像照片的组合中创建新的动画人脸。

虽然以前的计算机程序已经提供了正面人脸的良好动画,但比勒的模型也可以真实地从侧面以及从上面和下面呈现人脸。

信用:马塞尔·比勒/苏黎世联邦理工学院近距离观察可以揭开深度假货的面纱

新技术是否有可能很快允许更真实的深度伪造视频传播,例如伪造一位重要政治家的演讲?“Deepfake视频仍然远非完美,”比勒说。他指出,大多数计算机程序只有在特定的环境下才能达到良好的效果。例如,新的面部模型还不能真实地表示头发等细节。

“任何仔细观察的人仍然会发现文物,”比勒说。他认为让公众了解和意识到当前的事态更为重要。他补充说,让对3D渲染技术及其漏洞的研究公之于众,可以帮助网络安全专家更容易地检测网络上的深度伪造视频。

对于交互式虚拟现实应用,这些ETH研究人员的工作代表了巨大的进步。像脸书和微软这样的科技公司很有可能会在他们的头像中实现这两位博士生新开发的技术。

来源:由phyica.com整理转载自PH,转载请保留出处和链接!

本文链接:http://www.phyica.com/jishugongcheng/12447.html

发表评论

用户头像 游客
此处应有掌声~

评论列表

还没有评论,快来说点什么吧~