物理科技生物学-PHYICA

利用人工智能实时生成三维全麻豆传媒女艺人息图

物理学 2021-11-07 07:23:27

作者丹尼尔·阿克曼,麻省理工学院 2D和三维全息投影的实验演示

左边的照片聚焦在靠近相机的鼠标玩具上(黄色方框内),右边的照片聚焦在万年历上(蓝色方框内)

荣誉:石梁、沃伊切赫·马图西克等 尽管多年来大肆宣传,虚拟现实耳机尚未取代电视或电脑屏幕成为观看视频的首选设备

原因之一:VR会让用户感到恶心

恶心和眼睛疲劳可能会导致,因为虚拟现实创造了一个三维观看的错觉,尽管用户实际上是盯着一个固定距离的2D显示器

更好的3D可视化解决方案可能在于为数字世界改造的60年前的技术:全息图

全息图为我们周围的3D世界提供了非凡的表现

另外,它们很漂亮

(说吧——看看你维萨卡上的全息鸽子

)全息图根据观察者的位置提供了一个移动的视角,它们允许眼睛调整焦深来交替聚焦前景和背景

研究人员长期以来一直试图制作计算机生成的全息图,但这一过程传统上需要一台超级计算机来进行物理模拟,这很耗时,并且会产生不太真实的结果

现在,麻省理工学院的研究人员开发了一种几乎可以立即产生全息图的新方法——研究人员说,这种基于深度学习的方法非常有效,一眨眼就可以在笔记本电脑上运行

该研究的主要作者、博士石梁说:“以前人们认为,使用现有的消费级硬件,不可能进行实时三维全息计算。”

D

麻省理工学院电气工程和计算机科学系(EECS)的学生

“人们常说,商用全息显示器将在10年后出现,但这种说法已经存在了几十年

" 施认为,这种新的方法,该团队称之为“张量全息术”,将最终实现这一难以实现的10年目标

这一进展可能会推动全息技术向虚拟现实和3D打印等领域的溢出

石和他的顾问、合著者沃伊切赫·马图西克共同完成了这项发表在《自然》杂志上的研究

其他合著者包括EECS的李北辰和麻省理工学院的计算机科学和人工智能实验室,以及麻省理工学院的前研究员金昌义(现在在脸谱网)和彼得·克伦霍夫(现在在斯坦福大学)

对更好的3D的追求 典型的基于镜头的照片对每个光波的亮度进行编码——照片可以忠实地再现场景的颜色,但最终会产生平面图像

相比之下,全息图编码了每个光波的亮度和相位

这种组合更真实地描绘了场景的视差和深度

因此,虽然莫奈的“睡莲”照片可以突出画作的色彩品味,但全息图可以让作品栩栩如生,呈现每一笔独特的3D纹理

尽管全息图很现实,但制作和分享却是一个挑战

最初发展于20世纪中期,早期的全息图是用光学方法记录的

这需要分裂一束激光,一半用于照射目标,另一半作为光波相位的参考

这种参考产生了全息图独特的深度感

产生的图像是静态的,所以它们不能捕捉运动

它们只是硬拷贝,很难复制和共享

计算机生成的全息术通过模拟光学装置来回避这些挑战

但是这个过程可能是一个计算过程

“因为场景中的每个点都有不同的深度,所以你不能对所有的点应用相同的操作,”石说

“这大大增加了复杂性

“指挥一台集群超级计算机运行这些基于物理的模拟可能需要几秒钟或几分钟才能获得一张全息图像

此外,现有的算法不能以照片级的精确度来模拟遮挡

因此,施的团队采取了不同的方法:让计算机自学物理

他们使用深度学习来加速计算机生成的全息术,允许实时全息生成

该团队设计了一个卷积神经网络——一种使用一系列可训练张量粗略模拟人类如何处理视觉信息的处理技术

训练一个神经网络通常需要一个大的、高质量的数据集,这在以前的三维全息图中是不存在的

该团队建立了一个包含4000对计算机生成图像的定制数据库

每一对都将一张图片(包括每个像素的颜色和深度信息)与其对应的全息图进行匹配

为了在新的数据库中创建全息图,研究人员使用了具有复杂和可变形状和颜色的场景,像素深度从背景到前景均匀分布,以及一组新的基于物理的计算来处理遮挡

这种方法产生了逼真的训练数据

接下来,算法开始工作

通过从每一对图像中学习,张量网络调整了它自己计算的参数,连续增强了它生成全息图的能力

完全优化的网络比基于物理的计算快几个数量级

这种效率让团队自己都感到惊讶

“我们对它的表现感到惊讶,”马图西克说

仅在几毫秒内,张量全息术就可以从具有深度信息的图像中制作全息图,深度信息是由典型的计算机生成的图像提供的,并且可以通过多摄像机设置或激光雷达传感器(两者都是一些新智能手机的标准配置)进行计算。

这一进展为实时三维全息摄影铺平了道路

此外,紧凑的张量网络需要不到1 MB的内存

他说:“考虑到最新手机上可用的几十和几百千兆字节,这是可以忽略不计的。”

“一个相当大的飞跃” 从虚拟现实到3D打印,实时3D全息术将增强一系列系统

该团队表示,新系统可以帮助虚拟现实观众沉浸在更真实的场景中,同时消除眼睛疲劳和长期使用虚拟现实的其他副作用

这项技术可以很容易地应用在调制光波相位的显示器上

目前,大多数价格合理的消费级显示器只调节亮度,但如果广泛采用,调相显示器的成本会下降

研究人员说,三维全息术也可以促进立体3D打印的发展

这种技术比传统的逐层3D打印更快、更精确,因为立体3D打印允许同时投影整个3D图案

其他应用包括显微镜、医学数据可视化以及具有独特光学特性的表面设计

“这是一个相当大的飞跃,可以完全改变人们对全息摄影的态度,”马图西克说

“我们觉得神经网络是为这项任务而生的

"

来源:由phyica.com整理转载自PH,转载请保留出处和链接!

本文链接:http://www.phyica.com/wulixue/3639.html

发表评论

用户头像 游客
此处应有掌声~

评论列表

还没有评论,快来说点什么吧~