物理科技生物学-PHYICA

你的眼睛可以通过新的视线追踪工具控制你的智能手机

技术工程 2022-06-02 21:54:00

smartphone userCredit:pix abay/CC0 Public Domain随着越来越多的人在智能手机上观看电影、编辑视频、阅读新闻和关注社交媒体,这些设备已经发展到可以容纳更大的屏幕和更高的处理能力,以满足要求更高的活动的需要。笨重的手机的问题是,它们经常需要第二手或语音命令来操作——这可能是笨重和不方便的。

作为回应,卡耐基梅隆大学人机交互研究所(HCII)未来界面小组的研究人员正在开发一款名为EyeMU的工具,该工具允许用户通过结合视线控制和简单的手势在智能手机上执行操作。

“我们问了这样一个问题,‘有没有一种更自然的机制可以用来与手机互动?’而我们所做的很多事情的前身就是看东西,”人机交互专业的博士生Karan Ahuja说。

目光分析和预测并不新鲜,但在智能手机上实现可接受的功能水平将是一个值得注意的进步。

“这种眼睛有你所说的点石成金的问题,”HCII副教授、未来界面小组主任克里斯·哈里森说。“你不能有这样的情况,无论你在哪里看电话,都有事情发生。会打开太多应用程序。”

精确跟踪眼睛的软件可以解决这个问题。安迪·孔(Andy Kong)是计算机科学专业的大四学生,自从他第一次来到CMU,就对眼动技术产生了兴趣。他发现商业版本价格昂贵,所以他编写了一个程序,使用笔记本电脑的内置摄像头来跟踪用户的眼睛,进而在屏幕上移动光标——这是迈向EyeMU的重要一步。

CMU的研究人员展示了如何使用手机面向用户的摄像头进行凝视估计,并与动作手势相结合,以实现手持手机上的快速交互技术。孔说:“目前的手机只有在我们向它们要东西时才会有反应,不管是通过语音、点击还是按钮。“如果手机现在被广泛使用,想象一下,如果我们可以通过分析凝视或其他生物特征来预测用户想要什么,这将是多么有用。”

简化这个包并不容易,因此它可以在智能手机上快速工作。

“这是一个资源限制。你必须确保你的算法足够快,”Ahuja说。"如果花的时间太长,你的眼睛会向前移动."

该论文的第一作者孔在去年的多模态交互国际会议上与阿胡佳、哈里森和大学的助理教授马扬克·戈尔一起提交了该团队的研究结果。对于本科研究员孔来说,一篇通过同行评审的论文被一个重要会议接受是一个巨大的成就。

Kong和Ahuja通过使用Google的面部网格工具来研究用户注视屏幕不同区域的凝视模式,并呈现地图数据,从而改进了早期的原型。接下来,该团队开发了一种凝视预测器,使用智能手机的前置摄像头锁定观众正在看的东西,并将其注册为目标。

该团队通过将凝视预测器与智能手机内置的运动传感器相结合来实现命令,从而使该工具更加高效。例如,用户可以长时间查看通知,以确保其作为目标,并向左轻击手机以消除它,或向右轻击手机以响应通知。类似地,用户可能会将手机拉近以放大图像,或者将手机移开以解除凝视控制,同时另一只手拿着一大杯拿铁咖啡。

哈里森说:“像谷歌和苹果这样的大型科技公司已经非常接近视线预测,但仅仅盯着某样东西是无法实现的。”“这个项目的真正创新是增加了第二种模式,例如向左或向右滑动手机,结合视线预测。这就是它的强大之处。回想起来,这似乎太明显了,但这是一个聪明的想法,让EyeMU更加直观。”

来源:由phyica.com整理转载自PH,转载请保留出处和链接!

本文链接:http://www.phyica.com/jishugongcheng/17482.html

发表评论

用户头像 游客
此处应有掌声~

评论列表

还没有评论,快来说点什么吧~