物理科技生物学-PHYICA

网络上千篇一律的图片描述并不能满足盲人的需求

技术工程 2022-02-27 21:54:26

visual information Credit: CC0公共领域在线图像描述—或“alt-text”—通过提供与网站进行有意义、安全和高效交互所需的上下文和细节,帮助失明或视力低下的人轻松获取信息。然而,科罗拉多大学博尔德分校的研究人员最近发表的发现表明,仍然有很多工作要做,以首先生成,然后改进这些描述的创作者跨越许多平台。这项工作发表在ACM SIGACCESS计算机和可访问性会议上,旨在通过探索创建人类和人工智能可以用来创作更有用的图像描述的培训材料的方法来填补这一空白。

这项研究由博尔德大学的校友阿比盖尔·斯坦格尔和助理教授欧阳丹丹·古拉里领导,他最近加入了工程和应用科学学院。2019年,斯坦格尔在阿特拉斯学院获得了技术、媒体和社会博士学位。她目前在美国国家科学基金会远程工作,担任华盛顿大学计算创新研究员的计算研究协会成员。

她说,这项工作的目标是研究如何快速创建图像描述,以响应发现它们的环境——无论平台或情况如何。

斯坦格尔说:“我们向28名盲人展示了尽可能多的关于五幅图像的信息,然后要求他们说明在不同的场景下,他们想要关于图像的什么信息。“每个场景都包含一个媒体源,在其中可以找到图像和预定的信息目标。例如,我们认为一个人访问购物网站为朋友寻找礼物是一个潜在的场景。”

斯坦格尔说,这项工作提供了几个关键的发现。一个是盲人在图像描述中想要的信息根据他们遇到图像的场景而改变。

“为了让替代文本准确,人类和人工智能系统都需要训练来创作图像描述,这些图像描述对用户的信息目标以及图像在哪里找到有响应或上下文感知,”她说。

其他发现表明,在所有场景中,盲人都希望图像具有某些类型的信息,因此,有可能确定哪些图像内容应该始终包含在这些描述中。

在攻读博士期间,斯坦格尔志愿加入了盲人主播中心、科罗拉多盲人中心和全国盲人联合会,以更好地了解盲人在获取信息和成为艺术家和设计师时面临的障碍。她说,她一直积极确保最终用户和利益相关者参与设计过程。

“我与古瑞教授的研究本质上是一个概念证明,即一刀切的图像描述不能满足盲人的访问需求。在其中,我们为我们的实验方法如何被其他有兴趣创建以用户为中心的训练材料的人使用和缩放提供了思考和指导,这些训练材料用于上下文感知图像描述——或者至少是最小可行的图像描述,”她说。“我期待着继续下去,并在不久的将来探索新的方法和问题。”

这项新研究的合著者包括德克萨斯大学奥斯汀分校的尼廷·维尔马和肯尼斯·弗莱施曼以及微软研究院的梅雷迪斯·林格尔·莫里斯。

来源:由phyica.com整理转载自PH,转载请保留出处和链接!

本文链接:http://www.phyica.com/jishugongcheng/11291.html

发表评论

用户头像 游客
此处应有掌声~

评论列表

还没有评论,快来说点什么吧~