物理科技生物学-PHYICA

从难民危机吉井惠到新冠肺炎,我们使用数据的方式事关生死

科学新闻 2022-04-15 00:04:25

道格·斯皮特和莫妮卡·哈尔科特的《对话》 南丁格尔的图表之一——在这个例子中展示了东部军队中死亡的原因,发表于1858年

信用:维基共享 在危机时刻,我们经常求助于数据,试图既了解我们所处的情况,又寻找如何逃离的答案

为了应对新冠肺炎疫情,世界各国政府已经使用算法,使用安装在我们手机上的应用程序中的数据,以及闭路电视、面部识别和其他数据收集工具来抗击疫情

数据正以一种我们许多人从未见过的方式被用来驱动数十亿人的日常活动

根据看不见的数据之手,人们被指示呆在家里、去上班、戴口罩或送孩子上学

然而,2020年也凸显了这种危险

对这些数据的解读和收集并非没有问题——医生和政治家们看着相同的数据,可能会对正确的行动方针得出截然不同的结论

毫无疑问,我们应该利用一切可以利用的工具来拯救生命,但是这种流行病也带来了许多数据映射方面的问题

新冠肺炎不成比例地影响着许多国家的最贫困人口,以及黑人和亚裔社区

这在很大程度上是由于旨在阻止疾病传播的数据驱动的法规;通常是以设计和运行它们的人所做的假设为模型

这些不平等已经存在,但通过关闭办公室、减少交通和家庭教育来减缓扩散的模式给社会中最贫穷和最弱势的成员带来了巨大压力,他们没有足够的特权来改变他们的工作或生活安排

随着数字技术的进一步引入,如移动跟踪和追踪,这些社区将被进一步边缘化

即使在最富裕的国家,那些没有智能手机的人也将错过任何旨在保护人们的数字追踪应用

虽然这些做法是许多人面临的新问题,但这些技术——以及它们的缺点——长期以来一直被用来塑造世界各地数百万人的生活和死亡

在数字时代,地图和数据继续被视为万灵药

越来越多的人不得不由选举产生的官员来决定他们的生活,而是由黑盒算法、地图和数据可视化来决定

随着我们遏制这一流行病的努力继续进行,我们必须从其他危机中吸取教训,推动建立一个更加公正的世界

要做到这一点,关键是人们要理解数据的不可靠质量

对许多人来说,统计数据似乎很可靠

但是数据可能会误导人,理解这种情况是朝着正确的方向迈出的一大步,即利用数据改善世界各地数百万人的生活,并应对新冠肺炎等全球危机

数据有三个主要问题

一个

黑暗数据 从表面上看,第一个问题似乎最容易解决

暗数据是指根本没有收集到的数据

许多人相信,如果我们收集了足够多的关于一切的数据,那么我们就能解决任何问题

然而,不可能收集所有的信息:总会有黑暗的数据

例如,由于关于同意的法律,我们不会像成年人那样收集关于儿童的数据

数据通常是通过并非每个人都可以使用的工具收集的——移动电话共享大量信息,但并非每个人都有手机

真正的麻烦来自于所谓的认知和意识形态假设

这些假设意味着,即使有最好的意图,我们也不能收集我们认为不需要的东西的数据,或者我们不知道我们需要关于这些东西的数据

明显的例子包括女性被排除在试验和测试之外的频率,或者被遗忘,或者基于她们与男性相同的假设

这可能会产生致命的后果

有时,我们的偏见也促使我们不去收集我们认为与我们自身利益或世界观相违背的数据

一种令人惊讶的保持现状的强烈欲望使我们无法突破这个障碍

2

数据实证主义 暗数据的问题与另一个被称为数据实证主义的问题密切相关

这与我们如何处理已捕获的数据有关

几乎不可能呈现我们找到的所有数据

这可能是因为我们拥有的太多了,或者是因为我们试图用我们的数据讲述一个特定的故事

当我们将数据转化为地图和图像时,我们必须选择哪些是包含的,哪些是不包含的,这通常采取将一种知识优先于另一种知识的形式

与其他形式的信息相比,非常符合传统制图实践的数据更有可能包含在地图中

这可以将极其复杂且相互竞争的想法集合转化为过于简单的数据集,进而转化为更加简化的数据可视化

这些观想很少受到质疑,因为它们的制作方式超出了大多数人的专业知识

创作者的专业知识是完全值得信任的——他们制造了一种虚假的确定感,但我们会坚持下去,尤其是如果他们强化了我们的现状

数据清洗 然后是数据清洗的问题

让我们假设您已经避免了暗数据的问题,并且收集了一切,包括您不知道您需要的数据,并且您已经在数据的清理和准备中导航了数据实证主义

然后你来展示你的发现

也许他们没有真正展示你想要的故事,或者展示与你想的相反的东西——你会怎么做?你会调整东西让它们看起来不一样吗?你会跳过那个图表,转到另一个显示更接近你的假设的图表吗?你选择什么都不分享吗? 这些问题似乎很容易回答,很容易站在道德实践的正确一边

但是即使是出于好意,当我们自己的数据不符合预先假设时,我们也可以不予考虑

我们可能会告诉自己,我们一定在数据收集方面犯了一个错误,所以不应该分享它

或者我们可能会想:这不是一个好故事,我就不说了

或者:这应该更有戏剧性,我会改变颜色和设计让它流行起来

这些并不总是虚伪的,但这些看似无辜的决定隐藏或掩盖了数据和知识

即使有最好的意图,他们也很难避免,当涉及到有争议的问题时,最好的意图往往是不够的

在将人转化为纯数据的过程中,生与死的决定是在未经人们同意的情况下做出的

这些是算法驱动的世界的非人性化效果

历史教训 长期以来,地图和数据可视化一直被用于危机时期,以帮助我们理解正在发生的事情,并找到可能保护生命和创造更美好未来的前进道路

突出的例子包括托马斯·夏普特1832年在英国埃克塞特绘制的霍乱地图,以及约翰·斯诺在伦敦绘制的更著名的霍乱死亡地图

这些地图和它们的作者被认为带来了对水传播疾病的新认识,拯救了许多生命

佛罗伦萨·南丁格尔也是一名统计学家,他的名字来源于新冠肺炎之后在英国各地建造的急救医院

1861年,作为她向美国陆军咨询内战伤亡情况的一部分,南丁格尔进行了数据可视化,而且很多数据都是可视化的

她创建了条形图、堆积条形图、蜂窝密度图和100%面积图

南丁格尔的数据可视化不仅仅是展示正在发生的事情,它们是为了呼吁变革而设计的;表明需要改革

她还发明了一种新的图表来帮助她的论点:一种今天被称为夜莺玫瑰(她称之为“楔形”)的比较极区图

她最著名的图表显示了病人在卫生条件改善后存活率的变化,如定期洗手,并通过大小的差异强调了这些改善的有效性

夏普特1832年的霍乱地图

信用:维基共享 南丁格尔、夏普特、斯诺和许多其他人使用图表来建立图形论点和易于理解的比较,从而挽救了许多生命

但是当我们回顾它们时,我们通常只考虑最终产品(地图或图表),而不是它们的创造过程

然而,在当时,这些作品被广泛驳回,并经常被误解为支持当时的流行思想

许多人不想实施南丁格尔提议的改革,尽管他们现在被视为医院经营方式的变革

斯诺的地图变得比夏普特的更出名,不仅因为它们是伦敦的地图,还因为他大步走上布罗德大街,扯下社区水泵手柄的动人故事

被遗忘的是,这一行为之所以需要,正是因为他的数据和映射最初被那些选择将斯诺的m aps视为支持他们自己理论的人误解了——这是一个确认偏差的例子,我们以适合自己观点的方式阅读数据

斯诺和南丁格尔都通过他们的数据工作挽救了无数生命,但即使是他们也遇到了许多黑暗数据、数据实证主义和误解的问题

在数字时代,数据往往在未经同意的情况下被大规模收集,并越来越多地由计算机和算法进行组织、分类和解释,数据已被视为解决一切问题的手段,也是一种危险的商品

使用数据来跟踪人们并指示他们的行为,在非常真实和现实的意义上意味着生与死的区别

虽然这一点在我们许多人看来与新冠肺炎有关,但还有更多关于数据、危机和生存斗争的故事

在我们的新书《测绘危机》中,我们关注那些已经被测绘或他们复杂的生活被简化为数据、航拍照片或报告的人的经历

由此,我们能够得出更好的工作方式,更好地理解秘密数据世界对我们日常生活的各种影响

我们的一个例子是地中海移民危机

生死与数据 对许多人来说,地中海是一个让人联想到阳光明媚的海滩、美丽的海滨美食和绿松石色海洋的地方

但是这片水域也是世界上警力最强的地区之一

欧洲联盟对该地区的所有活动,无论是否合法,都进行了广泛的测绘和监测

虽然地中海沿岸的各个国家长期以来都加强了边界,但欧盟的形成实际上在北部海岸形成了一条单一的边界

自那时以来,欧洲各国一直在建立一个更加全面和复杂的系统,用于监测和交流关于试图进入欧洲大陆的非正常移民的信息

该系统名为EUROSUR,结合了高分辨率卫星图像、长航时无人机、自动船只识别系统和海上军事雷达,可实现近乎实时的态势报告和风险分析

这些报告提供了关于“成功”拦截的移民船只的每日最新情况

但这种描绘移民流动的高度复杂的工具只对那些被阻止的人感兴趣

欧盟国家持有的大量数据库几乎没有关于那些试图寻求庇护时死亡或失踪的人的信息

相比之下,那些登上欧洲海岸的人会接受严格的生物识别数据筛选,包括电子指纹、虹膜扫描和医疗检查,以及关于他们生活的个人细节,以验证他们的身份

根据国际移民组织的统计,在过去的十年里,超过19,000人在前往欧洲的途中淹死或失踪

这些数字只是估计:没有一个全面的系统来记录整个欧盟成员国的移民死亡人数

欧洲政府并不认为移民死亡是他们的法律责任,因此也没有对他们进行定期跟踪记录

这使得像国际移民组织这样的人道主义机构依赖于目击者的描述和来自搜救非政府组织、医疗检查员或媒体的报告

缺乏关于移民死亡的知识揭示了跨境流动的实时跟踪是多么的不完整

它还服务于政治议程,在那里可以很容易地找到关于移民给欧洲带来的“风险”的数据,但是关于穿越地中海的真实生死风险的数据却不为公众所知

这使得更容易将移民描述为一种威胁,而不是为了寻求安全而不顾一切的难民

对欧洲边境和海岸警卫局来说,这提供了一个便利的背景,以防止更多的死亡和人类痛苦为借口,使欧洲边境日益军事化合法化

在边境地区,数字地图和统计图用来加强整理它们的组织和政府的政治和社会目标

数据由欧盟和欧洲政府有选择地收集和呈现,将欧洲的威慑和遏制移民政策延伸到了数字领域

在地中海的具体情况下,这种有选择地读取数据的做法不仅将那些滞留在希腊和土耳其接待中心的人成功申请庇护的机会降至最低,而且还使各国政府和整个欧盟得以逃避对边境警察人力成本的任何法律和政治责任

通过不收集关于溺水者的数据,欧盟可以掩盖这样一个事实,即尽管有先进的测绘和跟踪技术,他们对利用这些数据拯救生命或营救在海上失踪的男人、女人和儿童毫无兴趣

没有死亡记录意味着没有记录有多少欧洲政府目睹了溺亡

激进数据映射 也就是说,欧洲对移民的故意“视而不见”并非没有争议

许多民间社会倡议和人道主义活动分子都强调要定期记录死亡或失踪人员,并让欧洲承担责任

由联合欧洲和堡垒欧洲等组织编制的“死亡名单”等倡议仔细记录了每一个报告的事件,利用这些数字倡导对欧洲庇护政策进行彻底修订

虽然这些反映射肯定能够打破围绕边境治安的人力成本的沉默之墙,但死亡名单并没有破坏或改变国家的优先事项

跨国网络报警电话标志着这方面的一个罕见的例外

报警电话为处于困境的移民提供24/7热线

该组织通过向国家海岸警卫队和港口当局通报海上突发事件来确保他们的救援

他们结合使用手机和Facebook、Viber、WhatsApp和Skype等在线消息应用程序,以及AIS(用于船只跟踪的全球自动识别系统)和呼叫管理软件等物流平台,试图预先阻止死亡,并迅速采取行动营救有溺水风险的人

该组织帮助了成千上万处于困境中的人

2020年的夏天尤其艰难

随着欧洲的边境比以往任何时候都更加封闭,报警电话被电话淹没了

在8月13日之后的7天里,14艘船上的近900人拨打了报警电话,请求帮助

报警电话提高了警报,尽管一些人被送往安全的地方,无论是在欧洲还是利比亚,超过260人死亡或失踪

通过汇集技术、网络能力,并通过团结和同情,志愿者网络能够在困难时期帮助移民,并帮助他们更有效地通过欧盟的雷达

这条热线不仅仅是一个求救电话:它把移民的知识汇集成有效的“地图”,帮助穿越地中海的后勤工作

这样做也突出了欧盟成员国的故意滥用和零星数据收集

警告 从移民危机的数据映射中可以学到很多东西

地图和数据永远只能是现实的部分表现,但是随着我们收集越来越多的数据,我们会被引诱认为这些表现是绝对正确的

然而,从上面的例子可以清楚地看出,现有的过程并不能保护生命:它们是控制的工具,而不是支持

那些在寻找新生活时被迫保持沉默的人,在反测绘项目中出现了一线希望

但是即使是最善意的项目也可能与误解数据相冲突

数据往往有自己的生命

COVID-19将数据驱动的危机管理世界带到了全世界的门口,但这些都不是新的体验

许多人已经沦为数据点

从地中海到学校成绩,生活越来越被算法、计算和这些技术中固有的偏见所支配

我们使用数据的方式在很大程度上受到政治、维持现状的愿望以及在这个过程的每个阶段做出的有意识和无意识的决定的影响

因此,我们应该质疑数据:它是如何收集的,又是如何部署的

但是数据也很重要,我们不能全盘否定

世界已经看到了对科学的抵制和“替代事实”的增长

反伪装者、反暴力者、5G阴谋论者和冠状病毒否认者的崛起表明了这有多危险

这种争论是在向后推,而不是向前推

他们不寻求更多的理解,而是维持现状

虽然有些人可能会试图扭曲我们在这里提出的论点,以拒绝科学,但我们相反地说,我们应该问一些让我们的理解更深入的问题

几乎不可能消除由暗数据、数据清洗和数据实证主义引起的问题

这可能是有目的的,也可能是偶然的,但影响可能是深远的

所以,下次你看地图或数据观想时,问:这是给谁的?它增强或巩固了谁的权力?数据里少了谁?谁从来没有被问过,被遗忘,被排挤?谁输了?我们如何做得更好?

来源:由phyica.com整理转载自PH,转载请保留出处和链接!

本文链接:http://www.phyica.com/kexuexinwen/14614.html

发表评论

用户头像 游客
此处应有掌声~

评论列表

还没有评论,快来说点什么吧~