物理科技生物学-PHYICA

大数据增强滴滴打车软件下载了瑞士统计系统

科学新闻 2021-11-19 00:04:00

洛桑联邦理工学院 信用:CC0公共领域 过去几年,从社交媒体、地理定位系统以及无人机和卫星的航空图像等来源收集、存储和共享了大量数字数据,为研究人员研究信息和解密我们的世界提供了许多新方法

在瑞士,联邦统计局(FSO)对大数据革命及其为社会利益生成预测性统计数据的可能性感兴趣

人口普查和调查等传统方法仍然是在市、州和国家各级生成社会经济指标的基准

但是这些方法现在可以用二手的,大部分是预先存在的数据来补充,这些数据来自手机订购和信用卡

根据FSO 2017年数据创新战略,“数据创新的目标是提高统计产品的质量、范围和成本效益,并减轻家庭和企业的应对负担

" 匿名数据 在这种背景下,EPFL城市系统中人与环境关系实验室的一组科学家对保险公司持有的数据的新用途进行了一项突破性的研究

该实验室的主要合作伙伴公司“移动实验室”提供了数十万投保人的匿名数据

这些数据包括年龄、住宅邮政编码、汽车和房屋所有权以及就业状况等因素

“我们想看看能否利用这些数据来预测具体的社会经济指标——这些指标能让我们更好地了解瑞士城市地区的质量

该研究的主要作者伊曼纽·马萨罗说:“保险公司持有的数据的一大优势——只要他们愿意分享——是它们使用起来很便宜,因为它们已经存在,并且年度调查可以不需要额外的费用。”该研究于3月3日发表在《PLOS一号》上

利用数据挖掘技术,研究小组提取了相关信息,并将其汇总,涵盖了170个人口最多的瑞士城镇

总之,他们获得了近600,000份档案,每份档案都由一个独特的代码标识

“La Mobilière的数据集非常完整;它包含了广泛的信息,使我们能够考虑30多个变量,我们主要用来选择那些最匹配每个社会经济指标的变量,”洛伦佐·多纳迪奥说,他是EPFL大学环境科学与工程的硕士学生,也是该研究的第一作者

空间回归模型 科学家开发了一个空间回归模型来准确预测六个类别中的十二个变量:人口、交通、工作、空间和区域、住房和经济

“当然,我们的预测不能取代官方人口普查,但它们可以作为年度路标

马萨罗说:“我们还想表明,保险公司的数据集包含大量与社会相关的信息——除了用于营销和市场研究的信息之外——保险公司应该考虑与研究人员更密切地合作。”

该团队的统计模型仅用于研究目的,并没有实际应用

它可以用来帮助指导决策者,但仍需要定期的人口普查数据

《流动报》的数据缺少某些信息,例如18岁以下的年轻人,但却代表了很大一部分人口

“我们的模型可供城市决策者和政府统计部门使用,它们可以将这类信息纳入其现代化努力中

马萨罗说:“保险公司的数据集非常精细,因为它们包含了关于客户的非常具体的信息。”

来源:由phyica.com整理转载自PH,转载请保留出处和链接!

本文链接:http://www.phyica.com/kexuexinwen/4416.html

发表评论

用户头像 游客
此处应有掌声~

评论列表

还没有评论,快来说点什么吧~