物理科技生物学-PHYICA

什么是误差幅度?这个统计工具可以帮助你理解疫苗试验和政看美女的胸治投票

科学新闻 2022-06-10 00:04:06

作者:奥弗·哈尔,《对话》 样本量越大,预测越准确,误差越小

信用:通过维基共享的第三代 在过去的一年里,统计数据在新闻中异常重要

你或其他人使用的新冠肺炎测试有多准确?研究人员如何知道新疗法对新冠肺炎患者的有效性?电视网络如何在所有选票统计出来之前预测选举结果? 这些问题中的每一个都包含一些不确定性,但是只要理解了这种不确定性,仍然有可能做出准确的预测

统计学家用来量化不确定性的一个工具叫做误差幅度

有限的数据 我是一名统计学家,我工作的一部分是做推论和预测

有了无限的时间和金钱,我可以简单地测试或调查我感兴趣的整个群体,在脑海中评估这个问题并找到准确的答案

例如,为了找出美国的新冠肺炎感染率

S

,我可以简单地测试整个美国

S

人口

然而,在现实世界中,你永远无法访问100%的人口

相反,统计学家对一小部分人口进行抽样,并建立一个模型进行预测

使用统计学理论,从样本中推断出的结果代表整个人口

理想情况下,一个好的样本应该代表总人口,包括性别、种族多样性、社会经济多样性、生活方式和其他人口统计指标

样本越大,它与真实人口越相似,样本越大,统计学家对他们的预测越有信心

但是总会有一些不确定性

量化不确定性 以药物开发为例

预测一种新药对地球上的每个人都有0%到100%的疗效总是正确的

但这不是一个非常有用的预测

统计学家的工作是把范围缩小到更有用的东西

统计学家通常称这个范围为置信区间,这是一个预测范围,在这个范围内,统计学家非常有信心找到真实的数字

如果一种药物在10个人身上进行了测试,其中7个人发现它有效,估计药物疗效为70%

但是由于目标是预测整个人群的功效,统计学家只需要考虑测试10个人的不确定性

置信区间是用一个数学公式计算的,该公式包括样本量、反应范围和概率定律

在本例中,置信区间在42%和98%之间,范围为56个百分点

在只对10个人进行测试后,你可以很有把握地说,这种药物对整个人口中42%到98%的人有效

如果你把置信区间分成两半,你就得到误差幅度——在这种情况下,是28%

误差越大,预测越不准确

误差越小,预测越准确

几乎30%的误差范围仍然很大

然而,想象一下,研究人员在1000人而不是10人身上测试了这种新药,并且在其中的700人身上有效

药物疗效的估计仍将在70%左右,但这一预测要准确得多

较大样本的置信区间在67%和73%之间,误差幅度为3%

你可以说这种药物预计对整个人群有70%的效果,正负3%

统计学家希望能够100%准确地预测一种新药的成败或选举的确切结果

然而,这是不可能的

总会有一些不确定性,误差幅度就是量化这种不确定性的东西;在查看结果时必须考虑到这一点

特别是,误差范围定义了预测的范围,在这个范围内,统计学家非常有信心找到真实的数字

可接受的误差范围是一个判断问题,其依据是得出结论所需的准确度

来源:由phyica.com整理转载自PH,转载请保留出处和链接!

本文链接:http://www.phyica.com/kexuexinwen/17983.html

发表评论

用户头像 游客
此处应有掌声~

评论列表

还没有评论,快来说点什么吧~