物理科技生物学-PHYICA

粒子物理中的大数据固态技亚洲阿v天堂无码z2018术

物理学 2022-05-09 23:59:09

费米国家加速器实验室杰尔德·平森 当科学家需要访问存储的文件来进行分析时,一个长长的机械臂从天花板上下来,选择一盘磁带,并将存储的数据传输到硬盘上

信用:赖达·哈恩,费米实验室 在欧洲粒子物理研究所的大型强子对撞机上,在CMS粒子探测器的8000多万个探测通道中,一秒钟内发生了多达4000万次粒子碰撞

即使在计算机筛选出最有意义的数据后,这些碰撞也会产生巨大的数字足迹

检索信息这一简单的行为可能意味着与瓶颈作斗争

美国物理学家

S

能源部的费米国家加速器实验室储存了LHC的大部分数据,现在正在试验使用NVMe,或非易失性存储器,固态技术,以确定当科学家需要检索文件进行分析时,访问存储文件的最佳方式

万亿字节的问题 欧洲粒子物理研究所的CMS实验结果有可能有助于回答物理学中一些最大的开放性问题,比如为什么宇宙中物质比反物质多,以及是否有三个以上的物理维度

然而,在科学家能够回答这样的问题之前,他们需要访问由内容管理系统探测器记录的碰撞数据,其中大部分是在费米实验室建造的

数据访问绝不是一件小事

如果不进行在线数据修剪,LHC每秒将产生40tb的数据,足以填满80台普通笔记本电脑的硬盘

自动选择过程只保留重要的、有趣的碰撞,将保存的事件数量从每秒4000万个减少到仅1000个

领导NVMe项目的费米实验室科学家博·贾亚蒂拉卡说:“我们只关心这些碰撞中的一小部分,所以我们有一系列的选择标准来决定哪些应该保留,哪些应该实时丢弃。”

尽管如此,即使有选择性的删减,每年仅来自内容管理系统检测器的数万兆字节的数据就必须被存储

不仅如此,为了确保任何信息都不会丢失或被破坏,每个文件都必须保存两份副本

一份完整地保存在欧洲粒子物理研究所,而另一份由世界各地的合作机构分享

费米实验室是美国主要的指定储存设施

S

对于内容管理系统实验,大约40%的实验数据文件存储在磁带上

固态溶液 费米实验室的费曼计算中心有三个大的数据库,里面装满了一排排的磁带,存储着费米实验室自己的实验数据和内容管理系统的数据

如果你把费米实验室的所有磁带存储能力结合起来,你将有能力存储相当于13000年的高清电视录像

贾亚蒂拉卡说:“我们的服务器机架上堆满了硬盘,它们是科学家们读写数据的主要存储介质。”

但是在过去的60年里,硬盘一直被用作计算机的存储设备,它们在给定时间内可以加载到应用程序中的数据量是有限的

这是因为他们通过从旋转的磁盘中检索数据来加载数据,这是访问该信息的唯一途径

科学家们正在研究实施新型技术的方法,以帮助加速这一过程

为此,费米实验室最近在其费曼计算中心安装了一个装满固态NVMe驱动器的服务器机架,以加速粒子物理分析

为了加速高能物理研究的分析,费米实验室最近安装了一个装满固态硬盘的服务器机架,叫做NVMe

荣誉:博·贾亚蒂拉卡,费米实验室 通常,固态驱动器使用紧凑的电路来快速传输数据

NVMe是一种先进的固态硬盘,每秒可处理4000兆字节

从长远来看,硬盘的平均容量约为每秒150兆字节,如果速度是你的主要目标,固态硬盘显然是首选

但是硬盘还没有被归入古代

它们在速度上的不足,在存储容量上得到弥补

目前,固态硬盘的平均存储限制是500千兆字节,这是现代硬盘上通常可用的最小存储量

因此,要决定费米实验室是否应该用固态硬盘取代更多的硬盘内存存储,需要仔细分析成本和收益

进行分析 当研究人员使用大型计算机服务器或超级计算机分析他们的数据时,他们通常是通过从存储中顺序检索部分数据来完成的,这一任务非常适合硬盘

贾亚蒂拉卡说:“到目前为止,我们已经能够在高能物理中使用硬盘驱动器,因为我们倾向于通过一次分析一个事件来处理数百万个事件。”

“因此,在任何给定的时间,您只需要从每个单独的硬盘上获取几条数据

" 但是新技术正在改变科学家分析数据的方式

例如,机器学习在粒子物理中变得越来越普遍,尤其是在内容管理系统实验中,该技术负责自动选择过程,只保留科学家感兴趣研究的一小部分数据

但是机器学习算法不需要访问一小部分数据,而是需要重复访问相同的数据——无论是存储在硬盘还是固态硬盘上

如果只有几个处理器试图访问那个数据点,这不会是什么大问题,但是在高能物理计算中,有成千上万的处理器在竞争同时访问那个数据点

使用传统硬盘时,这可能会很快导致瓶颈和速度变慢

最终结果是计算时间变慢

费米实验室的研究人员目前正在测试NVMe技术减少这些数据瓶颈的能力

费米实验室计算的未来 费米实验室的存储和计算能力不仅仅是内容管理系统实验的发电站

CMS计算R& D的努力也为即将到来的高亮度LHC计划的成功奠定了基础,并使费米实验室主持的国际深层地下中微子实验成为可能,这两项实验都将在2020年末开始采集数据

贾亚蒂拉卡和他的团队的工作还将允许物理学家优先考虑NVMe驱动器应该主要位于哪里,是在费米实验室还是在其他LHC伙伴机构的存储设施

有了新的服务器,该团队正在探索如何在费米实验室现有的计算基础设施中部署新的固态技术

来源:由phyica.com整理转载自PH,转载请保留出处和链接!

本文链接:http://www.phyica.com/wulixue/16003.html

发表评论

用户头像 游客
此处应有掌声~

评论列表

还没有评论,快来说点什么吧~