物理科技生物学-PHYICA

使用危机使命破解版图形神经网络发现粒子

物理学 2022-04-14 23:59:06

作者扎克·萨维茨基,费米国家加速器实验室 升级后的高粒度量热计——大型强子对撞机的CMS探测器的一个组成部分——产生了碰撞产生的复杂粒子图像

研究人员正在努力实现图形神经网络,以优化对这些数据的分析,从而更好地识别和表征感兴趣的粒子相互作用

学分:陈子恒,西北大学 机器学习算法可以在几分钟内打败世界上最难的电子游戏,并且比几代物理学家的集体努力更快地解决复杂的方程

但是传统的算法仍然很难在繁忙的街道上找到停车标志

物体识别继续阻碍机器学习领域——特别是当图片是多维的和复杂的,就像高能物理实验中粒子探测器拍摄的碰撞一样

然而,一种新的神经网络正在帮助这些模型提高它们的模式识别能力,这项技术可能很快会在粒子物理实验中实现,以优化数据分析

今年夏天,费米实验室的物理学家在将图形神经网络嵌入实验系统的努力中取得了进展

科学家林赛·格雷更新了软件,使这些尖端算法能够应用于欧洲粒子物理研究所大型强子对撞机的数据

这些网络将首次被集成到粒子物理实验中,直接处理探测器数据——为效率的大幅提升打开了闸门,这将从当前和未来的探测器中获得更精确的信息

“一周前只是一个研究对象,现在是一个广泛使用的工具,可以改变我们分析粒子物理实验数据的能力,”格雷说

他的工作最初集中在使用图形神经网络来分析来自LHC的CMS实验的数据,这是对撞机的四个主要粒子物理实验之一

程序员开发神经网络来筛选堆积如山的数据,以寻找特定的类别或数量——比如,拥挤街道照片中的停车标志

普通的数码照片本质上是一个由红、绿、蓝方形像素组成的巨大网格

在被训练识别停车标志的样子后,传统的神经网络检查整个像素块,以查看目标是否存在

然而,这种方法是低效的,因为模型必须处理大量不相关的、模糊的数据

计算机科学家开发了新的神经网络来改善这一过程,但算法仍然难以识别图像中比二维正方形像素网格更复杂的对象

以分子为例

为了确定一种化学物质是否有毒,化学家必须确定分子中的某些特征,如碳环和羧基

用x光色谱仪拍摄的化学物质的照片产生了键合原子的三维图像,每次观察时看起来都略有不同

由于数据没有存储在正方形网格中,典型的神经网络很难学会识别有毒化合物

为了解决这个问题,化学家们已经开始使用一套新的神经网络:图形神经网络,或称神经网络

与这些典型的神经网络不同,神经网络能够辨别哪些像素是相互连接的,即使它们不在二维网格中

通过利用数据“节点”之间的“边”(在这种情况下,是原子之间的键),这些机器学习模型可以更有效地识别所需的主题

格雷的愿景是将这些模型及其增强的目标识别功能用于简化粒子碰撞的数据处理

“有了图形神经网络,你可以编写一个更好的模式识别算法,用于像粒子加速器数据这样复杂的东西,因为它有能力查看所有数据之间的关系,以找到信息中最相关的部分,”他说

大型强子对撞机的CMS探测器每秒钟拍摄数十亿张高能碰撞图像,以寻找新粒子的证据

图形神经网络迅速决定保留这些数据中的哪一个用于进一步分析

信用:欧洲核子研究中心 格雷的研究重点是将GNNs应用到CMS探测器的高粒度量热仪中

内容管理系统每秒钟拍摄数十亿张高能碰撞图像,以寻找新粒子的证据

热量计的一个挑战是它收集了如此多的数据——足够每秒钟填满2000万部苹果手机的图片——以至于由于存储空间的限制,大部分数据必须被扔掉

人类基因组计算机的触发系统必须在百万分之几秒内决定哪些数据是有趣的,应该被保存

其余的被删除

“如果你有一个可以在一定时间内优化运行的神经网络,那么你就可以更可靠地做出这些决定

另一位和格雷一起工作的费米实验室科学家凯文·佩德罗说:“你不会错过任何东西,也不会保留你并不真正需要的东西。”

汞离子探测器同时收集了大量关于粒子相互作用的不同信息,产生了一些非常复杂的图像

格雷说:“这些数据形状怪异,它们之间有随机的间隙,而且它们甚至都没有接近一个连续的正方形网格。”

“这就是图表的作用所在——因为它们可以让你跳过所有没有意义的东西

" 理论上,神经网络将被训练来分析感兴趣的像素之间的联系,并能够预测哪些图像应该被保存,哪些图像可以被更有效和准确地删除

然而,因为这类神经网络对粒子物理来说是如此之新,所以还不可能直接在触发硬件中实现它们

图形神经网络在另一个方面非常适合人类大脑皮层:人类大脑皮层的模块是六边形的,这种几何形状虽然与其他类型的神经网络不兼容,但与神经网络配合良好

费米实验室首席信息官利兹·塞克斯顿·肯尼迪说:“这就是这个特殊项目取得突破的原因。”

“这显示了凯文和林赛的独创性:他们与设计量热计的同事密切合作,并利用他们在软件方面的独特专长来进一步扩展实验的能力

" 格雷还设法编写了一个代码,扩展了PyTorch的功能,这是一个广泛使用的开源机器学习框架,允许图形神经网络模型在世界各地的设备上远程运行

“在此之前,建立一个模型然后部署它是极其笨拙和迂回的,”格雷说

“现在它已经可以运行了,您只需将数据发送到服务中,它就会计算出如何最好地执行它,然后输出会被发送回给您

" 格雷和佩德罗说,他们希望在2021年LHC跑步3号恢复时,图形神经网络能够发挥作用

通过这种方式,模型可以在对撞机的高亮度升级之前进行训练和测试,这种增强的数据收集能力将使GNNs更加有价值

一旦网络在一个地方建立并运行,让它们在实验室的其他实验中工作应该会容易得多

“你仍然可以在其他实验中把我们正在研究的人类大脑中的图形神经网络应用到其他探测器上,”格雷说

“我们在高能物理中采用机器学习的速度甚至还没有接近饱和

人们会不断找到越来越多的方法来应用它

"

来源:由phyica.com整理转载自PH,转载请保留出处和链接!

本文链接:http://www.phyica.com/wulixue/14571.html

发表评论

用户头像 游客
此处应有掌声~

评论列表

还没有评论,快来说点什么吧~