通过阿特拉斯实验 图1:图解说明混合样本的构造,用于在碰撞搜索中训练弱监督的CWoLa分类器
在ATLAS搜索中,共振特征(mres)是喷流质量,而其他特征(y)是两个喷流的质量
信用:阿特拉斯合作/欧洲核子研究中心 欧洲核子研究中心的地图集合作正在探索寻找新现象的新方法
除了通常受特定理论模型启发的广泛研究项目——从量子黑洞到超对称性——物理学家正在应用新的独立于模型的方法来扩大他们的搜索范围
阿特拉斯公司刚刚发布了第一个独立于模型的新粒子搜索,使用了一种叫做“弱监督”的新技术
" 寻找新粒子通常从一个特定的理论模型开始
给定模型的现象学和参数,物理学家将模拟新粒子如何在ATLAS探测器中产生和衰变
然后,他们模拟标准模型背景过程,以开发将信号与背景分离的分类器(有或没有机器学习)
这些分类器确定要研究的数据的最佳相空间区域,在该区域中,一个假设的信号将被富集
最后,物理学家将比较数据和背景预测来寻找异常
阿特拉斯的新搜索使用直接基于数据开发的机器学习分类器(神经网络),以减少它们对特定模型的依赖
这是对标准方法的重大偏离,因为数据没有标记:不知道特定的质子-质子碰撞事件是背景还是信号
这种被称为“弱监管”的方法利用数据中的结构,而不需要每个事件的标签
除了这种方法,新的ATLAS搜索使用了最传统的独立于模拟的异常检测策略之一:“碰撞搜索”
寻找凸起的目标是在平滑的背景上寻找局部的“凸起”
这种碰撞是许多新粒子模型的一般特征,碰撞发生在新粒子的质量上
新的研究建立在这一坚实的基础上,以提高对各种假设粒子的灵敏度,而无需提前指定它们的属性
碰撞搜索和弱监督的结合导致分析基本上不依赖于信号模型和背景模型
图2:一个双射流质量仓中的神经网络输出
作为一个二维函数,输出可以很容易地可视化为一个图像,其中强度对应于在喷流质量仓中网络输出的效率
左边的图没有信号注入,右边的图显示了当一个假设的3千电子伏的粒子衰变为另外两个200千电子伏的粒子时的输出
信用:阿特拉斯合作/欧洲核子研究中心 用弱监督检测异常 阿特拉斯物理学家使用一种叫做“无标签分类”的技术训练数据神经网络
在这种方法中,物理学家构建了两个由背景和潜在信号组成的混合数据集
除了电位信号的相对比例之外,它们是相同的
虽然每个事件的信号与背景标签是未知的,但是可以训练神经网络来区分两个数据集
有了足够的数据和足够强大的分类器,这实际上是区分信号和背景的最佳选择
当创建上面的混合数据集时,CWoLa方法与凹凸搜索相结合,如图1所示
信号事件的特征是局部共振区和边带区
这些区域将具有其他特征,也可以用于训练神经网络
如果没有信号,神经网络将不会学习任何东西,如果有信号,它可能会学会从背景中挑选出来
新的ATLAS搜索是完全数据驱动的机器学习增强的异常检测的第一个应用
该搜索使用强子最终状态检查事件,使用成对粒子“射流”的不变质量作为共振特征,使用单个射流的质量作为训练CWoLa分类器的特征
利用这一组受限的特征,物理学家成功地建立了这一程序,并发现它已经对大范围的新粒子敏感
物理学家能够训练神经网络,同时避免统计试验因素,这种因素会降低对相同数据进行训练和测试时的搜索灵敏度
神经网络(图2)被映射到一个效率
例如,10%意味着90%的事件的网络输出低于该值
在没有信号的情况下,网络不应该学习任何东西(因为两个混合数据集应该是相同的),但是根据设计,必须有一个低效率区域
图2的右图显示,网络能够识别注入的信号,尽管没有事先告诉它在哪里查找! 图3:模拟特定信号,然后将其添加到数据中,以便设置限制
这里选择的模型代表一个重粒子A(质量为3 TeV)衰变为另外两个新粒子B和C,质量写在横轴上
纵轴是极限——数字越低表示极限越大
新的搜索结果与ATLAS现有的两个结果进行了比较:包含性的dijet搜索(红色三角形)和对由W和Z玻色子产生的喷流的专门搜索(灰色十字)
信用:阿特拉斯合作/欧洲核子研究中心 提供新的精度 新的研究没有为新的粒子带来重要的证据,量化没有发现的是它自己的挑战
通常,物理学家可以简单地问,要记录一个明显的过量,需要增加多少信号,然后,由于没有观察到过量,这个信号量就被排除了
为实现这种分析的类似排除,需要针对每个建模的信号类型和信号量重新训练所有的神经网络
最终限值如图3所示
制作这个图需要训练大约20000个神经网络!一些信号对神经网络来说比其他信号更难找到,而那些在有大量背景的区域的信号被证明特别具有挑战性
对于其他信号,新的限制比以前的限制更强,并且在类似的相位空间中改进了以前的搜索
展望未来 ATLAS采用的新方法有许多扩展的可能性
弱监督碰撞搜索可以应用于附加的事件拓扑,并且可以添加更多的特征来扩大对新粒子的敏感度
可能需要更复杂的神经网络来适应更高维的特征空间,并且这将需要高要求的计算资源
阿特拉斯的物理学家也在考虑各种替代的异常检测技术,这些技术可能能够补充基于CWoLa的搜索
很可能没有一种方法能涵盖一切——需要多种方法来确保对新粒子的广泛、稳健和高度敏感性
来源:由phyica.com整理转载自PH,转载请保留出处和链接!