物理科技生物学-PHYICA

通过用新处理器丰富人工智能算法来驯服数据洪流

技术工程 2022-02-01 21:53:56

Taming the data delugea3d 3的愿景是建立一个由领域科学家、计算机科学家和工程师组成的紧密耦合的组织,该组织将三个核心组件结合起来,这三个组件对于实现实时人工智能以转变科学至关重要:人工智能技术、计算硬件和科学应用。功劳:A3D3一场即将到来的数据海啸有可能淹没从微小的中微子到爆炸的超新星,以及大脑深处的奥秘等领域中巨大的数据丰富的研究项目。当LIGO从遥远的黑洞和中子星碰撞中获得引力波信号时,捕捉可能伴随它们的最早光线的时钟开始滴答作响:时间在这场竞赛中至关重要。从监测大脑活动的电子传感器收集的数据超过了计算能力。来自大型强子对撞机(LHC)的破碎粒子束的信息将很快超过每秒1千兆比特。

为了实时解决这一日益逼近的数据瓶颈,由包括麻省理工学院在内的华盛顿大学领导的九个机构的研究人员团队获得了1500万美元的资金,用于建立数据驱动发现加速人工智能算法(A3D3)研究所。来自麻省理工学院的研究团队包括物理学助理教授菲利普·哈里斯,他将担任A3D3研究所副所长;电气工程与计算机科学助理教授宋晗,将担任A3D3的合作PI;和麻省理工学院卡弗利天体物理和空间研究研究所的高级研究科学家埃里克·卡萨沃辛斯。

获得这项为期五年的“驾驭数据革命大创意”资助,并由高级网络基础设施办公室联合资助,A3D3将专注于三个数据丰富的领域:多信使天体物理学、高能粒子物理学和脑成像神经科学。通过用新处理器丰富人工智能算法,A3D3寻求加速人工智能算法,以解决对撞机物理、中微子物理、天文学、引力波物理、计算机科学和神经科学中的基本问题。

“我对新研究所在核物理学和粒子物理学方面的研究机会感到非常兴奋,”核科学实验室主任博莱斯劳·威失魂落魄地说。“现代粒子探测器产生大量数据,我们正在寻找异常罕见的特征。应用速度极快的处理器来筛选这些堆积如山的数据,将对我们将要测量和发现的东西产生巨大的影响。”

A3D3的种子是在2017年种下的,当时哈里斯和他在费米实验室和欧洲粒子物理研究所的同事决定整合实时人工智能算法,以处理LHC令人难以置信的数据速率。通过与韩的电子邮件通信,哈里斯的团队构建了一个编译器HLS4ML,可以在纳秒内运行人工智能算法。

哈里斯说:“在开发HLS4ML之前,我们所知道的最快的处理速度大约是每AI推断一毫秒,可能会快一点。“我们意识到所有的人工智能算法都是为了解决速度慢得多的问题而设计的,比如图像和语音识别。为了达到纳秒级的推理时间尺度,我们认识到我们可以制作更小的算法,并依靠现场可编程门阵列处理器的定制实现,这种方法与其他人正在做的有很大不同。”

几个月后,哈里斯在一次物理教师会议上介绍了他们的研究,卡萨沃单尼斯对此很感兴趣。在7号楼喝咖啡时,他们讨论了如何将哈里斯的现场可编程门阵列与卡萨沃单尼斯利用机器学习寻找引力波的方法结合起来。FPGAs和其他新的处理器类型,如图形处理单元(GPU),加速AI算法,以更快地分析海量数据。

“我曾与90年代初上市的第一批平板电脑合作,亲眼目睹了它们如何在我当时从事的大型高能物理实验中彻底改变了前端电子学和数据采集,”卡特萨沃斯回忆道自从20多年前加入LIGO以来,让它们处理引力波数据的能力就一直在我的脑海里。"

两年前,他们获得了第一笔资助,华盛顿大学的徐世杰也加入了进来。哈里斯说,该团队发起了快速机器实验室,发表了大约40篇关于这个主题的论文,为大约50名研究人员建立了这个小组,并“启动了一个关于如何探索人工智能领域的整个行业,这是过去没有探索过的”。“我们基本上是在没有任何资金的情况下开始这项工作的。这些年来,我们一直在为各种项目获得小额赠款。A3D3是我们支持这一努力的第一笔大额赠款。”

麻省理工学院卡弗利天体物理和空间研究所所长、弗朗西斯·弗里德曼物理学教授罗布·西姆科(Rob Simcoe)说:“A3D3之所以如此特殊,如此适合麻省理工学院,是因为它探索了一个技术前沿,人工智能不是在高级软件中实现的,而是在低级固件中实现的,重新配置单个门来解决手头的科学问题。“我们正处于一个实验产生大量数据的时代。在处理器级别定制可重新编程的定制计算机所带来的加速,可以将这些数据的实时分析提升到新的速度和复杂程度。”

大型强子对撞机的大量数据

数据速率已经超过每秒500太比特,LHC处理的数据比地球上任何其他科学仪器都多。它未来的总数据速率将很快超过每秒1pb,是世界上最大的数据速率。

“通过使用人工智能,A3D3旨在对每秒发生4000万次的所有碰撞进行高级分析,如异常检测和粒子重建,”哈里斯说。

目标是在所有这些数据中找到一种方法来识别每秒32亿次碰撞中的少数碰撞,这可能会为ces揭示新的东西,解释暗物质是如何形成的,并完成基本力如何与物质相互作用的图片。处理所有这些信息需要一个定制的计算系统,能够在超低延迟内解释对撞机信息。

哈里斯说:“在每秒100万亿比特的速度上实时运行这项技术的挑战令人生畏,需要对我们设计和实现人工智能算法的方式进行彻底的改革。“随着探测器分辨率的大幅提高导致数据速率变得更高,在众多碰撞中寻找一个碰撞的挑战将变得更加艰巨。”

大脑和宇宙

由于医学成像和植入电极的电记录等技术的进步,神经科学也在收集大量关于大脑神经网络如何处理刺激反应和执行运动信息的数据。A 3D3计划开发和实现高通量和低延迟的人工智能算法,以实时处理、组织和分析海量神经数据集,探索大脑功能,从而实现新的实验和疗法。

借助多信使天体物理学(MMA),A3D3旨在通过有效处理来自引力波、伽马射线爆发和望远镜和探测器拾取的中微子的数据来快速识别天文事件。

A3D3研究人员还包括由15名其他研究人员组成的多学科小组,包括项目负责人华盛顿大学,以及加州理工学院、杜克大学、普渡大学、加州大学圣地亚哥分校、伊利诺伊大学厄巴纳-香槟分校、明尼苏达大学和威斯康星大学麦迪逊分校。它将包括冰立方(Icecube)和沙丘(DUNE)的中微子研究,以及Zwicky瞬态设施的可见天文学,并将组织深度学习研讨会和训练营,以培训学生和研究人员如何为该框架做出贡献,并扩大快速人工智能策略的使用。

“我们已经达到了一个点,探测器网络的增长将是变革性的,无论是在事件率方面,还是在天体物理范围方面,最终是在发现方面,”Katsavounidis说。“‘快速’和‘高效’是对抗宇宙中‘微弱’和‘模糊’的唯一方法,也是充分利用我们的探测器的途径。一方面,A3D3将为引力波物理和多信使天文学带来生产规模的人工智能;但另一方面,我们渴望超越我们的直接领域,成为全国加速人工智能应用于数据驱动学科的首选地。”

来源:由phyica.com整理转载自PH,转载请保留出处和链接!

本文链接:http://www.phyica.com/jishugongcheng/9344.html

发表评论

用户头像 游客
此处应有掌声~

评论列表

还没有评论,快来说点什么吧~