由康涅狄格大学制作 骆驼项目(宇宙学和天体物理学与机器学习模拟)结合了4000多种宇宙学模拟、数百万个星系和350万亿字节的数据来破译宇宙的秘密
学分:康涅狄格大学 共有4233个宇宙模拟、数百万个星系和350万亿字节的数据,骆驼项目的新版本对宇宙学家来说是一个宝藏
代表宇宙学和天体物理学以及机器学习模拟的骆驼旨在利用这些模拟来训练人工智能模型,以破译宇宙的属性
西蒙斯基金会宇宙微波背景分析和模拟小组的研究科学家弗朗西斯科·比利亚斯库萨-纳瓦罗说,科学家们已经在利用这些可以免费下载的数据来推动新的研究
维拉埃斯库萨-纳瓦罗与弗拉铁研究所计算天体物理中心的助理研究科学家施蒂杰内尔和丹尼尔·昂莱斯-阿尔卡扎领导着这个项目,丹尼尔·昂莱斯-阿尔卡扎也是康涅狄格大学的物理学副教授
“机器学习正在改变许多科学领域,但它需要大量的数据来利用,”昂莱斯-阿尔卡扎尔说
“骆驼公开数据发布会上有数以千计的模拟宇宙,涵盖了广泛的似是而非的物理学,将为星系形成和宇宙学社区提供一个独特的机会,探索新的机器学习算法解决各种问题的潜力
" 骆驼团队使用来自IllustrisTNG和Simba项目的代码生成了模拟
骆驼团队包括这两个项目的成员,吉乃尔是IllustrisTNG核心团队的一员,安格利斯-阿尔卡扎尔是开发辛巴的团队成员
大约一半的模拟结合了宇宙物理学和星系形成所必需的小尺度物理学
每一个模拟都是基于对宇宙略有不同的假设进行的——例如,关于宇宙中有多少是看不见的暗物质与将宇宙拉开的暗能量,或者有多少能量超大质量黑洞注入星系之间的空间
研究人员设计了模拟来为机器学习模型提供信息,然后机器学习模型将能够从真实的、可观测的宇宙的观测中提取信息
拥有4233个宇宙模拟,骆驼是有史以来最大的详细宇宙模拟套件,旨在训练机器学习算法
维拉埃斯库萨-纳瓦罗说:“这些数据将有助于新的发现,并通过机器学习将宇宙学与天体物理学联系起来。”
“有这么多宇宙模拟,从来没有类似的事情
" 骆驼数据集已经为研究项目提供了动力,大量论文利用了这些数据
西班牙巴伦西亚大学的巴勃罗·维拉纽瓦-多明戈领导了这样一篇论文
他和他的同事利用骆驼模拟训练了一个人工智能模型来测量我们银河系及其周围暗物质晕和附近仙女座星系及其晕的质量
这些测量——第一次使用人工智能完成——使我们银河系的重量达到1万亿到2万亿
是太阳质量的6万亿倍
这些估计与其他方法得出的结果大致一致,证明了人工智能方法的准确性
与此同时,维拉埃斯库萨-纳瓦罗领导了一项工作,利用骆驼数据来估计支配宇宙基本属性的两个参数的值:宇宙的哪个部分是物质,以及质量在整个宇宙中的分布有多均匀
首先,他和他的同事使用骆驼来生成地图,例如暗物质、气体和恒星的不同属性的分布
然后,利用这些地图,他们训练了一种叫做神经网络的机器学习工具来预测这两个参数的值
该论文的合著者吉纳说:“这是一种用于从图像像素中区分猫和狗的算法。”
“人眼无法确定模拟中有多少暗物质,但神经网络可以做到这一点
" 维拉埃斯库萨-纳瓦罗说,研究结果显示了利用骆驼在未来根据对宇宙的新观察来精确估计这些参数的前景
他说:“看到这将带来其他什么新发现,令人兴奋。”
来源:由phyica.com整理转载自PH,转载请保留出处和链接!