gwBenchmarks:高精度引力波天文学中大语言模型代理的应力测试
gwBenchmarks: Stress-Testing LLM Agents on High-Precision Gravitational Wave Astronomy
arXiv:2605.11269v1 通知类型:交叉引用 摘要:现代引力波天文学依赖于建模任务,这些任务通常需要数月的研究生级工作,包括从昂贵的数值相对论模拟中构建快速波形代理模型,对黑洞轨道动力学进行建模,拟合合并残余特性并构建模板库。这些问题需要极高的精度以支持探测和参数推断,最先进的模型达到小于等于10的负四次方的相对误差。我们研究最先进的大语言模型编码代理是否能够完成此类端到端任务
