| 利用大型语言模型和多源数据集成转型气候服务 |
| 来源:一起赢论文网 日期:2026-05-03 浏览数:37 【 字体: 大 中 小 大 中 小 大 中 小 】 |
|
利用大型语言模型和多源数据集成转型气候服务伊万·库兹涅佐夫,安东尼娅·安娜·约斯特,德米特里·潘秋欣,鲍里斯·沙普金,托马斯·荣格 & 尼古拉·科尔杜诺夫 NPJ气候行动 volume4,文章编号:97(2025年) 引用本文7127 个入口4 引用1 Altmetric(高距计量制)指标details摘要将大型语言模型(LLMs)与气候模型数据、科学文献和非结构化文本集成,使新一代气候信息系统能够提供准确、局部化且具上下文感知的洞察。我们的主要目标是开发和评估ClimSight,这是一个可扩展的平台,能够将复杂的异构数据转化为可操作的信息。我们通过检索增强生成(Retrieval Augmented Generation)来增强大型语言模型,这是一种在查询时检索相关气候模型和报告到地面响应的方法。基于代理的架构协调专门模块,通过任务专用工具路由和处理用户查询。实际评估比较多种大型语言模型配置,分析速度、成本和准确性之间的权衡。结果显示气候评估的可扩展性和精度提升,使本地信息的获取更加民主化。这一范式转变为农业、城市规划、灾害管理和政策领域的利益相关者提供了有效的前瞻性规划和风险管理工具。类似内容被他人观看关于利用大型语言模型支持气候行动中的社会研究文章 开放获取 2026年4月24日利用大型语言模型自动核查气候主张文章 开放获取 2025年2月25日利用生成式人工智能减少气候怀疑的承诺与局限性第19条 2025年9月简介气候变化正日益影响全球社会,促使对准确且局部化的气候评估需求日益增长。传统气候信息系统常因数据粒度、可解释性和上下文相关性等限制,难以提供量身定制的洞察。此外,气候变化的广泛影响意味着全球人们面临更多与未来规划相关的气候相关问题——从农业决策到城市基础设施适应。这一需求需要能够在本地和全球层面解决气候相关问题的可扩展解决方案。人工智能的最新进展,尤其是在大型语言模型(LLM)方面,为提升气候服务开辟了新可能。大型语言模型,比如OpenAI等开发的 1,2,3能够理解复杂的语言模式,综合来自不同来源的信息,并生成类人文本。然而,标准大型语言模型在解读专门气候数据时面临重大挑战,主要因其通用设计和缺乏领域特定培训4.近年来,出现了多个基于人工智能的气候信息平台。例如,ChatClimate5基于IPCC第六次评估报告,确保回答最新且科学准确,以及气候问答6利用基于IPCC/IPBES报告知识库的LLM。其他努力包括ClimateGPT7使用基于跨学科文献训练的气候特化大型语言模型,以及ChatNetZero8,一个气候承诺者的检索增强聊天机器人。此外,还有《气候探险者》9虽然不是基于人工智能,但提供了工具和信息,帮助构建气候韧性。这些系统代表了气候信息传递的重要进展,但它们往往依赖特定的文档语料库或狭窄的用例,阻碍了它们大规模提供准确、具上下文感知的气候评估的能力。为应对这些挑战,迫切需要不仅准确、局部化且具备可扩展性的气候信息系统,以应对全球日益增多的气候相关问题。克林视觉10旨在通过利用先进的大型语言模型(LLM)和整合多样数据源(包括非结构化文本和领域特定数据库)来弥合这一差距,确保气候评估全面、具上下文感知且可扩展。ClimSight 将先进的大型语言模型与高分辨率的地理和气候数据集成,提供针对特定用户需求和活动的局部气候洞察。该系统利用检索增强生成(RAG)技术 11,12以及基于代理的架构13,14,15克服通用模型的局限性。通过整合领域特定知识和高分辨率空间数据16,17,18ClimSight 提供准确、可靠且可重复的气候评估,且具有细致度、特定地点的层面。该成熟方法通过若干关键进展区别于现有气候信息系统:大型语言模型的整合:所提方法利用最先进的大型语言模型解读复杂的气候相关查询,综合来自科学报告、IPCC文件和地理数据库等多种数据源的信息。这使得系统能够提供超越传统数值模型的细致、具上下文感知的洞察。多源数据集成:与仅依赖结构化气候数据的传统系统不同,我们的平台整合了来自多个来源的信息,包括非结构化文本、领域特定文献和在线数据库。这种方法确保了针对特定用户需求的全面气候评估。RAG系统:ClimSight通过从外部来源获取相关知识,增强大型语言模型的上下文理解,确保答案基于证据且具上下文准确性。这种方法弥合了静态数据集与动态、上下文感知洞察之间的鸿沟。基于代理架构:通过采用模块化、基于代理的设计,框架确保了可扩展性、灵活性和系统效率的提升。专业 |
| [返回] |