Nature重磅:AI击败最先进全球洪水预警系统,提前7天预测河流洪水,每年挽救数千人生命 nature重大进展 nature重大技术
admin
2024-03-22 17:27:48
0


新智元报道

来源:学术头条

【新智元导读】升级洪水预警系统,每年可以挽救数千人的生命!谷歌最新研究登上Nature。

洪水是最常见的自然灾害类型,全球有近 15 亿人(约占世界人口的 19%)直接面临严重洪水事件的巨大风险。洪水还造成巨大的物质损失,每年造成全球经济损失约 500 亿美元。近年来,人类造成的气候变化进一步增加了一些地区的洪水频率。然而,目前的预报方法主要依赖沿河而建的观测站,其在全球的分布并不均匀,这就导致未经测量的河流更难预报,其负面影响主要体现在发展中国家。升级预警系统,使这些人群能够获得准确、及时的信息,每年可以挽救数千人的生命那么,如何在全球范围内进行可靠的洪水预报?人工智能(AI)模型或许大有可为。如今,来自 Google Research 洪水预测团队的 Grey Nearing 及其同事开发的人工智能模型,通过利用现有的 5680 个测量仪进行训练,可预测未测量流域在 7 天预测期内的日径流随后,他们将该人工智能模型与全球领先的短期和长期洪水预测软件——全球洪水预警系统(GloFAS)进行了对比测试。结果显示,该模型同日预测准确率与当前系统相当甚至更高。此外,该模型在预测重现窗口(return window)期为五年的极端天气事件时,其准确性与 GloFAS 预测重现窗口期为一年的事件时的准确性相当或更高。相关研究论文以「Global prediction of extreme floods in ungauged watersheds」为题,已发表在权威科学期刊 Nature 上。研究团队表示,该模型能对未测流盆地的小规模和极端洪水事件做出预警,且预警期比之前的方法都更长,并可提高发展中地区获得可靠洪水预报的机会

提前7天,AI是如何做到的?

那么,这一人工智能模型如何能给出可靠的洪水预报呢?

据论文描述,该研究使用了一种叫做长短期记忆(LSTM)网络的人工智能模型来进行河流流量的预测。这个模型的设计有点像我们的大脑,它可以从一系列的气象数据中学习并预测未来的河流流量,分为编码器和解码器两部分。


基于 LSTM 的河流预报模型架构。两个 LSTM 依次应用,一个接收历史天气数据,另一个接收预测天气数据。模型输出为每个预报时间步的流量概率分布参数。

首先,编码器负责从上一段时间内的气象数据中提取信息,它从过去的天气情况中理解河流流量的变化情况。它将历史气象数据转化为可供解码器使用的信息形式的作用。通过学习气象数据中的特征和时间模式,模型对过去气象情况形成抽象理解,为后续的流量预测提供了关键性的输入。

编码器则通过接收一系列气象数据(比如降水量、温度、辐射等)作为输入,学习如何提取这些数据中的关键特征信息。这些特征信息可能包括季节性变化、气象事件(如暴雨、高温等)以及它们对河流流量的影响。

同时,编码器能够捕获气象数据之间的时间依赖关系。这意味着它不仅仅考虑当前时刻的气象情况,还考虑了之前一段时间内的气象变化趋势。通过对历史数据的学习,编码器能够理解气象数据的时间序列模式,并将其纳入到模型中。

在编码器中,LSTM 网络被用来处理时间序列数据。LSTM 具有内部记忆单元,可以记住过去的信息,并根据当前的输入来更新内部状态。这使得编码器能够在处理长期依赖关系时表现优异,并在建模过程中保留重要的历史信息。

最终,编码器将历史气象数据转化为一个潜在的表示形式,这个表示形式包含了对过去气象情况的理解和总结。这个表示形式是编码器的输出,并传递给解码器,用于未来流量的预测。

然后,解码器部分使用这些信息来预测未来几天的河流流量。它考虑了当前的气象预报,以及过去的天气对未来流量的影响。这样,就可以得到未来一周的流量预测。


解码器在模型中负责将历史气象信息和未来预测结合起来,生成对未来河流流量的预测,并输出相应的流量概率分布。

解码器首先接收来自编码器的潜在表示形式,这个表示形式包含了历史气象数据的抽象理解。解码器利用这些信息来理解过去的气象条件对河流流量的影响,并建立起历史数据与未来预测之间的联系。

解码器同时接收未来的气象预测数据作为输入。这些预测数据通常包括了未来几天的降水量、温度等气象指标。解码器将历史信息和未来预测结合起来,通过学习它们之间的关系来预测未来的河流流量。

在理解了历史气象条件和未来预测之后,解码器通过一个独立的 LSTM 网络来生成对未来河流流量的预测。这个网络可以理解为一个时间序列的生成器,根据过去的信息和未来的预测来生成流量序列。

解码器不仅仅预测未来的河流流量值,还输出一个概率分布。具体来说,模型使用一个单边拉普拉斯分布来描述流量的不确定性,预测每个时间步的流量值时,输出一个单边拉普拉斯分布的参数,而不是一个确定的值。这使得模型能够考虑到流量预测的不确定性,为决策提供了更多的信息。

最终的流量预测结果是通过集成多个解码器模型的输出得到的。模型使用了三个独立训练的解码器 LSTM 网络,然后将它们的预测结果取中值,从而减少预测的方差并提高预测的稳定性。

真实效果怎么样?

研究人员收集了大量的气象数据和河流流量数据,来训练这一模型。这些数据来自于不同的数据源,包括气象预报、历史记录和地理信息。通过将数据标准化处理,模型得以正确理解它们。

然后,数据分成两种类型:训练集和测试集。训练集用于训练模型,而测试集则用于评估模型的性能。研究人员使用了一种“交叉验证”的方法,以确保模型在不同的时间和地点都能够有效地工作。

最后,研究团队评估了模型的性能,并与现有的流量预测模型进行了比较。

研究团队采用了常见的误差指标来量化模型预测值与实际观测值之间的差异。由于模型预测的不只是未来流量的具体数值,而且还给出了流量预测的不确定性,因此他们使用了概率积分变换(PIT)图来评估预测分布的准确性。

研究团队还通过与其他流量预测模型的对比来评估所提出模型的性能。这包括了传统的物理模型和其他机器学习模型。通过比较不同模型的误差指标,可以直观地展示所提模型在准确性和可靠性上的优势。

另外,研究团队还采用了特定的流域或河流作为案例研究,应用模型于实际情境中,并详细分析模型在不同季节、不同气候条件下的预测性能。这有助于评估模型在实际应用中的可行性和稳定性。

除了量化指标,研究团队也还对模型预测的不确定性进行了深入分析。这包括评估不同来源的不确定性(如输入数据的不确定性、模型结构的不确定性等)对预测结果的影响,以及模型如何在存在不确定性的情况下仍然提供有用的预测。

结果显示,模型展现了较高的精确度和召回率,尤其是对于短期回报周期的事件。这意味着模型能够准确地识别出洪水事件,并且错过的事件较少。

结合精确度和召回率,模型在不同回报周期的事件上获得了较高的 F1 score,表明了其在准确性和全面性之间取得了良好的平衡。


此外,通过双侧 Wilcoxon 符号秩检验,模型的预测结果在统计上显著优于基准模型。这证明了模型在洪水预测方面的有效性。

Cohen's d 指标显示,模型性能改进的效果是显著的,这进一步验证了模型相对于传统方法的优势。

在 Nash–Sutcliffe 效率和 Kling-Gupta 效率等水文指标上,模型同样显示了良好的预测精度和对水文过程变化的敏感性。

不足与展望

然而,该研究也存在一些局限性。

例如,实验采用的样本可能较小,限制了研究结果的普遍适用性和统计功效。研究所用的数据集的多样性存在不足,这可能影响模型的泛化能力。采用的模型复杂度较高,可能导致计算成本增加并限制了其可解释性和便捷性。

另外,研究聚焦于特定任务或领域,可能限制了方法的广泛应用;这个方法缺乏长期影响的评估,使得对模型随时间变化的表现理解不足,评估标准可能无法全面反映模型性能;且对现有技术的改进程度可能相对有限。

对此,研究团队表示,未来的工作需要进一步将洪水预报的覆盖范围扩大到全球更多地点,以及其他类型的洪水相关事件和灾害,包括山洪和城市洪水。人工智能技术也将继续发挥关键作用,帮助推动科学研究,促进气候行动。

参考资料:

https://www.nature.com/articles/s41586-024-07145-1

https://blog.google/technology/ai/google-ai-global-flood-forecasting/

相关内容

热门资讯

想找个中立的人太难:马斯克推特... IT之家 2 月 26 日消息,很少有高管能像埃隆 · 马斯克那样招致如此多的争议,这位特斯拉掌门人...
京东、中兴、大疆等19家企业总... 深圳商报·读创客户端记者曹欣 新春伊始,深圳湾超级总部基地(以下简称 “深超总”)建设全面提速,京东...
压岁钱遇上理财,有儿童专属储蓄... 作者:张昕迎 编辑:周梦梅 编者按:拼车返乡、拼单买年货,今年过年,你“拼”了吗?当Z世代主导春节,...
高盛谈AI交易:“AI基建”的... 当AI资本开支越冲越猛、估值越来越贵时,高盛提醒市场:真正的风险,往往出现在“增速开始放慢”的那一刻...
楼市新信号,二手房业主不愿卖房... 作者:千寻 01 2026开年以来,全国的二手房市场出现了新变化,二手房业主们不愿意继续割肉卖房了。...
原创 券... 券商拉盘指数走强!盘面暗藏背离,老股民直呼心慌 炒股的人都懂,A股最让人琢磨不透的,不是单边下跌,而...
又一家居企业冲击港股上市,20... 群核科技向港交所主板递交上市申请,摩根大通和建银国际担任联席保荐人。 最新数据显示,2025年,公司...
中国铁建重工集团股份有限公司2... 本公司董事会及全体董事保证本公告内容不存在任何虚假记载、误导性陈述或者重大遗漏,并对其内容的真实性、...
原创 松... 时光倒流至上世纪九十年代,那是日本电池工业的辉煌岁月。 1991年,索尼发布了人类历史上第一款商用锂...
自变量机器人一个月内又完成数亿... 投资界2月26日消息,据企查查,自变量机器人(X Square Robot)完成数亿元新一轮融资,本...
原创 2... 内容提要 2026年1月,货币市场日均交易量及余额均增加,主要回购利率走势分化,大型商业银行日均净融...
电池概念股走低,多只电池相关E... 电池概念股走低,阳光电源、宁德时代、亿纬锂能跌超4%。 受盘面影响,多只电池相关ETF跌超2%。 ...
构建“国际化、法治化、市场化”... 在当前全球科技竞争日益激烈的背景下,炒菜机器人行业作为新兴领域正展现出巨大的发展潜力。以东莞市山智智...
环渤海动力煤价格指数685元/... 上证报中国证券网讯(记者 王文嫣)2月25日,秦皇岛煤炭网发布最新一期环渤海动力煤价格指数,本报告期...
STARTRADER:摩根大通... 2月25日,摩根大通发布最新贵金属展望报告,宣布将黄金长期价格预期上调至4500美元/盎司,同时重申...
鼎泰高科晋级10倍股 人民财讯2月25日电,2月25日,鼎泰高科(301377)午后股价大涨,盘中一度涨超15%,收盘涨幅...
恒丰银行股权0.7元无人接盘,... 【文/羽扇观金工作室】 3月7日,一笔挂牌起拍价2660万元,3800万股的恒丰银行股权将在阿里资...
中国将印度告上WTO 文︱陆弃 从瑞士日内瓦那幢灰色会议楼里传出的消息,往往代表着一种秩序在悄然发生断裂。2月24日,世界...