深度学习融合遥感大数据的陆地水文数据同化:进展与关键科学问题
深度学习融合遥感大数据的陆地水文数据同化:
进展与关键科学问题
1引言
地球系统科学是以地球系统为研究对象,综合研究地球系统的各圈层、各要素以及自然和人为现象之间相互作用关系的科学。陆地水循环过程是地球系统主要循环过程之一,是联系陆地表层各个系统的关键纽带,准确认识陆地水循环的变化过程及其效应,是未来水资源合理开发利用与科学管理的关键所在。随着各类地球系统模型的建立与完善,地球观测系统日趋成熟,系统、综合和集成成为地球系统陆地水循环过程研究的热点。地球系统科学的进步有赖于模型和观测的协同发展,地学领域研究者已经模拟和描述了地球系统的主要循环过程(水循环、能量循环和生物化学循环等),但如何将模型和地球观测系统各组分结合起来,提高模拟精度,仍然是地球系统科学研究的主题。随着大数据技术的高速发展,计算机硬件和计算能力大幅度增强,深度学习等人工智能技术被广泛应用于地球科学领域,打破了传统算法的多重约束,为地球系统科学研究提供了新的途径。
1.1大数据是地球科学发现与知识创新的引擎
大数据时代的到来以及数据密集型科学发现范式的确立,为现代科学提供了全新的科研方法论。Nature和Science杂志分别于2008年和2011年出版了BigData和DealingwithData专刊,从互联网技术、超级计算和环境科学等多个方面介绍了海量数据所带来的技术挑战,指出大数据时代已到来。随着对地观测技术的发展,人类对地球的综合观测能力达到了空前水平,各种地球系统模型也正在源源不断地生成大量地球模拟数据,地球系统科学进入了大数据时代。面对地球科学领域的不同应用场景,科学大数据、遥感大数据和地球大数据等概念相继被提出。如何从这些大数据中提取并解读信息,实现数据到知识的转化,打破“大数据,小知识”的悖论,突破预测能力没有随着数据可用性的提高而增强的瓶颈,不仅是目前国际遥感科学技术的前沿领域之一,也是地球系统科学如今面临的最大挑战。
1.2深度学习是地球系统科学数据挖掘与知识发现的重要工具
基于数据驱动的机器学习方法被广泛用于从不断增长的数据流中提取模式和知识。大数据背景下,可利用的各种地面和遥感观测以及模型模拟数据越来越丰富,为机器学习获得覆盖整个任务物理域的输入样本提供了更大的机会。然而,传统浅层结构机器学习方法需要依靠领域特定经验知识人工设计特征,其对复杂地学过程的表示和泛化能力有限。深度学习是具有深层非线性网络结构的机器学习方法,其通过在模型中添加更多的“深度”(复杂性)以及利用分层表示来实现对复杂数据从低级到高级的自动特征抽象,非常有利于大数据知识挖掘--叫。近年来,越来越多的研究表明深度学习具有解决地球科学问题的巨大潜力,深度学习在模式识别和聚类、时间序列和时空预测、模型模拟器或替代模型、时间变化的边界或驱动条件的参数化、可解释性和知识发现、加速反演、创建高分辨率的全球数据集、不确定性量化、物理导引的神经网络以及寻找和求解控制方程等方面均已显示出其优势。
1.3深度学习与数据同化的深度融合将是地球系统科学研究的重要方向
数据同化(DataAssimilation,DA)是地球系统科学中模型和观测融合的重要方法论,其核心思想是在模型的动力框架内融合不同来源和不同分辨率的直接与间接观测,从而增强系统的可预报性和可观测性。尽管起源和应用不同,数据同化和深度学习都能够从观测中了解地球系统,二者都可以看成是反演观测模型的方法。数据同化是在给定模型参数(w)条件下,根据观测值(y)推断预报模型的物理状态(x);而深度学习则是给定一组特征(x)条件下,根据观测值(y)推断预报模型的权重(w)。由于反演问题都可以利用贝叶斯定理解决,从贝叶斯理论的视角来看,数据同化和深度学习具有等价性。数据同化与深度学习可以互相结合和补充。一方面,数据同化推断的模型状态可能为深度学习的输入特征提供“先验”信息(例如x的未观测部分);另一方面,机器学习可以代替传统经验方法用于估计模型参数w。面对滚滚而来的地球大数据,不仅需要深入研究基于深度学习的地球大数据融合和分析方法,也需要发展适应于地球大数据的数据同化新方法和系统集成新技术,而深度学习与数据同化的深度融合必将为解决地球系统复杂问题提供新的途径。2020年2月美国国家海洋和大气管理局(NationalOceanicandAtmosphericAdministration,NOAA)发布了人工智能战略,旨在利用机器学习技术对地球观测资料进行有效处理、解析和利用,为社会提供更高质量、更及时的科学产品和服务。欧洲中尺度天气预报中心(EuropeanCentreforMediumRangWeatherForecasts,ECMWF)在2021年2月发布了其未来10年(2021-2031年)路线图,旨在未来几年中能够充分利用机器学习适应、受益或替代数值模型中现有的核心技术,以改善数值天气预报和气候服务。
2主要研究进展
在水文数据同化框架下,准确地模拟和预报陆地水循环过程,需要从改善观测数据的质量、减少物理过程模型的不确定性以及遥感大数据与水文数据同化系统的有效集成3个方面人手,机器学习/深度学习在这3个方面均可以提供较好的解决方案。在改善观测数据质量方面,深度学习融合遥感大数据的陆地水循环要素信息提取方法已经蓬勃发展;在模型改进方面,机器学习/深度学习在优化模型的参数、替代子过程和系统偏差校正方面均已有所突破;在系统集成方面,特别是遥感大数据背景下,如何构建深度学习融合遥感大数据的陆地水文数据同化系统还是地球系统科学中鲜有涉猎的主题。因此,本文仅综述近年来机器学习/深度学习在改善陆地水循环要素观测数据的质量以及机器学习/深度学习如何改进陆面/水文过程模型方面的进展。
2.1基于机器学习/深度学习的陆地水循环要素估算
传统浅层结构的机器学习方法,如人工神经网络(ArtificialNeuralNetwork,ANN)、支持向量回归(SupportVectorRegression,SVR)、多元自适应回归样条(MultivariateAdaptiveRegressionSplines.MARS)、随机森林(RandomForest,RF)、高斯过程回归(GaussianProcessRegression,GPR)和小波变化(WaveletTransforms,WT)等方法,均已广泛地应用于点、区域和全球尺度上的土壤湿度、蒸散发、雪深/雪水当量、积雪覆盖度、降水、径流以及地下水位等陆地水循环要素的估算:基于机器学习的多源数据融合和空间升、降尺度研究也受到了国内外学者的广泛关注,ANN、SVR和RF等机器学习方法在降水、土壤湿度、径流、蒸散发等的降尺度和缺失信息重建。以及点到网格的升尺度研究中也体现出了良好的性能。已有研究结果表明,基于数据驱动的机器学习方法在地表参数估算、降尺度以及缺失信息重建中展示出了巨大的潜力,其比传统的经验、半经验统计建模方法更加强大和灵活。
遥感大数据环境下,不同成像方式、不同波段和时空分辨率的对地观测数据以及各种模型模拟数据显著增加,这些数据具有强烈的时空异质性以及噪声和缺失数据引起的数据质量差、不确定性水平各异等特征。同时,陆地水循环要素的时空相关性和相互依赖性,也违反了统计学独立同分布的重要假设。此外,由于陆地水循环要素的诸多变量(如地下水位)存在非平稳变化、稀疏观测或无法直接观测等情况,这些因素限制了人工提取特征的表示能力,使得传统浅层机器学习方法在陆地水循环要素的提取中存在一定的局限性,往往在有限的训练集上构建的被认为是高质量的模型,对超出观测条件的情况和数据(外推能力)有很大的偏差=先进的深度学习技术,具有良好的模式自动提取、信息检索、分类和预测能力,更适合“大数据水文”。近年来,深度学习快速成为了陆地水循环要素提取的主要方法,深度神经网络(DeepNeuralNetwork,DNN)、卷积神经网络(ConvolutionalNeuralNetwork,CNN)、循环神经网络(RecurrentNeuralNetwork.RNN)、长短期记忆网络(LongShort-TermMemory,LSTM)、门控循环单元(GatedRecurrentUnit,GRU)、自动编码器(Autoencoder,AE)、深度置信网络(DeepBeliefNetwork,DBN)以及生成对抗网络(GenerativeAdversarialNetworks,GAN)等不同的神经网络构架都已应用于陆地水循环要素提取研究。如Tao等2018年首次研究了深度学习技术(去噪自动编码器)在降水估算中的应用;随后,CNN、LSTM和GAN均被证实能更好地对复杂降水进行非线性建模,深度学习为大范围乃至全球尺度高时空分辨率的均匀降水估计带来了前所未有的机遇。擅长时间序列建模的RNN及其改进结构(如LSTM、GRU)是径流预报的主流深度学习方法,这些方法能利用气象观测信息实现径流预报的增强,并在无资料区比传统物理模型的预测能力更好。深度学习估算土壤湿度也是一个研究热点,LSTM和CNN都被用于表层或根区土壤湿度的建模或土壤湿度产品缺失信息重建。CNN、LSTM和DBN还被用于积雪的自动检测和云雪区分、遥感积雪覆盖率产品缺失信息重建以及雪深估计。DNN、CNN和LSTM在蒸散发估算中也有一定的应用,Chen等的研究表明这些深度学习方法在外推区域比基于温度、辐射或湿度的经验模型有更好的表现。Wang等的研究表明LSTM可以利用少数关键类型的观测数据模拟实际的蒸散发,与传统的物理方法相比,模型可更灵活地模拟青藏高原等观测数据不足地区的实际蒸散发;Dong等在不同时间尺度上(包括瞬时、日和年)构建了基于CNN、MARS和极限学习机(ExtremeLearningMachine.ELM)的蒸散发估算模型,发现尽管CNN的准确性和稳定性最佳,但在日和年尺度上,精度劣于传统浅层机器学习模型。此外,也有研究证实使用优化算法和/或多种深度学习方法的混合可以进一步提高深度学习陆地水循环要素估算的质量,如用卷积操作代替LSTM模型中全连接层的ConvLSTM网络,能够捕捉大规模序列数据集的时空模式,在降水和土壤湿度的时空序列预测上比LSTM有明显的优势;引入注意力机制的LSTM模型能更快、更准确地模拟土壤温湿廓线;基于混合模型(如CNN-GRU、AE-LSTM以及CNN-LSTM)的降水和土壤湿度估算中,利用CNN提取输入信息的空间特征,LSTM/GRU捕获输入信息的时间依赖性,AE引入中间时间序列数据,能更好地模拟降水和土壤湿度的时空动态演变特征,比单独的深度学习模型有更高的精度。总之,深度学习技术在陆地水循环要素提取中具有明显的优势,可以更好地表示陆地水循环变量与各种气象—地理因素之间的非线性关系。随着大样本水文相关数据集的增加,各种基于深度学习构架的陆地水循环要素估算模型通常体现出更高的精度和计算效率以及更好的鲁棒性和可靠性,同时还可以进一步解决一些尺度问题。因此,推进先进的深度学习新技术在陆地水循环要素估算研究中的深入应用,充分利用不同成像方式、不同波段和时空分辨率的遥感数据以及各种定点观测和模型模拟数据等多源大数据,挖掘有效的时空结构信息估算陆地水循环变量的动态演化过程,是地球系统科学最有前途也最具挑战性的方法:由于机器学习/深度学习是一种黑箱方法,缺乏实际系统结构及其参数的物理意义,存在过拟合以及难以再现和解释的结果,会出现物理不一致性、泛化能力或推广性差等问题,通常还面临缺少标记样本和计算需求等方面的困境。因此,基于机器学习/深度学习的陆地水循环要素估算中,需要考虑机器学习/深度学习模型的物理一致性、可信度和可解释能力,构建物理感知的机器学习模型。
2.2机器学习/深度学习改进陆面,水文过程模型
水文系统和其他自然系统一样,本质上是异质的。由于水与自然环境之间复杂、非均匀、非平稳和非线性的相互作用,陆面/水文过程模型的边界条件、模型参数和物理过程等均存在巨大的不确定性。面向过程的陆面/水文模型的一个共同特征是它们要求的参数值很难通过观测获得,或几乎不受观测的约束。水文模型的参数通常通过逆向建模进行拟合,由于参数的拟合过程一般在高维空间中进行,参数“等价性”和“过参数化”是水文过程模型面临的严峻挑战之一。基于数据驱动的机器学习方法,无须关于各种误差源的大量先验知识,能够从历史数据中深入挖掘陆表变量的时空异质性特征,学习模型中各种误差和相关变量之间的复杂关系,为陆面/水文过程模型不确定性的量化提供了有吸引力的解决方案。目前,ANN、SVR、RF、MARS、GPR、DNN、LSTM和RNN等机器学习/深度学习方法已用于水文过程模型中的参数优化和不确定性量化。如Mo等利用深度卷积编解码网络量化动态多相流问题的不确定性,提升了地下水模型的预测精度和效率。Sawada结合微波亮温数据和马尔可夫链蒙特卡尔(MarkovChainMonteCarlo.MCMC)算法,使用代理建模技术加速了陆面过程模型中土地湿度和植被含水量相关的4个参数的优化和不确定性评估=此外,机器学习/深度学习在水文模型的边界条件建模、模型结构不确定性量化、模型误差估计和系统偏差校正以及代替整个物理模型方面也有突出的表现。总之,机器学习/深度学习辅助的陆面/水文过程模型模拟,试图结合面向过程和面向数据的建模方法的优点,利用面向过程的建模保持能量和水量平衡,而数据驱动的方法以一种简单的方式降低模型不确定性,以产生改进的水循环要素预测。
3关键科学问题
深度学习和陆地水文数据同化的集成研究还处于起步阶段,需要深入探索如何利用更先进的深度学习技术,从地球大数据中最大限度地学习知识,同时还考虑到物理过程约束,既解决物理模型无法有效利用数据来推断模型中未知的参数或过程,又解决深度学习方法的可解释性、物理一致性和不确定性结构等难题,将深度学习与陆面/水文过程模型更好地集成,必将为进一步理解复杂的陆地水循环过程做出重要贡献。
3.1深度学习反演遥感产品时,如何增强样本的时空代表性?
深度学习模型高度依赖于具有多样性、无偏采样且良好时空代表性的大量有标注的样本,而在陆地水循环要素遥感反演中,由于观测受限和标记困难等原因,导致样本数据的数量和质量均可能不足,出现小样本或样本代表性不够的窘境。此外,陆地水循环要素受地形起伏、地表覆盖、气候条件、季节变迁和人类活动等因素的共同作用,在时间和空间上呈现复杂的非平稳、互相关、自相关以及伪相关等特征。标记样本的缺乏、非平稳性、相关性、同物异谱/异物同谱以及极端事件(如暴雨、暴雪、干旱等)等综合效应,使得深度学习方法反演陆地水循环要素时容易出现过拟合和外推能力差的现象。增强样本的时空代表性,利用好深度学习方法强大的知识表示能力,快速地从少量且/或代表性不足的样本中学习到有用的知识,是提高深度学习方法反演陆地水循环要素精度的关键。
增强样本时空代表性最直接的方法是通过数据增强对原有的数据集进行数据扩充或特征增强。数据扩充通常使用转换操作和模型模拟等来生成一些样本,而不需要实际收集新数据。特征增强将原始数据进行表征学习,得到一个泛化性好的特征提取器。事实上,新兴的自监督学习和图神经网络等方法以及各种正则化技术,均可归于特征增强的范畴。目前,数据增强方法在场景分类、目标检测和语义分割等许多遥感解译任务中已得到广泛应用,但在遥感产品反演中还鲜有涉猎。数据增强方法的缺点是可能会引入许多噪声数据或特征,且特征增强对先验知识的依赖较强。数据增强通常能够缩减泛化误差上界,使经验风险更好地逼近预期风险,但当经验风险可以作为预期风险的良好近似值时,就需要考虑如何通过学习策略来进一步优化模型。常用的学习策略有迁移学习、度量学习和元学习。迁移学习在地表参数的遥感反演中已得到初步应用,Li等将跨源迁移学习应用于土壤湿度的预测,在源域(即ERA5-Land数据)上对深度学习模型(包括CNN,LSTM和ConvLSTM)进行预训练,并在目标域(SMAP数据)上对深度学习模型进行微调,利用有限的SMAP样本实现了中国区域土壤湿度的良好预测。需要注意的是,迁移学习需要目标域与源域相近,否则可能导致负迁移。度量学习极度依赖表征模型的性能,高效的表征学习是巨大挑战,元学习的复杂度较高,当前性能还不够理想,这二者在陆地水循环要素估算研究中还未有应用。
3.2如何发展数据同化框架下物理导引的深度学习新方法?
利用陆面过程模型中蕴含的地学规律和模式、物理不变性和物理关系等知识约束深度学习过程,构建物理导引的深度学习模型,将学习算法引导优化到合理的物理解空间,获得物理一致的陆地水循环要素估计值,是深度学习估算陆地水循环要素的前沿挑战。归纳起来,将物理知识嵌入到深度学习模型中的方式主要有以下3种(这3种途径可以有效组合):
(1)在训练样本中引入物理约束。引入包含潜在物理规律的新样本/特征变量(可以看作是一种弱约束)或者利用物理规律对原始训练样本进行物理一致性/限制性约束,如将物理模型的输出作为深度学习的新训练样本或新的特征变量。如Konapala等使用基于物理的水文模型模拟输出与气象数据一起作为LSTM网络的另一组输入,通过提供过程支持的径流模拟来满足LSTM模型对数据的渴求,提高了径流估计精度。Xu等将物理模型模拟的融雪和降雨作为深度学习模型的输入,在积雪覆盖主导的喀斯特山区流域获得了物理一致,且高精度的径流估计。然而,在训练样本中引入物理约束,最大的困难是潜在的物理规律通常并不容易被直接发现。
(2)设计全新的深度学习网络架构。在深度学习模型结构中引入物理约束,让物理知识指导学习模型的节点连接,这些节点连接潜藏变量之间的物理依赖关系,保证深度学习模型预测潜藏的物理定律。如Jiang等的研究表明在深度神经网络的一些层中和激活函数中嵌入地球系统动力的物理感知约束,在显著提高径流预测精度的同时还具有很好的鲁棒性、泛化以及推断未观测过程的能力。深度学习模型结构中引人物理约束的方式,原理上简单,也是让深度学习模型具有物理信息的最基本的方式,但局限于引入相对简单的先验约束,深度学习模型的可扩展性差。
(3)在深度学习算法中引入物理约束。各种时空相关性、分异性和变化趋势等地理规律,可以通过损失函数的惩罚项引入到深度学习模型中,以调整深度学习模型的训练轨迹,使模型明确地向遵循基本物理规律的解收敛,以产生近似满足给定物理约束(如质量守恒、动量守恒和单调性等)的预测。如Read等和Jia等在湖泊温度剖面模拟中,利用热能通量和湖泊热能约束RNN模型的损失函数,生成了符合物理规律的湖泊温度估计;Lu等在LSTM模型的损失函数中引入了水文物理过程约束,构建了基于物理信息的LSTM模型模拟径流残差;Chen等和Zhao等研究证实地表能量平衡约束下的深度学习模型模拟的蒸散发估计,与物理规律和实地观测的一致性更好;Xie等将包含极端事件(即强降雨和干旱)和单调关系的合成样本作为LSTM的额外输入,并进一步将物理模型引入损失函数,构建了物理导引的降雨径流估计模型。基于机器学习/深度学习的地下水动态建模中,数据不匹配、物理控制方程(如Darcy或Richards方程)以及先验知识等物理约束被引入到ANN、DNN以及GAN生成器的损失函数中,以模拟具有异构模型参数(如水力传导率)的地下水流动,结果表明物理约束增加了稀疏观测条件下机器学习/深度学习地下水建模的准确性,比单纯的数据驱动模型有更好的可预测性、可靠性和泛化性。需要注意的是,当在损失函数中引入物理约束时,如果物理模型本身存在系统性偏差,则深度学习模型可能也会蕴含一定程度的偏差。
数据同化自然适用于模型驱动的环境,机理模型和观测数据的融合遵循着物理知识约束。数据同化框架下,物理导引的机器学习/深度学习模型需要适应数据同化的工作流,在对动力学过程模型进行数据驱动表示的基础上,学习数据同化过程的过去经验,以产生来自模型状态的“合成观测”,并融人数据同化框架中。通过“数据同化一机器学习/深度学习”的交替运行、相辅相成,既可以修正过程模
型的状态,又可以修正机器学习/深度学习模型的权重,增加预测的可靠性:
3.3如何通过“数据一模型”双驱动提升陆地水循环的可预报性?
陆地水循环过程与大气循环和生物化学循环等其他物理过程不同,水循环过程在极其不同的时空尺度上起作用,而面向过程的水循环建模假设跨越所有尺度的同一组过程,显然陆面/水文物理过程模型隐含着固有的局限性。同时,陆表过程的复杂性、多样性以及影响陆表过程的边界条件和参数、水循环变量自身在空间和时间上的高度异质性,也进一步加剧了陆面/水文过程模型的不确定性。数据同化是估计、控制和减小陆面/水文过程模型的不确定性,提高预报水平的传统方式。在实际应用中,水文数据同化还存在诸多困难,特别是陆面/水文过程模型的复杂性导致同化过程中的矩阵变得非常庞大,计算成本很高,以至于处理难度大;此外,陆表观测数据的不确定性和噪声,会造成水文数据同化系统中严重的误差传播。机器学习/深度学习具有逼近非线性系统和从高维复杂数据中提取有意义特征的能力,为构建水文数据同化系统中一些物理过程的数据驱动降维模型以及各种来源不确定的量化提供了前所未有的机遇。目前,陆面/水文数据同化系统和机器学习的集成,以“数据一模型”双驱动方式提升陆地水循环的研究已逐步展开,基于数据驱动的机器学习/深度学习技术可以从陆面/水文过程模型参数优化、模型的模块/子模块代理、模型系统偏差校正、观测算子代理、观测误差估计以及数据同化方法替代6个方面与陆面/水文数据同化系统深度耦合,以提升陆地水循环过程的预报水平。
(1)模型参数优化,利用数据驱动方法对水文过程模型的参数进行全局优化和不确定性评估,以缓解水文过程模型参数“等价性”和“过参数化”两大问题。Vrugt等提出的融合全局参数优化和数据同化(SynchronousOptimizationandDataAssimilation,SODA)的混合框架,改进了水文建模过程中的不确定性处理方法。Tian等在同化微波亮温估算土壤湿度研究中提出的双通道变分数据同化框架,利用一种全局优化算法(即洗牌复形算法SCE-UA)估计模型参数,有效提高了土壤湿度预测精度。He等在地下水同化研究中,使用DNN估计物理系统的未知参数(如水力导电性)和状态(如水头和浓度),通过最小化由水文控制方程残差和观测数据误差组成的损失函数,构建了物理过程引导的DNN,用于从稀疏观测中联合反演空间相关的水力参数和水文模型状态。
(2)陆面/水文过程模型的模块/子模块代理,即在不改变过程模型物理机制的基础上,用数据驱动模型代替缺乏理论基础、不确定性大或难以数值求解的过程。如Wang等直接使用高斯过程回归代替整个水文过程模型,并使用集合卡尔曼滤波方法实时更新观测,构建了不依赖于物理模型和先验知识的水文数据同化系统;在地下水运动预测系统中,使用ConvLSTM网络捕捉与动态地下水运动系统相关的时空信息,构建基于深度学习的地下潜流模型代理模型,提高了地下水动态预报的计算效率和精度。
(3)模型系统偏差校正,即综合考虑同化系统中模型结构、参数和边界条件产生的不确定性,如Zhang等在土壤湿度数据同化中,利用高斯过程回归估计模型结构误差,形成一种处理多源模型误差的混合方法,结果表明参数补偿问题明显减少,土壤湿度反演精度有显著改善;King等利用RF回归模型对积雪数据同化系统(SNOwDataAssimilationSystem,SNODAS)估计的雪水当量进行系统偏差校正。
(4)观测误差估计,以往研究中观测误差因难以量化而通常根据经验定义为时间上不变、空间上均匀的全局常量。数据驱动技术可以利用同化过程中模型状态的分析值与观测之间的差异以及模型状态分析值与预报值之间的残差信息,得到随同化系统演进而时空上动态变化的观测误差估计。
(5)观测算子代理,主要是为了解决同化过程中基于物理的观测正演模型不确定性大、计算复杂度较高的问题以及基于经验统计关系的观测正演模型精度低的问题,如Kwon等和Xue等在积雪辐射数据同化研究中,发展了基于ANN和SVR的微波辐射传输模型代理模型。
(6)数据同化方法替代,主要是可以帮助同化系统解决在没有观测的时间步上同化方法无法减少预报误差的问题,如Boucher等在一个简单的降雨—径流模型中,利用ELM代替数据同化方法,根据可用的水文气象观测数据更新径流估计。
在实际应用中,以上6个方面还可以有效组合,例如Hou等在积雪面积数据同化研究中,发展了多种基于数据驱动的“雪深—积雪面积”衰减曲线模型代替传统的经验统计关系,作为同化的观测算子和陆面过程模型中积雪面积参数化方案的替代,有效降低了积雪面积同化系统中观测算子和模型结构的不确定性。Tian等在微波亮温同化估算地表土壤湿度的研究中,提出了一种双循环同化算法,在外循环中,利用数据驱动的方法更新陆面模型和观测算子的参数及其误差,在内循环中,利用外循环提供的参数和误差,执行微波亮温的同化。
总之,在陆面数据同化框架下,物理模型和机器学习/深度学习的耦合可以提高水文数据同化系统的预报性能,有效降低同化系统的不确定性。但现有的应用还处于初步实验探索阶段,同化过程中构建的数据驱动模型也几乎未考虑物理规律的约束,且仅限于站点尺度或特定区域的示范性研究,还远未企及大尺度业务化应用的水平。现有机器学习/深度学习与陆面数据同化耦合的研究,大部分是利用观测信息和同化过程中物理模型状态的历史信息,构建“离线”形式的陆面/水文过程模型参数优化或不确定性估计的数据驱动模型,这些数据驱动模型没有考虑模型参数的时空依赖性,也没有考虑模型子过程随时间的演变,故并不能算是真正意义上的“数据一模型”双驱动。
4结语
数据密集型科学已成为大数据时代的新科学范式,以深度学习为核心的人工智能算法在各个领域得到了深入应用,为地球系统科学研究提供了新的机遇与挑战。本文以陆地水循环为切入点,梳理了深度学习融合遥感大数据的陆地水文数据同化研究的前沿进展和关键科学问题。我们目前正在承担的国家自然科学基金重点项目“深度学习融合遥感大数据的陆地水文数据同化理论、方法与集成技术”,将围绕本文提出的3个关键科学问题,组织多学科交叉研究团队,从观测、模型和系统集成3个方面探索遥感大数据、深度学习和陆面/水文模型的同化、融合、分析方法与集成技术,发展“数据一模型”双驱动的陆地水文数据同化新理论、新技术和新方法,提升陆地水循环过程的模拟与预报能力。
摘自:《地球科学进展》2023年第5期
原文链接:http://zrzy.hebei.gov.cn/heb/gongk/gkml/kjxx/kjfz/10879083887665364992.html
[免责声明] 本文来源于网络转载,仅供学习交流使用,不构成商业目的。版权归原作者所有,如涉及作品内容、版权和其它问题,请在30日内与本网联系,我们将在第一时间处理。
最新加入
江西天皓房地产有限公...
2020-07-15致上饶市政府陈云市长...
2020-05-13致江西省自然资源厅张...
2020-05-13致沈阳市市纪委书记、...
2024-01-12致上饶市委马承祖书记...
2020-05-13土地性质:一定要辨别...
2020-04-28圈地千亩国际健康峰会...
2020-04-23农村土地新政策,抛荒...
2020-04-24黑土地“金豆子”鼓了...
2020-04-28
热门资讯
江西天皓房地产有限公...
2020-07-15致上饶市政府陈云市长...
2020-05-13致江西省自然资源厅张...
2020-05-13致沈阳市市纪委书记、...
2024-01-12致上饶市委马承祖书记...
2020-05-13土地性质:一定要辨别...
2020-04-28圈地千亩国际健康峰会...
2020-04-23农村土地新政策,抛荒...
2020-04-24黑土地“金豆子”鼓了...
2020-04-28致鄂尔多斯市东胜区政...
2021-06-23