秦皇岛湾人工智能赤潮预警研究
秦皇岛湾人工智能赤潮预警研究
绿潮与赤潮是由海水中某些大型浮游藻类在一定时间内爆发性生长,致使海洋溶解氧浓度降低、遮挡阳光,导致海洋生态环境异常的一种现象。随着环渤海地区经济的迅猛发展和城市化进程的加快,沿海地区污染物排海量不断增加,使得近岸水体无机氮、石油类、活性磷酸盐等污染物质大面积超标,水体富营养化明显加剧,导致海洋赤潮发生频次和规模逐年上升,危害日益严重,赤潮已经成为渤海海域特别是秦皇岛海域的主要海洋生态灾害之一。秦皇岛海域发生的有害藻华主要为两大类型:微型及微微型藻类赤潮。经调查研究表明,在秦皇岛近岸海域,引发赤潮主要有夜光藻、中肋骨条藻、海洋卡盾藻、尖刺拟菱形藻、赤潮异弯藻、塔马亚历山大藻、多纹膝沟藻、螺旋环沟藻、三角角藻、丹麦细柱藻、梭角藻、原甲藻等。
赤潮的形成与周围多种环境因素均有着非常密切的关系,包括气候气象条件、物理化学环境、水动力条件、微量元素等因素,这些因素构成了非线性和不确定性的复杂关系,使得赤潮灾害的预测一直是海洋生态领域的挑战性难题。国内外研究人员从不同角度对赤潮预测问题进行了研究,预测方法大致可分为两大类,一类是较为传统的赤潮预测方法,主要包括经验预测法、统计预测法和动力学模型预测法,另一类是以人工神经网络、机器学习等为代表的人工智能预测方法。
经验预测法是根据赤潮生消过程中环境因子变化规律进行预测有害赤潮发生的方法,主要分为单因子预测和多因子预测。赵冬至根据有效积温法则系统分析了海温年变化与赤潮发生的关系,建立了海水积温预报模型;黄伟建等揭示了可溶性亚硝态氮、温度、溶解氧、叶绿素a和盐度对夜光藻增长呈明显的主效应。基于多元统计方法能够综合分析引发赤潮发生的多个因子,对于赤潮预报显示出较强的能力,如判别分析、主成分分析、逐步回归法等。曹永中等基于多元回归分析方法建立了温州近岸海域具齿原甲藻的密度预测模型;王丹等基于2008-2011年北戴河赤潮监控区调查数据,利用逐步回归统计分析建立了以叶绿素a为因变量的多元线性回归统计模型。王寿松等依据生物种群生态学和营养动力学的原理,建立了大鹏湾夜光藻―硅藻―营养物质三者相关的营养动力学模型,模拟赤潮发生、发展、高潮、维持和消亡的整个过程而对有害赤潮进行预测。冯剑丰基于非线性动力学理论建立渤海湾典型藻类(中肋骨条藻)的生态动力学模型,对渤海赤潮进行预测。
随着人工智能技术的快速发展,相关学者开始探索基于人工智能的赤潮预测方法,目前主要方法包括人工神经网络、支持向量机、遗传算法等。人工智能能够从海量复杂数据中建立非线性学习认识模型,归纳和发现知识,并对系统行为进行预测。国内,马玉梅等采用改进的三层BP神经网络对夜光藻密度和各环境因子建立非线性模型,预测夜光藻密度。李慧等探讨了应用径向基函数(RBF)神经网络进行赤潮预测,相比BP神经网络具有更快的收敛速度和较小的预测误差。
国外,FriedrichRecknagel基于12年的监测数据建立了优势藻类细胞密度与相关环境变量的预测模型。NitinMuttil遗传进化算法优化人工神经网络对香港吐露港的藻类进行建模预测,采用叶绿素a作为模型输入,结果显示模型能很好模拟藻类生物量的长期趋势,但不适合进行短期赤潮预测。
本文在这些研究的基础上,提出了多指标阈值法和基于机器学习的赤潮综合预警模型,并设计实验进行验证。
1、赤潮综合预警模型理论与方法
1.1多指标阈值法
影响赤潮发生的环境因子很多,这些因子的变化与赤潮发生之间往往有一定的规律性,而赤潮的形成一般是由许多环境因子造成的。在对影响赤潮发生的环境因子进行分析时,需根据赤潮生消过程中环境因子的变化规律来预测有害赤潮发生。
因此,现实中普遍采用多指标阈值法进行赤潮预测。多指标阈值法的主要思想为根据赤潮生消过程中环境因子变化规律对可能引发赤潮的多种指标进行综合分析,选择其中对赤潮发生影响较大的指标,并根据数值分布判断各指标阈值,当指标超过阈值时,则可判定赤潮发生。与其他算法相比,基于多指标阈值法的赤潮预警方法更为直观,可通过指标直接进行预警,且可为预警提供科学准确的依据。
本文使用真实案例进行基于多指标阈值法的赤潮预警分析。首先,以2019年4月至7月在秦皇岛浅水湾海域现场监测的5068组气象、水质和营养盐相应指标数据作为分析样本,分析各监测指标的数值情况。已知2019年7月24日,浅水湾海域发生丹麦细柱藻赤潮,分析在此次赤潮发生前后各指标的数值变化规律,筛选出与未发生赤潮时相比变化比较明显的5个指标,即溶解氧、叶绿素a、蓝绿藻、水温和pH。在赤潮发生时,这些指标数值均有明显升高,将这些指标作为赤潮发生判定指标,应用数理统计学的方法,对这几个指标进行分位数描述性统计。
在没有藻类密度数据的情况下,根据多指标数值分布设置阈值以判定赤潮是否发生。这里将75%分位数作为赤潮发生各指标的阈值,当各指标均超过阈值时,判定赤潮发生。
1.2基于机器学习的赤潮综合预警模型
赤潮生长曲线存在显著的5个阶段,即发现、发展、暴发、衰退、消亡,故而赤潮发生不是瞬时的,而是一个过程,赤潮发生的状态或长或短会持续一段时间。
因此,本文将采用机器学习的方法进行赤潮预警。机器学习涉及多门学科,是计算机模仿人类思维和学习过程。在赤潮预警方面,机器学习能够自主地从数据中挖掘特定的规律并将其应用于自身算法的改进,与传统方法相比节省了人力物力。同时,基于机器学习的赤潮预警可处理大量序列数据,探究其内部关联,预测未来一段时间内的监测海域的赤潮发展情况。
本文首先进行数据集的处理。基于2019年6月至8月金梦海湾附近海域赤潮绿潮情况,收集3种藻类(丹麦细柱藻、古老卡盾藻、赤潮异湾藻)的密度检测数据,数据记录是以天为单位的,若该密度超过基准密度则认为发生赤潮:筛选出超过基准密度数据。
由于发生赤潮的数据样本较少且机器学习所需数据量较大,需要扩充正样本。假设每次检测结果可以代表前后2h的赤潮发生状态,则以半小时为单位,选取赤潮发生时在采样时间前后2h的样本作为正样本。根据取数规律,即7月27号前每天下午3:00-4:00左右取样,27号之后每天上午8:30左右取样,故在选取正样本时,将7月27日前下午1:30-5:30的数据作为赤潮发生正样本,7月27日后上午6:30-10:30的数据作为赤潮发生正样本。与此同时,增加未发生赤潮时的数据作为负样本,建立对照组,并收集金梦海湾附近海域的浮标监测数据作为赤潮预测的基础数据。
距离金梦海湾最近海域为浅水湾,因而收集浅水湾浮标监测数据,包括水质数据和气象数据等,其中水质数据包括盐度、电导率、溶解氧、叶绿素a、浊度、蓝绿藻、总溶解性固体、溶解氧饱和度、水温、pH,气象数据包括气温、气压、风速、雨量、最大风速、风向、相对湿度等,共有17项指标。经过数据预处理后形成赤潮数据集,其中正样本83个,负样本285个。
根据相关性分析,海洋综合预警模型考虑的因素有盐度、电导率、溶解氧、叶绿素a、蓝绿藻、水温、气温、气压、风速、降水量等。将数据集分成10份,轮流用其中9份训练,并采用决策树等6个机器学习模型进行训练,共计训练60次,并用平均准确率来评价各模型的性能。
2、结果分析
2.1多指标阈值法结果分析
根据章节1.1中的指标,本文对多指标阈值模型进行验证。基于浅水湾浮标处各指标的阈值,针对各指标预测值筛选超过指标阈值的数据。在2019年7月24日10时赤潮发生判定指标均超过阈值,故而预警丹麦细柱藻赤潮发生,实际值中赤潮发生是在2019年7月24日11时。因此对于本次发生的赤潮事件,多指标阈值模型提前1小时预警。
2.2基于机器学习的赤潮综合预警模型结果分析
基于本文1.2中的描述,本文对基于机器学习赤潮预警模型的重要因素进行分析。首先,特征重要度指的是每个特征基尼指数加少量归一化值,特征重要度可以衡量特征对最终预测结果的重要性,即特征的重要度越大,其对结果的重要性越高。
决策树在构建过程中通过基尼指数进行最优属性选择:(1)电导率通过对样本是否超过赤潮基准密度及电导率是否大于47.205进行统计。当电导率大于47.205时,有65%超过了基准密度;当电导率小于等于47.205时,只有14%超过了基准密度。所以当电导率大于47.205时,更容易发生赤潮。
(2)盐度
通过对样本是否超过赤潮基准密度及盐度是否大于30.405进行统计。当盐度大于30.405时,有100%样本超过了基准密度;当盐度小于等于30.405时,只有17%样本超过了基准密度。所以当盐度大于30.405时,更容易发生赤潮。
(3)气温
通过对样本是否超过赤潮基准密度及气温是否大于25.35进行统计。当气温大于25.35时,有46%样本超过了基准密度;当气温小于等于25.35时,只有10%样本超过了基准密度。所以当气温大于25.35时,更容易发生赤潮。
3、结论
结合秦皇岛浅水湾海域的地域特色和数据情况,本文提出了多指标阈值法和基于机器学习的赤潮综合预警模型两种赤潮风险预警方法,两种方法各有其适用情形。在未知藻类密度时,由于赤潮的形成受许多环境因子影响,这些因子的变化与赤潮发生之间存在一定的规律性,因此多指标阈值法就是根据赤潮生消过程中环境因子的变化规律找出主要影响因子并基于这些因子数值分布设置阈值以预测有害赤潮发生。机器学习是人工智能领域的一个分支,在已知藻类密度或发生赤潮现象时,基于机器学习的赤潮综合预警模型是基于发生赤潮与未发生赤潮数据集建立对照组,从数据中学习并掌握赤潮发生规律,继而对有害赤潮事件作出预测,同时,赤潮数据的数量和质量直接影响该模型的性能。基于已知藻类密度超过基准密度或发生赤潮事件极少的现状,两种方法互为补充。
秦皇岛湾是一个赤潮现象多发的海域,丹麦细柱藻是极易发生赤潮的浮游植物之一,还有其他的有害藻华,其发生时间主要集中在5-9月。秦皇岛近海有害藻华频发的原因除了本文中提到的影响环境因子,还包括水体营养盐,特别是氮、磷营养元素含量的变化,未来这部分数据获取与应用将对赤潮风险预测有很大提升。同时,秦皇岛近海有害藻华的成因比较复杂,随着今后赤潮发生事件的有效记录数据的不断增多,针对各个有害藻华建立相应的预测模型,在很大程度上提高了预警技术的适用性。
摘自《海洋信息技术与应用》2022年1期
原文链接:http://zrzy.hebei.gov.cn/heb/gongk/gkml/kjxx/kjfz/10759769527932579840.html
[免责声明] 本文来源于网络转载,仅供学习交流使用,不构成商业目的。版权归原作者所有,如涉及作品内容、版权和其它问题,请在30日内与本网联系,我们将在第一时间处理。
最新加入
江西天皓房地产有限公...
2020-07-15致上饶市政府陈云市长...
2020-05-13致江西省自然资源厅张...
2020-05-13致沈阳市市纪委书记、...
2024-01-12致上饶市委马承祖书记...
2020-05-13土地性质:一定要辨别...
2020-04-28圈地千亩国际健康峰会...
2020-04-23农村土地新政策,抛荒...
2020-04-24黑土地“金豆子”鼓了...
2020-04-28
热门资讯
江西天皓房地产有限公...
2020-07-15致上饶市政府陈云市长...
2020-05-13致江西省自然资源厅张...
2020-05-13致沈阳市市纪委书记、...
2024-01-12致上饶市委马承祖书记...
2020-05-13土地性质:一定要辨别...
2020-04-28圈地千亩国际健康峰会...
2020-04-23农村土地新政策,抛荒...
2020-04-24黑土地“金豆子”鼓了...
2020-04-28致鄂尔多斯市东胜区政...
2021-06-23