一种基于SHAP解释的混凝投药量优化方法和装置

本发明属于水处理,具体涉及一种基于shap解释的混凝投药量优化方法和装置。
背景技术:
1、在水处理过程中,混凝剂投加量的精确控制对于确保水质达标和优化经济效益至关重要。传统的投药量控制方法,如比例积分微分控制(pid控制)和模糊控制,依赖于固定规则和经验判断,难以适应水质的实时变化,特别是在面对复杂和动态变化的水质环境时,控制精度有限,导致混凝效果不稳定。
2、随着数据驱动技术的发展,机器学习模型逐渐被应用于水处理技术领域。通过建模历史水质数据,研究者们开发了基于人工智能(ai)的模型来预测合适的混凝剂投加量。例如使用人工神经网络(ann)、自适应模糊推理系统(anfis)等技术,这些技术中的模型可以处理非线性和复杂的水质变化。例如,研究表明ann模型可以有效预测投药量,并在各种水质条件下取得较好的结果。
3、然而,尽管这些机器学习模型在处理非线性问题上表现优异,它们在捕捉水质监测点之间的空间依赖性和时间动态变化方面仍有局限。对于多监测点网络结构下的水质监控,机器学习模型往往难以准确捕捉监测点间的相互影响,影响了投药量预测的精度。此外,传统的机器学习模型也存在黑箱性问题,难以解释模型的决策过程,降低了其透明度和应用中的信任度。
4、为了克服这些挑战,图卷积网络(gcn)和时间卷积网络(tcn)技术被逐渐应用于水处理领域。gcn能够通过图结构建模监测点之间的空间关系,tcn则可以捕捉水质的时间动态变化,从而有效提取时空水质特征。然而,目前基于gcn与tcn技术的投药量优化研究较少,仍需开发出更加有效的策略来实现自动化投药优化。
5、同时,水处理过程中的投药量优化不仅仅是一个预测问题,还涉及到在净化效果与药剂使用量之间进行平衡。传统的单一目标优化方法通常仅关注净化效果,忽视了药剂使用成本和潜在的二次污染问题。现有研究建议通过多目标优化框架,在保证水质达标的同时,减少化学药剂的使用,平衡经济效益和环境影响。
技术实现思路
1、鉴于上述,本发明的目的是提供一种基于shap解释的混凝投药量优化方法和装置,以解决现有技术在水处理过程中的投药量预测精度低、模型可解释性差以及缺乏多目标优化的局限性。
2、为实现上述发明目的,实施例提供的一种基于shap解释的混凝投药量优化方法,包括以下步骤:
3、获取水厂中不同监测点的水质指标数据并进行预处理后构建所有监测点的图结构序列;
4、构建混凝投药量预测模型,其包括时空水质特征提取模块、逻辑回归预测模块、以及shap,其中,时空水质特征提取模块用于从图结构序列中提取图结构序列的时空水质特征,逻辑回归预测模块用于基于时空水质特征预测混凝投药量,shap用于解释时空水质特征对预测混凝投药量的贡献度;
5、基于水质指标数据构建投药量目标函数以及净化效果目标函数,并基于这两个目标函数构建两目标优化问题,并对两目标优化问题求解得到达到给定净化程度的最小混凝投药量,以模型预测的混凝投药量与求解的最小混凝投药量之差来构建损失函数,利用损失函数对混凝投药量预测模型进行参数优化;
6、利用参数优化的混凝投药量预测模型进行实时投药量预测,并通过shap解释时空水质特征中对预测药量做出贡献的监测点,该监测点用于指导实际混凝投药量投放。
7、优选地,对不同监测点的水质指标数据进行预处理,包括:水质指标数据的异常值剔除和缺失值补充处理、水质指标数据的平滑处理、以及不同水质指标数据的标准化处理。
8、优选地,构建所有监测点的图结构序列,包括:
9、以每个检测点作为节点,并以监测点的水值指标数据作为节点属性来构建节点特征,在节点之间构建连边,并为连边赋予连边权重来构建邻接矩阵,其中连边权重的确定方式为:监测点之间距离短则赋予高连边权重,监测点之间采用管道连接则赋予高连边权重,水流速度快则赋予高连边权重。
10、优选地,所述时空水质特征提取模块包括由多个时空卷积块组成的st-gcn,每个时空卷积块用于提取时空水质特征,具体包括提取检测点空间特征的空间卷积层和基于监测点空间特征提取时间点特征的门序列卷积层,同时在每个时空卷积块的空间卷积层中引入空间注意力机制来关注监测点空间特征,在每个门序列卷积层中引入时间注意力机制来关注时间点特征。
11、优选地,逻辑回归预测模块采用xgboost模型,利用xgboost模型基于提取的时空水质特征进行逻辑回归预测混凝投药量。
12、优选地,投药量目标函数表示为:,其中,表示投药量目标函数,表示时刻t的混凝投药量;
13、净化效果目标函数表示为:,其中, n表示参与优化的水质指标数量,表示第i个水质指标达到合格水质标准的目标值,表示基于时刻t的混凝投药量计算得到的第 i个水质指标的实际值,表示每个水质指标的权重,反映不同水质指标对净化效果的相对重要性;
14、基于两个目标函数构建两目标优化问题,表示为:,和分别表示投药量和净化效果的权重,对两目标优化问题求解时,寻找既能最小化投药量,又能保证水质净化效果的最优解,得到的最小化投药量即为达到给定净化效果的最小混凝投药量。
15、优选地,采用pareto前沿法对两目标优化问题求解,得到达到给定净化程度的最小混凝投药量。
16、为实现上述发明目的,本发明实施例还提供了一种基于shap解释的混凝投药量优化装置,包括:
17、数据处理单元,其用于获取水厂中不同监测点的水质指标数据并进行预处理后构建所有监测点的图结构序列;
18、模型构建单元,其用于构建混凝投药量预测模型,其包括时空水质特征提取模块、逻辑回归预测模块、以及shap,其中,时空水质特征提取模块用于从图结构序列中提取图结构序列的时空水质特征,逻辑回归预测模块用于基于时空水质特征预测混凝投药量,shap用于解释时空水质特征对预测药量的贡献度;
19、损失函数构建及优化单元,其用于基于水质指标数据构建投药量目标函数以及净化效果目标函数,并基于这两个目标函数构建两目标优化问题,并对两目标优化问题求解得到达到给定净化程度的最小混凝投药量,以模型预测的混凝投药量与求解的最小混凝投药量之差来构建损失函数,利用损失函数对混凝投药量预测模型进行参数优化;
20、实时预测单元,其用于利用参数优化的混凝投药量预测模型进行实时投药量预测,并通过shap解释时空水质特征中对预测药量做出贡献的监测点,该监测点用于指导实际混凝投药量投放。
21、为实现上述发明目的,实施例还提供了一种计算设备,包括存储器和一个或多个处理器,所述存储器中存储有可执行代码,所述一个或多个处理器执行所述可执行代码时,用于实现上述基于shap解释的混凝投药量优化方法。
22、与现有技术相比,本发明具有的有益效果至少包括:
23、本发明基于水厂不同检测点水质指标数据的空间关系和时间关系来提取时空水质特征,并在构建损失函数时考虑到混凝投药量与水质净化效果之间的关联关系,利用两目标优化问题来计算达到水质净化效果的最小混凝投药量并作为监督标签,基于该监督标签来构建损失函数来优化混凝投药量预测模型参数,使得模型在学习时考虑到水质净化效果并给出最优混凝投药量预测,这样能够实现考虑水质净化效果的最小化混凝投药量的精准预测,且引入shap来解释时空水质特征对预测混凝投药量的贡献度,并指导实际混凝投药量投放。
技术研发人员:林炯,柳景青
技术所有人:浙江大学
备 注:该技术已申请专利,仅供学习研究,如用于商业用途,请联系技术所有人。
声 明 :此信息收集于网络,如果你是此专利的发明人不想本网站收录此信息请联系我们,我们会在第一时间删除