(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211247586.2
(22)申请日 2022.10.12
(71)申请人 重庆移通学院
地址 401520 重庆市合川区大 学城假日大
道1号
(72)发明人 裴亚东 黄秋杰 李方伟 王明月
谭艳菲 周海
(74)专利代理 机构 重庆市恒信知识产权代理有
限公司 5 0102
专利代理师 陈志生
(51)Int.Cl.
G06Q 10/04(2012.01)
G06F 16/23(2019.01)
G06N 3/04(2006.01)
G06N 3/063(2006.01)G06N 3/08(2006.01)
G06Q 50/26(2012.01)
(54)发明名称
一种基于三维卷积神经网络和门控循环单
元的PM2.5预测方法
(57)摘要
本发明请求保护一种基于三维卷积神经网
络和门控循环单元的PM2.5预测方法。 包括如下
步骤: 步骤1为数据收集, 收集每小时的PM2.5浓
度数据以及与PM2.5相关的NO2,SO2等多种变量
空气污染物数据; 步骤2为数据预处理, 对收集到
的数据缺失值填补, 对数据标准化处理, 划分训
练集、 验证集和测试集; 步骤3将输入数据根据小
时、 天和多变量三种特征扩展到三维并使用三维
卷积神经网络学习每天24小时、 每周7天和多种
输入变量三个维度的特征; 步骤4将提取到的特
征放入门控循环单元提取时间序列长期和短期
的记忆特性然后连接全连接层输 出PM2.5预测结
果。 本发明考虑了PM2.5每天、 每周变化趋势、 多
变量因素的影响以及时间序列长期和短期的记
忆特性, 有效地 提高PM2.5多步长预测的精度。
权利要求书2页 说明书5页 附图3页
CN 115545315 A
2022.12.30
CN 115545315 A
1.一种基于三维卷积神经网络和门控循环单元的PM2.5预测方法, 其特征在于, 包括以
下步骤:
步骤1、 数据收集步骤: 收集每小时的PM2.5浓度数据以及与PM2.5相关的NO2,SO2在内
的多种变量空气污染物数据;
步骤2、 数据预处理步骤: 对收集到的数据缺失值填补, 对数据标准化处理, 划分训练
集、 验证集和 测试集;
步骤3、 将输入数据根据小时、 天和多变量三种特征扩展到三维并使用三维卷积神经网
络学习每天24小时、 每周7天和多种输入变量 三个维度的特 征;
步骤4、 将提取到的特征放入门控循环单元提取时间序列长期和短期的记忆特性, 然后
连接全连接层输出PM2.5预测结果。
2.根据权利要求1所述的一种基于三维卷积神经网络和门控循环单元的PM2.5预测方
法, 其特征在于, 所述 步骤2的数据预处 理步骤具体包括:
Step1:检查收集到的数据完整性及可用性, 使用插值方法补全数据中缺失值;
Step2:对多变量数据分别进行 标准化处理;
Step3:将原始数据划分为训练集、 验证集和测试集, 原始数据的70%为训练集, 20%为
验证集, 10%作为测试集, 根据需求确定训练数据的时间序列步长和预测数据的时间步长 。
3.根据权利要求2所述的一种基于三维卷积神经网络和门控循环单元的PM2.5预测方
法, 其特征在于, 所述Step1中数据插值适用于少量连续数据缺失, 若大量数据缺失则 数据
不具有可用性。
4.根据权利要求2所述的一种基于三维卷积神经网络和门控循环单元的PM2.5预测方
法, 其特征在于, 所述Step2中数据标准化处理方法为极差标准化法: x ′=(x‑xmin)/(xmax‑
xmin),x为原始数据, xmin为原始数据最小值, xmax为数据最大值, x ′为标准化后的数据。
5.根据权利要求2所述的一种基于三维卷积神经网络和门控循环单元的PM2.5预测方
法, 其特征在于, 还 包括设置训练模型 结构的步骤, 具体包括:
Step1:三维卷积神经网络结构, 包括卷积层层数, 输入层数据形状、 卷积核尺寸, 卷积
核个数和激活层的激活函数;
Step2:门控循环单 元结构, 包括门控循环单 元层数, 隐藏层个数;
Step3:总模型训练参数设置, 包括批处理尺寸batch_size、 模型训练次数epoch、 模型
学习率lr和优化器Optimizer。
6.根据权利要求5所述的一种基于三维卷积神经网络和门控循环单元的PM2.5预测方
法, 其特征在于, 基于训练集和验证集训练预测模型, 具体如下:
Step1:使用三维卷积神经网络学习每天24小时、 每周7天和多变量 三个维度的特 征;
Step2:将三维卷积神经网络处理后的三维张量采用python numpy库中reshape()函数
重塑为二维矩阵, 然后放入门控循环单元提取时间序列长期和短期的记忆特性, 最后连接
全连接层输出PM2.5预测结果完成模型训练。
7.根据权利要求5或6所述的一种基于三维卷积神经网络和门控循环单元的PM2.5预测
方法, 其特征在于, 所述三维卷积神经网络的输入为尺 寸为(24,7,6), 卷积神经网络的层数权 利 要 求 书 1/2 页
2
CN 115545315 A
2为3, 激活函数为selu:
其中αselu≈1.6733, λselu≈
1.0507, αselu, λselu为激活函数selu固定的超参数。
8.根据权利要求5或6所述的一种基于三维卷积神经网络和门控循环单元的PM2.5预测
方法, 其特征在于, 所述步骤4Step2:将三 维卷积神经网络处理后的三维张量重塑为二维矩
阵, 然后放入门控循环单 元提取时间序列长期和短期的记 忆特性, 具体包括:
将三维卷积神经网络处理后的三维张量(24, 7, 48)重塑为二维矩阵(168, 48), 然后放
入门控循环单元提取时间序列长期和短期的记忆特性, 门控循环单元包括更新门和重置门
两个门控单元; 门控循环单元通过门控单元学习时间序列ht‑1,ht…时刻的信息, 保留有效
信息, 遗忘重复冗余的信息, 计算公式为:
zt=σ(wz1ht‑1+wz2xt+b) (1)
rt=σ(wr1ht‑1+wr2xt+br) (2)
zt为更新门, 用来控制时间序列中前一时刻的信息保留到状态存储中的程度, 更新门的
值越大表示对应时刻的信息越有效; ht‑1表示前一时刻状态输出量, b、 wz1、 wz2、 wr1、 wr2、 br、
wh1、 wh2、 bh为门控循环单元可训练的参数, 通过模型训练效果修正并确定最优参数, xt表示
当前时刻输入量, σ 表示激活函数sigmoid, 计算公式为S(x)=1/(1+e‑x); rt为重置门, 用于
控制前一时刻有多少存储在当前时刻的候选信息中, rt的值越小则前一时刻被丢弃的信息
越多,
表示当前时刻候选隐藏状态,
为按元素相乘, tanh为正切激 活函数, 计算公式为:
tanhx=(ex‑e‑x)/(ex+e‑x), ht表示当前时刻状态输出量。权 利 要 求 书 2/2 页
3
CN 115545315 A
3
专利 一种基于三维卷积神经网络和门控循环单元的PM2.5预测方法
文档预览
中文文档
11 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 思考人生 于 2024-02-07 20:38:08上传分享