数据集为barcelona某段时间内的气象数据,其中包括温度、湿度以及风速等。本文将利用cnn来对风速进行预测。
对于风速的预测,除了考虑历史风速数据外,还应该充分考虑其余气象因素的影响。因此,我们根据前24个时刻的风速+下一时刻的其余气象数据来预测下一时刻的风速。
我们比较熟悉的是cnn处理图像数据时的二维卷积,此时的卷积是一种局部操作,通过一定大小的卷积核作用于局部图像区域获取图像的局部信息。图像中不同数据窗口的数据和卷积核做inner product(内积)的操作叫做卷积,其本质是提纯,即提取图像不同频段的特征。
上面这段话不是很好理解,我们举一个简单例子:
假设最左边的是一个输入图片的某一个通道,为5 × 5 5 \times55×5,中间为一个卷积核的一层,3 × 3 3 \times33×3,我们让卷积核的左上与输入的左上对齐,然后整个卷积核可以往右或者往下移动,假设每次移动一个小方格,那么卷积核实际上走过了一个3 × 3 3 \times33×3的面积,那么具体怎么卷积?比如一开始位于左上角,输入对应为(1, 1, 1;-1, 0, -3;2, 1, 1),而卷积层一直为(1, 0, 0;0, 0, 0;0, 0, -1),让二者做内积运算,即1 * 1+(-1 * 1)= 0,这个0便是结果矩阵的左上角。当卷积核扫过图中阴影部分时,相应的内积为-1,如上图所示。
因此,二维卷积是将一个特征图在width和height两个方向上进行滑动窗口操作,对应位置进行相乘求和。
相比之下,一维卷积通常用于时序预测,一维卷积则只是在width或者height方向上进行滑动窗口并相乘求和。 如下图所示:
原始时序数为:(1, 20, 15, 3, 18, 12. 4, 17),维度为8。卷积核的维度为5,卷积核为:(1, 3, 10, 3, 1)。那么将卷积核作用与上述原始数据后,数据的维度将变为:8-5+1=4。即卷积核中的五个数先和原始数据中前五个数据做卷积,然后移动,和第二个到第六个数据做卷积,以此类推。
数据预处理阶段,主要将某些列上的文本数据转为数值型数据,同时对原始数据进行归一化处理。文本数据如下所示:
经过转换后,上述各个类别分别被赋予不同的数值,比如”sky is clear”为0,”few clouds”为1。
def load_data(): global max, min df = pd.read_csv('barcelona/barcelona.csv') df.drop_duplicates(subt=[df.columns[0]], inplace=true) # weather_main listtype = df['weather_main'].unique() df.fillna(method='ffill', inplace=true) dic = dict.fromkeys(listtype) for i in range(len(listtype)): dic[listtype[i]] = i df['weather_main'] = df['weather_main'].map(dic) # weather_description listtype = df['weather_description'].unique() dic = dict.fromkeys(listtype) for i in range(len10个对联(listtype)): dic[listtype[i]] = i df['weather_description'] = df['weather_description'].map(dic) # weather_icon listtype = df['weather_icon'].unique() dic = dict.声音的利用fromkeys(listtype) for i in range(len(listtype)): dic[listtype[i]] = i df['weather_icon'] = df['weather_icon'].map(dic) # print(df) columns = df.columns max = np.max(df['wind_speed']) # 归一化 min = np.min(df['wind_speed']) for i in range(2, 17): column = columns[i] if column == 'wind_speed': continue df[column] = df[column].astype('float64') if len(df[df[column] == 0]) == len(df): # 全0 continue mx = np.max(df[column]) mn = np.min(df[column]) df[column] = (df[column] - mn) / (mx - mn) # print(df.isna().sum()) return df
利用当前时刻的气象数据和前24个小时的风速数据来预测当前时刻的风速:
def nn_q(): """ :param flag: :param data: 待处理的数据 :return: x和y两个数据集,x=[当前时刻的year,month, hour, day, lowtemp, hightemp, 前一天当前时刻的负荷以及前23小时负荷] y=[当前时刻负荷] """ print('处理数据:') data = load_data() speed = data['wind_speed'] speed = speed.tolist() speed = torch.floattensor(speed).view(-1) data = data.values.tolist() q = [] for i in range(len(data) - 30): train_q = [] train_label = [] for j in range(i, i + 24): train_q.append(speed[j]) # 添加温度、湿度、气压等信息 for c in range(2, 7): train_q.append(data[i + 24][c]) for c in range(8, 17): train_q.append(data[i + 24][c]) train_label.append(speed[i + 24]) train_q = torch.floattensor(train_q).view(-1) trai国家出资企业n_label = torch.floattensor(train_label).view(-1) q.append((train_q, train_label)) # print(q[:5]) dtr = q[0:int(len(q) * 0.5)] den = q[int(len(q) * 0.50):int(len(q) * 0.75)] dte = q[int(len(q) * 0.75):len(q)] return dtr, den, dte
任意输出其中一条数据:
(tensor([1.0000e+00, 1.0000e+00, 2.0000e+00, 1.0000e+00, 1.0000e+00, 1.0000e+00,
1.0000e+00, 1.0000e+00, 0.0000e+00, 1.0000e+00, 5.0000e+00, 0.0000e+00,
2.0000e+00, 0.0000e+00, 0.0000e+00, 5.0000e+00, 0.0000e+00, 2.0000e+00,
2.0000e+00, 5.0000e+00, 6.0000e+00, 5.0000e+00, 5.0000e+00, 5.0000e+00,
5.3102e-01, 5.5466e-01, 4.6885e-01, 1.0066e-03, 5.8000e-01, 6.6667e-01,
0.0000e+00, 0.0000e+00, 0.0000e+00, 0.0000e+00, 9.9338e-01, 0.0000e+00,
0.0000e+00, 0.0000e+00]), tensor([5.]))
数据被划分为三部分:dtr、den以及dte,dtr用作训练集,dte用作测试集。
cnn模型搭建如下:
class cnn(nn.module): def __init__(lf): super(cnn, lf).__init__() lf.conv1d = nn.conv1d(1, 64, kernel_size=2) lf.relu = nn.relu(inplace=true) lf.linear1 = nn.linear(64 * 37, 50) lf.linear2 = nn.linear(50, 1) def forward(lf, x): x =2013蛇年本命年 lf.conv1d(x) x = lf.relu(x) x = x.view(-1) x = lf.linear1(x) x = lf.relu(x) x = lf.linear2(x) return x
卷积层定义如下:
lf.conv1d = nn.conv1d(1, 64, kernel_size=2)
一维卷积的原始定义为:
nn.conv1d(in_channels, out_channels, kernel_size, stride=1, padding=0, dilation=1, groups=1, bias=true)
这里channel的概念相当于自然语言处理中的embedding,这里输入通道数为1,表示每一个风速数据的向量维度大小为1,输出channel设置为64,卷积核大小为2。
原数数据的维度为38,即前24小时风速+14种气象数据。卷积核大小为2,根据前文公式,原始时序数据经过卷积后维度为:
38 – 2 + 1 = 37
一维卷积后是一个relu激活函数:
lf.relu = nn.relu(inplace=true)
接下来是两个全连接层:
lf.linear1 = nn.linear(64 * 37, 50)lf.linear2 = nn.linear(50, 1)
最后输出维度为1,即我们需要预测的风速。
def cnn_train(): dtr, den, dte = nn_q() print(dte[0]) epochs = 100 model = cnn().to(device) loss_function = nn.mloss().to(device) optimizer = torch.optim.adam(model.parameters(), lr=0.001) # 训练 print(len(dtr)) dtr = dtr[0:5000] for epoch in range(epochs): cnt = 0 for q, y_train in dtr: cnt = cnt + 1 q, y_train = q.to(device), y_train.to(device) # print(q.size()) # print(y_train.size()) # 每次更新参数前都梯度归零和初始化 optimizer.zero_grad() # 注意这里要对样本进行reshape, # 转换成conv1d的input size(batch size, channel, ries length) y_pred = model(q.reshape(1, 1, -1)) loss = loss_function(y_pred, y_train) loss.backward() optimizer.step() if cnt % 500 == 0: print(f'epoch: {epoch:3} loss: {loss.item():10.8f}') print(f'epoch: {epoch:3} loss: {loss.item():10.10f}') state = {'model': model.state_dict(), 'optimizer': optimizer.state_dict()} torch.save(state, 'barcelona' + cnn_path)
一共训练100轮:
def cnn_predict(cnn, test_q): pred = [] for q, labels in test_q: q = q.to(device) with torch.no_grad(): pred.append(cnn(q.reshape(1, 1, -1)).item()) pred = np.array([pred]) return pred
测试:
def test(): dtr, den, dte = nn_q() cnn = cnn().to(device) cnn.load_state_dict(torch.load('barcelona' + cnn_path)['model']) cn关于春节的介绍n.eval() pred = cnn_predict(cnn, dte) print(mean_absolute_error(te_y, pred2.t), np.sqrt(mean_squared_error(te_y, pred2.t)))
cnn在dte上的表现如下表所示:
到此这篇关于pytorch搭建cnn实现风速预测的文章就介绍到这了,更多相关pytorch cnn风速预测内容请搜索www.887551.com以前的文章或继续浏览下面的相关文章希望大家以后多多支持www.887551.com!
本文发布于:2023-04-04 09:21:25,感谢您对本站的认可!
本文链接:https://www.wtabcd.cn/fanwen/zuowen/5045505c791cb4f62068715c9e70f90a.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文word下载地址:PyTorch搭建CNN实现风速预测.doc
本文 PDF 下载地址:PyTorch搭建CNN实现风速预测.pdf
留言与评论(共有 0 条评论) |