基于多源气象数据的光伏功率预测深度学习架构

admin · 发表于 2025-8-8 06:00:45

光伏发电（photovoltaic，PV）是现代绿色能源中至关重要的组成部分，具有不可否认的重要性。当前，全球化石燃料储量逐渐减少，加上对环境污染日益增长的担忧，促使全球能源侧重点转向可持续和清洁能源。在不断演变的全球能源格局中，光伏发电因其环保、可再生性和低碳性而备受关注，成为能源转型的关键要素。然而，由于光伏发电受到多种气候因素的影响，其功率输出具有显著的不确定性和波动性，给电网的稳定运行和能源调度带来了挑战。

在能源领域，人工智能方法已被广泛应用于设计优化、调度和负荷预测等各种场景。这些方法在各自的应用中取得了优秀的成果。在电力市场交易、电网调度和能源管理等领域，准确的预测是运营商和决策者的关键工具，以期实现更高效、可靠的运营。在历史上，用于预测光伏发电的传统方法主要采用统计和经验模型，包括自回归（autoregressive，AR）、移动平均（movingaverage，MA）和自回归移动平均（autoregressivemovingaverage，ARMA）模型等。此外，支持向量机（supportvectormachine，SVM）、随机森林（randomforest，RF）和决策树（decisiontree，DT）等机器学习技术也被广泛应用。然而，考虑到影响光伏发电的各种气候要素和系统参数之间的复杂相互作用，这些传统方法在面对快速变化的大气环境和非线性的天气条件数据时经常面临困难，导致预测结果通常不如预期的那么精确。

针对上述挑战，研究人员深入研究了气候因素对光伏发电效率和输出的影响。太阳辐射作为光伏系统的主要能源来源，通过其强度和入射角显著影响面板效率。此外，在阴天或雾等复杂天气条件下，漫反射也会影响光伏发电。温度也是一个关键影响因素，虽然较高的温度可能会增加太阳辐射的强度，但同时也可能降低光伏电池的效率。其他气象条件，如云层、降水和降雪，也会对光伏发电产生相当大的影响。例如，云层可以减少太阳辐射的强度，雨天或雪天则可能阻挡阳光或降低面板效率。全面了解这些天气影响对于提高预测准确性至关重要。尽管全面整合气象变量可以提高光伏发电预测的精度，但传统机器学习技术在处理高维度、非线性和长期依赖性数据方面始终面临挑战，而深度学习技术的出现为克服这些限制提供了新的机会。深度学习技术能够处理大量数据并自动从中提取有用的特征，为光伏发电预测提供了新的可能性。诸如循环神经网络（recurrentneuralnetwork，RNN）、长短期记忆网络（longshort-termmemory，LSTM）和门控循环单元（gatedrecurrentunit，GRU）等时间序列预测模型在光伏发电预测中取得了显著成果。上述模型可以捕捉时间序列数据中的长期依赖关系和复杂模式，从而提高了预测的准确性。尽管深度学习模型在光伏发电预测中取得了部分显著成果，但仍然存在着许多挑战。通常此类模型需要大量标记数据，并且在模型的可解释性方面还有很大的改进空间。表1提供了光伏发电预测方法的详细比较分析。

鉴于此，本研究提出了一种基于气象数据驱动的深度学习模型——D-Informer，旨在克服现有预测方法的局限性，通过集成差分转换算法和多头自注意力机制，利用气象参数和历史光伏发电数据，提高预测的准确性和可靠性。首先向模型提供多维输入数据（包括温度数据、辐射值、散射值、光伏发电数据）。将光伏数据经过微分转换以增强数据稳定性，与天气数据一起输入到深度学习预测模型中。最后多注意力机制的模型输出光伏发电预测结果。实验证明，D-Informer在各种性能指标上显著优于其他的时间序列预测模型。值得注意的是，D-Informer在冬季的R2值接近预测准确性极限，达到了0.9917，进一步证实了该方法在预测光伏发电方面的准确性和可靠性。

1气象数据驱动的光伏功率预测模型

本节提出的框架的总体目标是通过整合来自气象变量的输入，并采用深度学习方法，实现精确的光伏发电预测。首先，历史光伏发电数据经历差分转换，以消除任何线性趋势和不稳定性，从而为进一步分析奠定更稳定的基础。随后，经过改变的数据与温度、直接水平辐射和散射水平辐射结合，输入到全连接神经网络中，以提取相关特征。这一阶段对于识别光伏数据与气象变量之间的内在联系较为关键，为后续时间序列预测提供复杂特征。然后，利用配备多注意力机制的D-Informer模型进行时间序列预测。预测完成后，将预测结果通过逆差分转换回原始光伏发电比例。整个过程如图1所示。

模型机制的不同阶段详细描述如下。数据预处理：光伏发电历史数据经历差分转换，用以缓解数据非稳态性并消除数据线性趋势，从而为后续处理和分析阶段奠定基础。全连接层：转换后的光伏数据与3个关键气象变量-温度、直接水平辐射和散射水平辐射-结合创建全面的多维输入特征矩阵。通过全连接神经网络处理矩阵以提取特征。此网络的主要目的是发掘光伏数据与气象变量之间的隐藏关系，为随后的预测任务提供复杂模态特征集。预测模型：利用整合的特征进行时间序列预测的D-Informer网络架构。配备多注意力机制和编码器-解码器结构，D-Informer在识别时间序列数据中的长期依赖性和复杂模式方面较为可靠。完成训练后，将该模型应用于测试数据产生D-Informer的预测。结果生成：将D-Informer的预测结果应用逆差分转换，将其恢复到原始的光伏发电比例。这一转换翻转初始的差分处理过程，将预测结果转换回原始数据比例，从而使预测结果实际可应用和具有见解性。

1.1差分转换与逆差分转换

差分转换是一种广泛使用的数据预处理方法，主要用于从时间序列数据中去除非平稳性，从而为进一步的分析和预测建立数据基础。由于日出和日落时间随时间变化，夜间光伏发电数据虽然不产生电力，但有助于模型更好地理解和学习光伏发电的日周期模式。通过计算连续时间步之间的差值，差分算法能够消除数据中的非平稳日趋性波动，是处理具有明显趋势和季节性特征的光伏发电数据的有效手段。因此，在本文中，根据情况对光伏数据应用差分转换。给定时间序列Y={y1,y2,…,yt}，一阶差分转换表示为

式中：ΔY为经过差分转换后的时间序列；yi为时间点i的原始数据值；k为差分的滞后或窗口长度；δyi为在t时刻的时间序列差分值。通过差分转换，时间序列中可能存在的任何线性趋势都被消除。差分转换的窗口大小是一个重要参数，需要根据数据的具体特征进行选择。在本研究中，通过实验比较了不同窗口大小的效果，如图2所示。

可以观察到，直接与完整天数相关的差分窗口，如24h、48h和72h具有更多的零值。原因为太阳能发电在一天中的某些固定时段（如夜间）为零。当采用与完整天数对应的差分窗口时，这些固有的零值可能被强调或重复。相反，与完整天数不直接对应的“中间”窗口如12h、36h和60h，具有较少的零值。这些窗口可能更有效地捕捉数据中的变化和非日常模式，导致较少的零值。

基于前期研究，选择与完整日周期不完全匹配的“中间”差分窗口在某些情境下可能具有优势。对于本研究，选择36h的差分窗口。该窗口跨越一天半的时间段，更擅于捕捉日夜之间的过渡同时顾及连续几天的变化。该方法的目标是减少零值并保持数据的基本结构和细节，从而提高预测的准确性。逆差分转换是差分转换的逆操作，用于将差分数据恢复到其原始比例。给定差分系列ΔY和原始时间序列yi的第i个数据点，逆差分转换以表示为

通过该方法，模型预测的结果被转换回其原始比例，使得对结果的解释和进一步分析更加直观。下文将深入解释天气数据与光伏数据的集成过程，以及全连接神经网络的结构和功能。

1.2数据集成与全连接神经网络

本小节深入影响太阳能发电的3个关键气候变量：温度、直接水平辐射和散射水平辐射，以及将天气数据和光伏数据作为模型输入进行融合的方法。图3、图4和图5展示了跨越2016—2019年英国的3种气候数据。

在图3中，温度数据的分布呈现出一定的季节性变化，例如，温度在夏季达到年度峰值，约为29.11℃，在冬季下降到最低点，约为-4.52℃。这种温度波动可能会影响光伏电池板效率，典型情况下，随着温度升高，效率降低。

图4展示了直接太阳辐射的分布和变化，可以观察到，在阳光充足的夏季月份，直接太阳辐射达到最大值，约为811.63W/m2，而在更多云雨的冬季月份，其下降到最低值，约为0W/m2。通常，与散射辐射相比，直接太阳辐射更集中、更强烈，对太阳能发电的贡献非常显著。

图5显示了全年散射辐射的变化，在某些月份，散射辐射达到约388.45W/m2的峰值，而在其他月份，它减少到约0W/m2的最小值。散射辐射也可以为太阳能电池板提供能量，因此被认为是光伏发电的输入条件之一。

本研究中采用的数据集成方法利用基于全连接层架构，使用权重矩阵对输入特征进行线性融合，然后通过激活函数引入非线性数据。此过程旨在有效地学习和提取输入数据的关键特征。在提出的框架中，首先选择36h的窗口长度对历史光伏数据应用差分转换。然后，将转换后的数据与温度、直接水平辐射和散射水平辐射结合，形成一个多维输入特征矩阵。该矩阵被馈送到全连接神经网络中，以提取光伏数据和天气变量之间的潜在相关性和有用特征。全连接层的输出然后成为接下来的Informer网络的输入，为有效的时间序列预测提供了全面的特征集。

1.3多注意力机制预测模型

Informer是一种创新的深度学习模型，专门设计用于解决长序列时间序列预测中的挑战。如图1所示，其主要架构包括编码器、解码器和自注意机制。编码器的作用是处理输入数据并识别其内在表示，而解码器则负责根据编码器的输出产生预测。在序列处理过程中，多自注意机制专注于序列的不同部分，并分配不同级别的重要性，有效地识别时间序列中的长期关系和复杂模式。在本研究中，多头注意力机制赋予模型同时考虑多个影响光伏发电效率的因素的能力，在管理多个天气数据输入方面发挥了关键作用，显著改进了关键特征的提取，从而提高了预测的精度。

双自注意力模块的结构如图6所示，其中每个输入ai和aj都经过线性变换以得到查询q、键k和值v的表示。每个自注意力模块头部都拥有自己独特的一组变换矩阵，为每个输入产生两组q、k和v的表示。

因此，此结构允许模型探索两种不同类型的关联。每个头部可以聚焦于不同的模式或关系，从而获取更丰富的信息。例如，一个头部可能调整到短期依赖性，而另一头部可能调整到长期依赖性。

在计算注意力分数时，每个头部的查询q计算与匹配的键k的相似性，然后使用softmax函数对这些分数进行归一化。然后使用此归一化来权衡各个头部的v值，生成每个头部的输出。通过此过程，每个头部可以为不同的相关性提供独特的注意力分布。此外，在计算第一个头部的注意力分数时，只考虑k，而忽略k。因此，每个头部只关注与之对应的键表示，促进了不同相关性的独立探索。

在经过双头自注意力机制的遍历后，每个输入位置i产生2个输出，bi,1和bi,2，每个来自一个不同的头部，体现不同类型的关系或依赖性。为了将这2个头部的见解融合起来，通过与权重矩阵W0的乘法进行线性变换，实现最终输出bi。具体表达如下

通过线性变换，模型将两个头部的见解融合起来，实现了合并输出bi，为后续处理提供了更丰富的特征表示。

2模型验证与性能分析

本节展示了所提出的方法在预测光伏发电方面的有效性。它包括实验中使用的数据集概述，DInformer模型预测的结果展示和评估，以及与其他模型的比较分析，以证实所提方法的有效性和优势。

2.1数据描述

本文的数据来源于英国光伏发电统计，时间跨度为2016年1月—2019年12月。光伏发电数据以小时为单位测量，但采样间隔为30min。如图7所示，光伏发电的总体趋势呈现出明显的季节性变化。在夏季月份，由于阳光强度增加和白昼时间延长，发电量预计会达到年度峰值。相反，在冬季月份，发电量会下降，这一趋势归因于阳光减少和白昼时间缩短。对应的气候数据可以在图3—图5中观察到。

2.2模型训练与预测结果

本研究实施了多步预测，旨在评估模型在预测未来几小时至一天内光伏功率的表现。具体而言，我们采用的时间尺度为24h内的每小时预测。鉴于光伏数据中明显的季节性模式，为此本文将4a的数据集分为4个单独的季节进行独立验证。此外，本文将数据分割成训练集和测试集，比例为7∶3。每个季节包括91d，每天产生48个数据点，每个季节累计产生4368个数据点。其中，3058个数据点用于训练，剩余的1310个数据点用于测试。训练集用于模型训练和参数优化，而测试集用于最终评估模型。各种模型获得的预测结果如图8所示。此季节性分割数据并使用不同的训练和测试集的方法，能够有效评估模型对光伏发电不同季节变化的泛化能力和敏感性，从而全面评估其性能。

在实验中，每条曲线代表了整个季节的预测电力输出，展示了每个模型的预测与实际光伏发电值的吻合程度。特别是，D-Informer模型表现出了异常的准确性，与所有季节的实际发电量密切匹配，并显示出与其他模型相比更优越的预测能力。图9中的雷达图进一步阐明了D-Informer模型的预测效能。该图有效展示了各种模型在4个评估指标上的性能，D-Informer模型（以红色线表示）展现出了出色的预测性能。在本研究中，雷达图涵盖了所有4个季节的数据，每个季节对应图表上的一个轴。一个模型在这些季节中的性能通过4个轴上的点来直观表示，从而说明了模型的季节性能。对于均方误、均方根误差和平均绝对误差等指标，图表上的四边形面积越小，表示模型的预测准确性越好，与具有最小内角的轴对应的季节表示最佳的季节预测。相反，对于R2指标，较大的四边形面积表示模型性能更好，与具有最小内角的季节表示最准确的预测。图9中，R2指标以几乎完美的形式填满雷达图。

对于D-Informer模型，在所有季节中平均的R2值为0.9887，在冬季更是达到了0.9917。此外，在其他3个评估指标的图表中，可以明显看出所提出的模型具有最小的四边形面积。这种布局表明DInformer模型在所有指标上表现优于其他模型，展现了卓越的预测能力。

3讨论

本研究通过详尽地分析各种季节和气候条件下的气象数据和光伏发电记录，确保了研究结果的全面性和可靠性。通过融合微分变换算法和多自注意机制，本文提出的模型显著降低了数据的非平稳性，并增强了对复杂模式的识别能力。实验结果显示，该模型在所有评估指标上均展现出显著的优势，特别是在冬季的表现进一步证实了其有效性。尽管D-Informer模型展现了高度的准确性，但其复杂性可能带来计算资源和时间上的挑战，尤其是当应用于覆盖更广泛气象数据的数据集时。未来研究将致力于优化模型，以提升其效率。此外，考虑将D-Informer模型应用于风能或水力发电等其他可再生能源领域，这可能成为未来发展的潜在方向。

4结论

本研究对气象数据和历史光伏发电数据进行了详细分析，并提出了一种新型光伏发电预测模型D-Informer。该模型集成了微分算法和多注意机制。具体结论总结如下。

1）本研究使用的数据集包括详细的气象参数和光伏发电记录并涵盖了各种季节和气候条件。在目前的研究中使用此类实测数据较为少见，确保了研究结果的全面性和可靠性。

2）D-Informer模型结合了微分变换算法和多自注意机制。微分变换减少了数据的非平稳性和季节性效应。多自注意机制的引入使模型能够从多个角度分析输入数据，增强了识别数据中复杂模式的能力。该方法可分析并解释复杂特征，从而提高光伏发电预测结果的稳定性。

3）通过采用各种预测评估指标并比较不同模型，可以看出本文所提出的D-Informer模型在所有评估指标上都表现出显著的优越性。在均方误差、平均绝对误差和均方根误差方面的平均改进率分别达到了67.64%、49.58%和43.43%。此外，DInformer的R2值在所有季节中保持较高，例如在冬季达到了0.9917。这些结果进一步验证了所提方法在预测光伏发电方面的准确性和可靠性。

参考文献：

[1]马成廉,韩瑞,宋萌清,等.基于多源气象数据的光伏功率预测深度学习架构[J].电网与清洁能源,2025,41(04):104-112.

声明：本文所用图片、文字均为转载，如有涉及作品版权问题，请第一时间告知，我们将根据您提供的证明材料确认并立即删除内容。本文内容系作者个人观点，不代表物联网123观点或立场。

特别提醒：物联网专业交流群欢迎物联网行业相关的人群加入，同时群内欢迎各路社牛、大咖、前辈加入，群内除了不能发敏感内容、色情内容，以及不太建议多次发送推广内容，其他内容皆可畅聊~——交流QQ群724511126，进群的朋友请备注：姓名-单位-研究方向（无备注请恕不通过），由编辑审核后邀请入群！

		自动登录	找回密码
密码			立即注册

基于多源气象数据的光伏功率预测深度学习架构

本帖子中包含更多资源

浏览过的版块