希腊雅典国立技术大学的科学家提出了一种保护产消者隐私的新型光伏预测技术。高效的产消者方案依赖于准确的太阳能生产预测模型,这需要大量数据,因此隐私和效用的权衡至关重要。研究人员平衡这种权衡的方法是基于联合学习 (FL)。
“FL 流程始于与所有设备共享的全局模型。每台设备在本地训练模型,并将更新发送到中央服务器,在那里汇总以改进模型,”学者们说。“然后将这个更新的模型分发回设备进行进一步训练。FL 循环迭代多次,直到全局模型达到所需的最佳精度。”
该团队的模型在每台机器上本地运行,包括一个长短期记忆 (LSTM) 架构、一个 dropout 单元和两个完全连接的密集层。LSTM 处理顺序数据,而 dropout 单元减少过度拟合,密集层有助于做出最终预测。
该模型还使用超参数来调整本地 LSTM 模型并在中央服务器上对类似客户端进行聚类。这些超参数在训练开始前设置,控制着机器学习模型的训练过程。
其他型号
“所研究的数据集来自意大利特尔尼的电网,包括 30 个利用光伏系统发电的小型电力消费者的数据,”该小组解释道。“经过归一化后,我们将数据集分为两个子集:一个用于模型训练的训练集和一个用于评估模型在未知数据上的表现的测试集。这种划分遵循 80-20 的划分,2015 年 1 月至 2017 年 12 月的数据用于训练,2018 年 1 月至 2019 年 12 月的数据用于测试。”
研究人员随后将同一数据集上的 FL-LSTM 模型与几种学习方法进行了比较。第一种是局部学习,它在完全私密的局部环境中运行。第二种是集中学习,它通常提供更高的准确性,但会牺牲隐私。第三种模型是使用差分隐私 (DP) 增强的 FL,以最大限度地减少识别个人贡献的机会,使用噪声乘数设置为 0.2、0.25、0.3 或 0.4。
“为了评估模型的性能,我们使用了两个关键指标:平均绝对误差 (MAE) 和均方根误差 (RMSE),”该小组解释道。“选择 MAE 可以全面了解我们模型的误差范围,特别是因为它对异常值的稳健性——这是我们数据集的一个显着特征。相反,RMSE 强调对较大误差的敏感性,这对于评估发电预测的准确性至关重要,因为它比 MAE 更能突出重大偏差的影响。”
结果表明,集中式模型效果最好,MAE 为 0.00960,RMSE 为 0.01687;FL 模型 MAE 为 0.01993,RMSE 为 0.02872;噪声乘数为 0.2 的 FL-DP 模型 MAE 为 0.01857,RMSE 为 0.02669;局部化模型 MAE 为 0.02436,RMSE 为 0.04679;噪声乘数为 0.25 的 FL-DP 模型 MAE 为 0.02651,RMSE 为 0.03375。未提供噪声乘数为 0.3 和 0.4 的结果。
“在寻找能够提供与非 DP FL 实现类似性能的噪声水平时,我们遇到了一个有趣的异常现象。在噪声乘数为 0.2 时观察到最佳噪声性能比,这意外地产生了比 FL 更好的结果,”该小组指出。“我们对噪声乘数高于 0.2 的实验表明,预测准确度会下降,而乘数为 0.4 会使模型无法收敛。”
该小组表示,“主要制约因素是参与客户端数量的数据集规模有限。这项研究是基准;随着时间的推移,增加更多的产消者肯定会提高 FL 和 FL-DP 的性能。考虑到这一点,我们的结果表明,对于参与客户端较少的较小数据集,集中式学习在准确性方面优于 FL,尽管这两种方法都利用了可用的集体数据。尽管如此,FL 在隐私和通信成本方面仍具有优势。”
他们在最近发表在《能源报告》上的《赋能联邦学习技术实现隐私保护的光伏预测》一文中展示了他们的研究成果。