医药安全标准网
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111522563.3 (22)申请日 2021.12.13 (71)申请人 南京富尔登科技发展 有限公司 地址 211500 江苏省南京市六合区雄州街 道工业园骁骑路2号 (72)发明人 杨平化  (74)专利代理 机构 南京经纬专利商标代理有限 公司 32200 代理人 陆志斌 (51)Int.Cl. G06Q 10/04(2012.01) G06F 30/27(2020.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01)G06Q 50/06(2012.01) (54)发明名称 一种基于联邦学习的配电站故障预测方法 (57)摘要 本发明提供一种基于联邦学习的配电站故 障预测方法, 涉及数据识别技术、 电力系统及其 自动化领域, 解决了不同类型的配电站故障预测 参数不共享、 参数异构等问题, 包括S1、 故障预测 数据预处理; S2、 基于空洞卷积、 图注意力网络和 长短期记忆网络, 建立本地模型; S3、 服务器端采 用联邦学习模 型实现联合训练。 该种基于联邦学 习的配电站故障预测方法, 通过在保护各个参与 方的隐私基础上, 采用多尺度融合数据特征, 在 非结构化数据上采用图注意力网络进行特征提 取, 建立本地模型, 有效的解决了不同类型的配 电站故障预测参数不共享、 参数异构等问题。 权利要求书3页 说明书13页 附图5页 CN 114219147 A 2022.03.22 CN 114219147 A 1.一种基于联邦学习的配电站故障预测方法, 其特 征在于, 包括如下步骤: S1、 故障预测数据预处理, 利用历史数据来进行时间序列的建模, 再通过建立的模型来 预测未来12小时内可能存在的故障问题, 具体步骤如下: S1‑1、 以每个配电站为客户端, 进行数据收集, 并将获得的数据进行制作数据集, 之后 将数据集分为训练集D1、 测试集D2和验证集D3三个组成部分; S1‑2、 通过采用深度学习算法进行配电站故障预测, 根据获取到的配电站的相关特征 参数, 并将其映射 为向量的形式; S1‑3、 数据样本不平衡处理, 采用ADASYN算法根据数据样本分布自适应生成少数类新 样本; S1‑4、 对于收集的数据采用最大值最小值标准化, 将数据映射到[0, 1]之间, 标准化函 数为: 式中xt是t时刻的收集到的配电站的相关特征参数, xmax是收集到的样 本参数中的最大值, xmin是是收集到的样本参数中的最小值, 是t时刻收集到的配电站的 相关特征参数标准化结果; S2、 基于空洞卷积和图注意力网络, 建立本地模型, 将图注意力机制处理过后的特征参 数, 输入到LSTM网络, 进行时间序列的特征提取, 以提高配电站故障预测的时长, 最后利用 将LSTM的输出至全连接层, 建立联邦学习的本地模型, 具体步骤如下: S2‑1、 通过使用空洞率, 来调整空洞卷积的视野大小; S2‑2、 采用图注意力机制, 通过结合注意力机制与图卷积网络, 在更新图节点特征表示 的过程中关注到邻居节点对其的影响度, 其中图注意力机制网络通过堆叠图注意力层来构 造; S2‑3、 将图注意力机制处理之后的时序特征向量输入到LSTM网络, 基于时序的配电站 特征参数需要 充分利用时间和其 他参数之间的相关性; S2‑4、 在LSTM 网络的输出处, 采用一个全连接层, 来将输出的信息利用支 持向量机来实 现, 支持向量机为简单的输入层、 隐藏层和 输出层三层结构, 其中输入为LSTM的输出, 隐藏 层为100个神经元, 输出的大小同输入, 最终MLP的输出层为本地模 型输出, 至此本地模 型建 立完成定义 为wlocals; S3、 服务器端进行联合训练模型, 实现在不侵犯各个配电站数据的情况下, 根据各个本 地模型建立的聚合模型, 来进行配电站故障预测, 具体步骤如下: S3‑1、 建立在线抽样方法, 使得每一轮通信中选取相应的设备组合后可使全局模型的 各类别测试性能趋于平衡, 之后设计设备子集的选择算法, 通过充分利用设备组合后的数 据, 充分发挥联邦学习中客户端配电站数据的价值, 通过上述的过程更新局部模型参数之 后, 上传到终端服 务器中, 进行聚合 生成全局模型; S3‑2、 服务器端类别 估计算法, 类别 估计方案只需基于设备更新后传回的模型, 以及全 局服务器上少量的辅助数据集, 同时训练过程中不同类别的训练数据量与相应类别上模型 参数梯度更新的欧式范数的平方具有近似的比例关系, 表述为公式 式中L 表示分类的损失函数, 为梯度计算符号, || ·||2表示范数计算, ms和ml分别表示训练集D1 中第s和l类的样本数量, 其中s≠l∈[C], C表示客户端全部数据样本类别, Es(·)表示对第权 利 要 求 书 1/3 页 2 CN 114219147 A 2s类数据的期望运 算符, El(·)表示对第l类数据的期望运 算符; S3‑3、 在联邦学习中类别不平衡的场景下, 由于每一轮通信中设备子集的选取有组合 性, 设备选择算法基于类别估计方案, 利用每轮通信中聚合后的全局模型以及当前设备上 数据类别分布的统计信息, 选取与全局模型 各类别测试性能偏移程度最互补的设备组合; S3‑4、 采用均方误差作损失函数作为指标, 来确定联合建模的预测准确性。 2.根据权利要求1所述的一种基于联邦学习的配电站故障预测方法, 其特征在于, 所述 S1‑1中, 配电站按照功率大小分为民用配电站和企业配电站, 所述民用配电站在数据采集 过程中, 以每个配电站 为客户端, 每10 分钟收集一次数据, 全天可获得144条数据信息, 所述 企业配电站在数据采集过程中, 以每个配电站为客户端, 每5分钟收集一次数据, 全天可获 得288条数据信息 。 3.根据权利要求1所述的一种基于联邦学习的配电站故障预测方法, 其特征在于, 所述 S1‑3的主要过程包括以下步骤: 首先采用S1 ‑1定义的训练集由m个样本{xi, yi}, i=1, 2, …, m组成, 其中xi是n维特征空间X的一个样本, yi∈Y={1, ‑1}是xi相关联的类别标签, 然后定 义ms少数类样本数即配电站硬件参数信息, ml为多数类样 本数即配电站电力参数信息, 则ms ≤ml, 且ms+ml=m, 具体的ADASYN 算法流程如下: a、 计算数据类别不平衡率d, b、 若d<dth, dth为所设置的最大不平衡率, 则计算需要合成的少数类样本数量G, G= (ml‑ms)×β, 式中参数β ∈[0, 1]表示处理后的数据集所求的平衡 程度, β =1表示生成了完全 平衡的数据集; c、 对于任意的少数类样本xi, 根据n维空间的欧几里得距离找 到K个最近邻点, 并计算出 比例ri, 式中Δi是K个最近邻点中属 于多数类的样本数量, 即ri∈ [0, 1]; d、 对ri进行归一 化之后r′i, e、 计算需要为每 个少数类样本xi生成的新样本数量gi, gi=r′i×G; f、 在每个少数类样本xi的K个最近邻点中选择一个少数类样本xzi, 根据如下规则生成 新样本si, si=xi+(xzi‑xi)×λ, 式中λ为[0, 1]的系数。 4.根据权利要求1所述的一种基于联邦学习的配电站故障预测方法, 其特征在于, 所述 S2‑2中, 图注意力层的输入 包含N, (1≤N≤20)个节点的特 征集, 输入向量 为: →表示向量, 表示实数域, 其目的是将输入特征参数变 换为表达更丰富的特 征, 即输出一个新的节点特 征集 5.根据权利要求1所述的一种基于联邦学习的配电站故障预测方法, 其特征在于, 所述 S3‑1中聚合生成全局模型采用联邦平均F edAvg算法进行模型聚合。 6.根据权利要求1所述的一种基于联邦学习的配电站故障预测方法, 其特征在于, 所述 S3‑2的具体流程为: 在第t论通信中, 第k个设备上本地训练结束后, 传回模型 到全局服 务器, 在全局服务器上, 令 在aux中每个类的 个数据上进行推理, 并计算模权 利 要 求 书 2/3 页 3 CN 114219147 A 3

.PDF文档 专利 一种基于联邦学习的配电站故障预测方法

文档预览
中文文档 22 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共22页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于联邦学习的配电站故障预测方法 第 1 页 专利 一种基于联邦学习的配电站故障预测方法 第 2 页 专利 一种基于联邦学习的配电站故障预测方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 20:27:11上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。