ELECTRONlCS WORLD・攘素与 ?察 智能电网大数据应用问题分析 国网凉山供电公司信息通信公司 吴凯军 陈 东 【摘要】随着电网智能化的发展,在电能的生产、输送以及使用过程中产生了大量的数据积累,大量的运行数据资源支撑着电力系统安全可靠的 运行。数据信息的收集、输送和储存分析耗费了大量的系统资源,对大数据信息进行科学的分析应用,对数据中的隐藏价值进行提取,成为智能 电网研究的重点。本文结合电网大数据的特点,提出了主成分分析法的电网负荷预测法,对智能电网大数据的应用具有一定的借鉴意义。 【关键词】智能电网;大数据;主成分分析法 进行改进,从而进行快速准确的预测。而大数据方法需要对更多数 1概述 在智能电网的生产和运行的各个环节都会有数据信息产生,产 生数据的设备数量巨大,数据产生速度非常块,且数据传输的方向 是双向的,造成数据规模庞大、结构复杂。电力系统的可靠运行需 要各部门打破界限进行数据的实时交互,需要强力的数据分析能力 对大数据信息进行分析处理,大数据技术推动着电力系统向更高水 平的运行管理水平发展。可见,对电网大数据的科学分析利用,可 以有效的推动电网的智能化发展,提高电网的运行管理水平。本文 对电力大数据的产生进行了介绍,并利用主成分分析法实现了电网 的负荷预测。 2智能电网大数据的产生 依靠大数据分析技术对数据价值进行提取,是大数据技术应用 的核心。数据信息是大数据应用的基础材料,是大数据价值体现的 根源。在提取和获取数据的操作中,数据分析消耗了总时间的20%一 30%,而数据的获取耗费了高达70%一80%的总时间。智能电网的数 据来源非常丰富,来源于功能系统运行中的各环节,维系着智能电 网的安全运行。智能电网的各功能系统不断的采集电网数据信息, 智能电网的数据来源如表2—1所示。各功能系统不能对电力系统所 有的生产环节完成全面覆盖,因此系统间的数据交换必不可少。Ⅲ 如何对系统数据进行整合,实现电网数据进行综合分析,是智能电 网大数据应用的重点。 表2~1智能电网数据采集系统表 系统英文简称 系统中文全称 CSS 用户服务系统 SCADA 数据采集监控系统 DTS 调度培训系统 DMS 配电管理系统 EMS 能量管理系统 GIS 地理信息系统 EAP 企业资产管理系统 ERP 企业资源规划系统 MOS 市场运行系统 MIS 管理信息系统 OMS 停电管理系统 PMS 生产管理系统 3智能电网大数据在预测中的应用 3.1电网大数据预测方法 电网大数据应用的关键技术在于电能预测。电力系统的建设规 划周期长,要尽可能时间电能量供应和需求的平衡,其中电力信息 预测发挥了重要应用,科学准确的电能信息预测决定了电力系统的 经济运行性。在大数据预测中通过相关对象变化的监控,利用数学 模型进行分析,即可对目标变量的变化趋势进行预测。常规的预测 方法往往选取有限的样本数据,根据行业的专有数据,对现有算法 ・12・电早世界 据进行分析,通过对数据内部联系的研究,更好的完成预测工作。电 力系统信息预测的工作重点已经从算法分析转变为大数据的提取上, 大数据算法相对简单有效,数据提取是重点,使用更具体详细的历史 数据,缩短取样时间提高样本数据的密度,同时,数据类型的选取更 加全面更加多样化,将更多的相关因素纳入预测设计库中。口 大数据要 求系统具有较强的包容性,可以对混乱的数据进行归一。利用大量混 杂而相互联系的数据有效的提高预测结果的精度。总起来讲,数据类 型越多,特征数据覆盖面越广,预测精度则越高。比如,在年度用电 量预测时加入经济方面的因素,在短期负荷预测中考虑加入地区气 象因素的影响,都有助于提高系统预测的准确性。l 3_2电网年度用电总量的预测 地区的用电总量和地区经济发展、国家以及地区电价等多 方面的因素密切相关。社会经济的高速发展离不开充足电力能源供 应的支持,电能消耗和地区经济有极强的关联性。统计经济数据要 从度入手,取地区总用电量和地区国民生产总值、地区人均生 产总值、大型生产型企业数量和企业进出口产品数量等各种经济指 标的特征关系,建立科学的数学计算模型,预测地区的用电总量。 为确保混杂数据执行分析预测地区用电总量的科学性,本文选择了 的某地30项经济数据实现地区年度用电量的预测分析,详细的指标 名称如表3—1所示。 表3—1年度用电量影响的经济数据指标表 编号 经济指标名称 编号 经济指标名称 A1 地区国民生产总值 A16 第三产业从业人员数量 A2 地区固定资产总投资 A17 第一产业从业人数比例 A3 大型生产企业 A18 第二产业从业人数比例 A4 地区固定资产人均投资 Al9 第三产业从业人数比例 A5 生产总值人均值 A20 地区企业的进出口总额 A6 第一产业年度生产总值 A21 地区企业出口总额 Pt7 第二产业年度生产总值 A22 地区企业进口总额 A8 工业企业年度生产总值 A23 地区人均消费水平 A9 第三产业年度生产总值 A24 乡村人均消费水平 A10 第一产业占生产总值比例 A25 城市人均消费水平 Al1 第二产业占生产总值比例 A26 市民人均可支配收入 A12 工业占生产总值比例 A27 市民人均总收入 A13 第三产业占生产总值比例 A28 年末地区总人口 A14 第一产业从业人员数量 A29 城市化水平 A15 第二产业从业人员数量 A30 地区失业率 表中的经济数据的单位和数量级各不相同,对社会经济情况从 不同方面进行了统计。地区用电总量和各种经济指标的统计是一个 动态累计的过程,包含的信息量极为丰富,相互间往往存在紧密的 联系。电力信息大数据预测的优越性在于加入了更多更加全面的相 关数据,使预测准结果更加准确。[4 1)电能预测的主成分分析法 在模型的建立和规律的统计过程中,需要对各指标的特征关系 和发展规律进行全面、准确的反映,防止重要信息的遗漏,对若干 联系紧密的指标进行研究。我们对地区年度总用电量和表3.1中的 经济数据的关联性进行讨论,表3 2中为地区年度耗电总量和一些 经济数据的相关系数。 ELECTRONICS WORLD・探索与观察 表3—2地区年度耗电总量影响的经济数据指标列表 用电量 A1 A2 A4 A7 A20 A24 A28 用电量 1.000 0.984 0.968 0.988 0.986 0.988 0.983 0.952 A1 0.984 1.000 0.997 0.998 0.998 0.994 0.999 0.907 A2 0.968 0.997 1.000 0.998 0.996 0.985 0.996 0.88l A4 0.988 0.998 0.998 1.000 0.996 0.986 0.996 0.876 A7 0.986 0.998 0.996 0.996 1.000 0.996 0.998 0.905 A20 0.988 0.992 0.983 0.986 0.996 1.000 0.992 0.907 A24 0.98l 0.999 0.996 0.996 0.998 0.998 1.000 0.902 A28 0.952 0.907 0.88l 0.876 0.906 0.907 0.904 1.000 主成分分析法可以将数个相关指标转换为几个少数的综合性 指标,利用数据的压缩和特征值的提取,实现变量间关系的简化和 统计。在变量信息基本保持不变的前提下,将原有的特征变量用少 数综合性的特征变量替代,从而在确保原有大部分数据信息的情况 下,数据量也有所降低。完成分析主成分以后,主成分数量比原有 变量少,使原有数据的相关性去除,使数据组得到简化,数据分析 的计算量也大大减少。主成分分析流程如下图所示。 l糕 麟辩 辩 ^ 一 …羹 l撼姆 糯健赫糯} . 一章 , 堆& 蝴糖惭盼梅 拯 肄j }蠛l耩趟蒜赣 摊 } 蕈 一 {求铸靠靛i誊!韩l艘糖越最鞋 辨赫l l特馘艋_撮韩摧瓣趣甓 l t ; 轷舔镟 缚钎 磷 { { 棚卷糙糕瞰黼黼獬 l t… 一一~~ … 一 …一 一一 一, 一 蚺l 生成分争擞 隶罐盔硪静艘 l 饿-侔脚 赣.断酶^ 图3.1分析主成分主要流程 主成分的特征值、方差贡献率和方差累积贡献率计算公式分别为 =4x=en +e +…+eip (2-1) :_生_了 xlO0% O0% (2-2) ∑ xl∞% (2-3) 计算求得各主成分的特征值、特征向量、方差贡献率和方差累 积贡献率等指标。前八个指标的具体数值如表3—3所示。 表3—3各主成分的方差贡献率和累积贡献率 成分 特征向量 特征值 方差贡献率(%) 方差累积贡献率(%) 1 24.193 80.644 80.644 2 3.150 10.504 91.149 3 1.43l 4.771 95.991 4 0.591 1 973 97.895 5 0.257 0.860 98.755 6 0.15O 0.504 99.260 7 0.092 0.309 99.570 8 0.061 0.207 99.778 从表中数据可以发现,伴随主主成分数量的不断增加,特征 值和方差贡献率逐渐减小。前五个主成分量的方差累积贡献率高达 98.765%,这五个成分已经可以对数据信息进行较为全面的了解。如 果用这五个数据代替整体数据,则数据分析可以实现极大的简化。 2)地区年度用电量的预测 用五个主成分变量进行预测分析,采用多元线性回归算法预测 地区年度用总电量。利用1996.2013年的耗电量数据记录和主成分 数值完成回归计算,计算出2014—2015年度用电量。拟合的一些用 电量和主成分数据如下表所示。 表3—4年度用电量与对应主成分列表 年份 用电量 主成分编号 亿kwh 1 2 3 4 5 08 2031.3O 32305.33 8650.56 1978.84 —13026.72 —23661.65 09 2387.15 36689.30 9452.29 629.31 一l28l8.24 —24089.65 10 2673.57 414l8.O0 10585.i7 一l31.48 一i3426.85 25807.54 1l 3004.04 47912.12 12434.i3 793.24 —15049.06 —29151.32 12 3394.06 54918.38 15389.04 158.O7 —19364.06 —36336.22 13 3506.79 58072.31 15769.87 —1441.8O —l8917.66 —36045.84 14 3609.65 65949.08 17297.81 —3881.43 —18695.58 —36803.28 l5 4060.14 32305.33 8650.56 I978.85 —13026.71 —23661.65 主成分分析在确保所有有用数据信息完整的前提下,实现了 数据的简化。由于用电量和表3一l中的经济数据具有正线性关系, 因此用多元线性回归计算对电量和主成分分析,实现年度电量的预 测。对1996.2013年的拟合数据曲线及2015—2016年的用电量预测曲 线趋势图如图3.2所示,2006—2015年的年度预测数值如表3—5所示。 卑舒 图3.2年度用电量拟合预测值与实际值比较 表3—5主成分分析拟合预测误差 年份 实际用电量 预测(拟合)用电量( 误差(%1 f亿kWh1 亿kWh1 06 2031-3O 2011.76 0 962 07 2387.15 2346.78 1.691 08 2673.57 2623 65 1.867 09 3004 04 2992.13 0.396 1O 3394.O6 3381.93 0.357 ll 3506.79 3648.53 4.O42 12 3609.65 3519.87 2.487 13 4060.14 4018.48 1.026 14 4399.O3 4419-36 0.462 15 4619.42 4637-30 0.387 从以上数据对比可以看出,预测结果误差还是比较小的。利用 特征值提取的方法将大数据问题进行了简化,数据的相关性得以消 除,数据维数对预测精度的影响消除,数据信息实现了最简化,使 数据处理分析过程变得简单同时预测结果却更加精确。用同样的方 法也可以对电网的短期用电量进行预测。 4结论 智能电网在运行过程中产生了大量的数据信息,本文介绍了智能 电网大数据的来源,运用主成分分析对电网年度预测进行了研究,具 有一定的实用价值。然而电网的大数据应用起步较晚,还处于研究阶 段,工程应用还不是特别成熟,还需要在应用中不断的探索和完善。 参考文献 [1】张锋军.大数据技术研究综述[刀.通信技术,2014,47(11):1240—1248. [2】张东霞,苗新,刘丽平等.智能电网大数据技术发展研究UJ_中国 电机工程学报,2015,(1):2—12. [3】王继业,张崇见 电力信息资源整合方法综述田.电网技术,2006, 30(9):83—87. 【4】周松林,茆美琴,苏建徽.基于主成分分析与人工神经网络的风 电功率预测U].电网技术,2005,35(9):128—132. 作者简介: 吴凯军(1977一),河北定州1人,工程师,现供职于国网凉山 供电公司信息通信公司。 电子世再 ・13・