首页作文素材好词好句历史典故写作技巧考场素材单元作文英语作文小升初作文名人故事时事论据 名言警句范文大全精美散文
小学作文
初中作文
高中作文
作文体裁

城镇燃气用户异常数据分析方法

时间:2023-07-06 00:00:06 来源:爱作文网  爱作文网手机站

王 勋,乔 佳,陈婷婷,王倩微,丁 斌

(北京市燃气集团研究院,北京 100011)

城镇燃气商业用户存在一些用气异常的用户,原因可能是装修、停业、更换设备、改变经营类型、偷盗气等,这些异常用户存在管理困难和安全风险。需加强对商业用户的重点监察,除进行日常运营巡检外也可以利用数据分析的手段进行诊断和识别,有效缩小排查范围。异常的用气行为必然产生异常的用气数据,用户用气数据的分析是监控用户用气行为的重要方式。

城镇燃气用气数据的诊断分析方法主要有对比法、绘图法、指标法、分类法、聚类法。本文对这些方法进行分析总结。

2.1 对比法

该法主要是以用户的历史数据特征作为基准,分析出用户的用气规律及指标特征。搜集用户历史用气数据,以7 d为更新周期,计算定长时间如30 d的时、日、月不均匀系数、日均用气量及最大最小用气量等。以日均用气量为例,将最近30 d日用气量均值与上1周期(7 d前)30 d日用气量均值对比,设定两者偏差范围为±10%,以此判断用户变化是否正常。偏差范围可依据用户数量及巡查工作量设定。

2.2 绘图法

该法以用户历史用气数据的时间序列为基础,采用算法建模拟合用户用气数据变化规律,算法应具备一定的稳定性和准确度,并计算算法的相对误差δ0作为评判基准。监控时,采用绘图法绘制出预测值、实际值曲线,采用算法预测用户用气量得到预测值,设定预测值相对误差限值,当预测值相对误差绝对值高于该限值,则认为算法预测失效。对一定时间内算法预测失效发生的次数进行累计,设为m,设定算法预测失效发生次数最大允许值为m0,若m大于m0则认为用户用气异常。数据拟合的方法有回归、时间序列、神经网络、小波分析、机器学习,可采用组合算法或集成算法提高准确率。

2.3 指标法

对用户的某项指标进行统计,然后根据指标范围设定最小值及最大值,超出该范围的用户属于需重点监控用户。以城镇燃气供暖用户为例,供暖用户的用气指标通常采用供暖期单位面积用气量。先通过抽样的方法选定样本用户,搜集用户的供暖面积和供暖期用气量,得到每个样本用户供暖期单位面积用气量,后通过箱形图[1]或拉依达准则(3σ准则)[2]进行判断。

在箱形图中,记Q1为1/4分位数,Q3为3/4分位数,IQR表示Q3-Q1,将小于Q1-1.5IQR或大于Q3+1.5IQR的数据作为离群点,该用户即异常用气用户。

拉依达准则是在假定数据服从正态分布的前提下,用户用气指标一般情况满足或者近似满足这一要求。数据标准差用σ表示,数据均值用μ表示。正态分布的特点是65%的数据分布在(μ-σ,μ+σ)内,95%的数据分布在(μ-2σ,μ+2σ)内,99%的数据分布在(μ-3σ,μ+3σ)内[3],以此作为判断依据,数据超大或者超小都属于异常用气。

2.4 分类法

该法通过搜集异常用户用气数据,建立1个包含异常用户用气数据和正常用户用气数据的样本库。该法的特点是有监督判别,已知样本库中异常用户用气数据、正常用户用气数据、判定结果,将待判定用户用气数据与样本库中的数据进行对比,分析数据的相似度,若与正常用户用气数据相似则该用户正常,与异常用户用气数据相似则判定为异常。分析相似度的方法有逻辑回归、BP神经网络、决策树、支持向量机(SVM)等[4-6]。

2.5 聚类法

该法主要原理是同类型用户具有相同的用气特征,将同类型用户作为一组,组中用户数量记为m。依据用户用气数据及相关信息(如面积、设备功率、座位数、床位数、房间数、人数等),计算出特征指标(如单位面积用气量、单位功率用气量等)。通过数学方法提取出该组用户更多共同特征(如时序数据和平均温度的相关系数、时序数据的最大波动系数、标准差、峰度、各阶自相关系数的聚合统计特征、近似熵、复杂度、傅里叶变换的质心、傅里叶变换的方差等),同样计算出特征指标。特征指标数量记为n。同组每个用户都得到1个n维特征向量,记为Vj=(f1,f2,…,fi,…,fn),其中Vj(j=1,2,…,m)表示第j个用户的特征向量,fi(i=1,2,…,n)为特征指标。以同组每个用户的特征向量为参数,采用聚类算法如Mean-shift、层次聚类、Birch等,聚类结果将同组中的大部分用户聚集成一簇或多簇,并有少量离群点,则离群点判断为异常用户。

对比法和绘图法,数据要求比较简单,若单个用户从某个时段开始,数据出现异常变化,对比法很容易发现,但对于存在长期偷盗气行为无法判别。

指标法判断逻辑严密,但需要核查用户的基础信息和经营信息,这些信息变化快、难以获得或不准确,可能会产生误判。

分类法需要建立包含异常用户用气数据的样本库,异常用气用户特点多,需要的样本数量较大,使建模难度增大。

聚类法对数据质量和粒度要求较高,对用户的基础信息要求较少,利于模型建立和应用,用户类别划分越细精度越高。

以上方法在实际运用过程中各有优势,可根据数据和用户信息条件,采用不同算法进行综合判断。

近年来,在实现数字化管理方面,广州燃气、深圳燃气、合肥燃气、郑州燃气等都已实现大量商业用户和居民用户的数据采集,并在此基础上开发了数据驾驶舱或平台。各类流量计、调压器、温度计、报警器、收费系统、用户服务系统、监控系统等产生了大量的数据,亟需对数据进行有效管理和利用。数据质量是数据分析的基础,决定了数据整体价值,本文认为需从采集源头进行管理,数据采集管理和应用流程分为3步。

① 核实数据有效性

当数据录入系统时,不论工录入还是远程采集录入,数据管理系统应首先判断数据的合理性和有效性。这一过程可以利用指标法,当出现不合理数据时,应有管理机制核实数据,保证录入系统数据的有效性。同时,也能在核实过程发现采集设备、燃气设备、用户等存在的问题或隐患,及时解决。

② 分析单个用户数据

在保证用户数据有效性的情况下,可以对用户数据进行分析。应用对比法、绘图法可以对单个用户的用气行为进行分析。

③ 分析同类用户

对同类用户进行分析,通过提取高阶指标,采用分类法、聚类法或其他算法建模,对同类用户指标进行建模,缩小异常用户范围,进行重点监督和分析。

通过有效的数据,既可以结合用户信息得到高阶指标(高阶指标可用于燃气企业的规划、设计及预测调度等方面),也可以与水、电、天气、经济、交通、财务或其他外部数据进行关联分析,反映企业发展的相关关系,挖掘企业发展方向,预测变化趋势,为企业决策提供依据,也可应用于智慧城市的建设。

猜你喜欢 气量燃气聚类 对一起燃气泄漏爆炸引发火灾的调查水上消防(2022年2期)2022-07-22教材《燃气工程施工》于2022年1月出版煤气与热力(2022年4期)2022-05-23近期实施的燃气国家标准煤气与热力(2022年4期)2022-05-23探讨燃气工程的造价控制及跟踪审计大众投资指南(2021年23期)2021-12-06页岩超临界态吸附气量计算模型西南石油大学学报(自然科学版)(2019年5期)2019-12-20气量可以学习吗意林·全彩Color(2019年8期)2019-11-13基于K-means聚类的车-地无线通信场强研究铁道通信信号(2019年6期)2019-10-08大港油田稳步提高产气量 提前4个月完成全年指标录井工程(2017年3期)2018-01-22气量三层次领导文萃(2017年10期)2017-06-05基于高斯混合聚类的阵列干涉SAR三维成像雷达学报(2017年6期)2017-03-26

推荐访问:城镇 燃气 异常

版权声明:

1、本网站发布的作文《城镇燃气用户异常数据分析方法》为爱作文网注册网友原创或整理,版权归原作者所有,转载请注明出处!

2、本网站作文/文章《城镇燃气用户异常数据分析方法》仅代表作者本人的观点,与本网站立场无关,作者文责自负。

3、本网站一直无私为全国中小学生提供大量优秀作文范文,免费帮同学们审核作文,评改作文。对于不当转载或引用本网内容而引起的民事纷争、行政处理或其他损失,本网不承担责任。

热门专题