一种基于增量主动学习的电费异常检测方法及其装置与流程
1.本发明涉及信息处理和电力营销技术领域,尤其涉及一种基于增量主动学习的电费异常检测方法及一种基于增量主动学习的电费异常检测装置。
背景技术:
2.现有的电费异常检测方法主要包括两类:一类是基于简单规则的异常检测方法,另一类是基于数据驱动的异常检测算法。
3.基于简单规则的异常检测算法主要依赖业务专家对业务中的常见问题进行归纳总结,形成形式化的语言描述,并通过程序语言中的逻辑运算对规则进行实现;基于数据驱动的异常检测算法往往不依赖于业务知识,通过引入各类归纳偏置构建有参或无参的算法模型,并依赖应用的数据实现模型的训练和调优,从而达到异常检测的目的,常见的异常检测算法包括基于样本距离度量的knn、ocsvm等,基于样本统计量的hbos、mcd等,基于集成方法的,如iforest,以及神经网络模型的算法,如autoencoder,vae等。
4.虽然现有的异常检测算法已经深入应用在电力营销的业务环节中,但现有的方法都存在着一定的不足。基于简单规则的异常检测方法主要应用于核算过程中的问题发现,此类方法不依赖于复杂的模型设计,通过简单的逻辑判定实现异常问题的挖掘,比如通过设计阈值策略来筛选出电量突增减的用户,具有高效研判、实现简单的特点,但此类方法的灵活性和可扩展性不高,比如当用户的算费数据受到季节性或地域性因素的影响时,规则无法自适应地根据当月数据进行调整,导致出现大量误报或漏报问题;并且基于规则的检测方法往往直接内嵌在算费代码中,更新和维护的成本高,迭代优化的风险成本高。基于数据驱动的异常检测算法虽然可以基于数据实现模型的自适应调整,但不少算费模型的计算复杂度高,无法满足算费时间效率上的要求,更多地应用在事后的问题核查和归因。并且这类算法需要面临数据质量问题的影响,当用于训练的数据质量不高时,模型的检测性能往往无法满足实际应用要求。此外,无论是基于过程问题发现的核算规则还是基于事后核查的算法模型,其构建和维护都依赖大量的人力成本,比如核算规则的迭代优化需要业务人员针对每月的异常数据进行分析归因,总结提炼规则优化内容,而对于数据驱动的算法模型,数据的获取和处理也占用了极大的人力成本,这些条件限制了现有的检测模型的性能,也难以满足愈加复杂多变的业务应用场景。
技术实现要素:
5.针对现有技术中的缺陷和不足,本发明提供了一种基于增量主动学习的电费异常检测方法,以解决现有技术中存在的现有电费异常检测算法灵活性低、构建及维护成本高、数据质量受限的问题。
6.作为本发明的第一个方面,提供一种基于增量主动学习的电费异常检测方法,所述基于增量主动学习的电费异常检测方法包括:步骤s1:获取多个目标用户的当前电费数据,每一所述目标用户的当前电费数据
包括档案数据、业务变更数据以及量价费数据;步骤s2:基于核算规则体系对所述目标用户的当前电费数据进行初次异常检测,如果所述目标用户的当前电费数据不触发异常规则,则直接输出目标用户无异常的检测结果;如果所述目标用户的当前电费数据触发所述异常规则,则输出多个目标用户中的疑似异常用户;步骤s3:基于svdd异常检测模型对所述疑似异常用户的电费数据进行二次异常检测,以得到疑似异常用户检测结果,并对所述疑似异常用户检测结果的不确定度进行判断,以确定是否输出所述疑似异常用户检测结果;步骤s4:如果所述疑似异常用户检测结果的不确定度低于预设阈值,则直接输出所述疑似异常用户的检测结果;如果所述疑似异常用户检测结果的不确定度高于所述预设阈值,则对该不确定度高的疑似异常用户的电费数据进行最终异常研判,输出该不确定度高的疑似异常用户中的正常用户。
7.进一步地,所述基于核算规则体系对所述目标用户的当前电费数据进行初次异常检测,如果所述目标用户的当前电费数据不触发异常规则,则直接输出目标用户无异常的检测结果;如果所述目标用户的当前电费数据触发所述异常规则,则输出多个目标用户中的疑似异常用户,还包括:根据所述核算规则体系中的每一条异常规则的定义,判定该条异常规则是否被所述目标用户的当前电费数据触发;对于所述目标用户的每一个当前电费数据,计算其触发异常规则的情况,将触发至少一条异常规则的目标用户,计入疑似异常用户,等待二次异常检测。
8.进一步地,还包括:选取所述核算规则体系中的多条异常规则开展验证;如果,则表示所述目标用户的当前电费数据x触发了第k条异常规则;如果则表示所述目标用户的当前电费数据x未触发第条异常规则;则每个所述目标用户的当前电费数据x的初步检测结果表示为,其中p表示所述核算规则体系中异常规则的数目。
9.进一步地,所述基于svdd异常检测模型对所述疑似异常用户的电费数据进行二次异常检测,以得到疑似异常用户检测结果,并对所述疑似异常用户检测结果的不确定度进行判断,以确定是否输出所述疑似异常用户检测结果,还包括:根据所述疑似异常用户所触发的异常规则,采用对应的svdd异常检测模型,计算所述疑似异常用户的电费数据与支持向量描述模型中心点之间的距离度量,并根据度量值对所述疑似异常用户进行二次研判,得到疑似异常用户检测结果;根据所述疑似异常用户的电费数据的异常分布特点,确定所述疑似异常用户检测结果的不确定度,对于该不确定度高的疑似异常用户的电费数据,需要进行人工再研判。
10.进一步地,还包括:对于每个所述目标用户的当前电费数据x的初步检测结果,如果,则表示多个目标用户中存在疑似异常用户,然后对所述疑似异常用户的电费数据进行二次
异常检测;根据每条异常规则对应的异常类别,实现了一个svdd异常检测模型表示第条异常规则对应的svdd异常检测模型,一共有p个svdd异常检测模型;假定所有正常电费数据在高维空间中被最小边界包围,位于最小边界上的电费数据被称为支持向量,通过svdd异常检测模型检测所述疑似异常用户的电费数据是否位于最小边界内来判定异常用户;基于信息熵公式计算svdd模型检测结果的不确定度。
11.进一步地,还包括:基于所述正常用户的电费数据,对所述svdd异常检测模型进行增量训练。
12.进一步地,所述档案数据包括用户的用电类型、市场化属性、电压等级、计量方式、运行容量、合同容量、定价策略类型、功率因数考核方式、基本电费计算方式、电源数量、电量计算方式、参与功率因数计算方式、临时用电标志、行业类别、用能类别和分时用电标志。
13.进一步地,所述业务变更数据包括新装增容、暂停、减容、改类、计量设备故障处理、改压、计量设备更换、暂停恢复、减容恢复和受电设施改造。
14.进一步地,所述量价费数据包括电价类型、输配电价、电度电价、加收电价、上次抄表示数、本次抄表示数、有功电量、需量示数、无功电量、基本电费、电度电费和力调电费。
15.作为本发明的第二个方面,提供一种基于增量主动学习的电费异常检测装置,所述基于增量主动学习的电费异常检测装置包括:获取模块,用于获取多个目标用户的当前电费数据,每一所述目标用户的当前电费数据包括档案数据、业务变更数据以及量价费数据;第一异常检测模块,用于基于核算规则体系对所述目标用户的当前电费数据进行初次异常检测,如果所述目标用户的当前电费数据不触发异常规则,则直接输出目标用户无异常的检测结果;如果所述目标用户的当前电费数据触发所述异常规则,则输出多个目标用户中的疑似异常用户;第二异常检测模块,用于基于svdd异常检测模型对所述疑似异常用户的电费数据进行二次异常检测,以得到疑似异常用户检测结果,并对所述疑似异常用户检测结果的不确定度进行判断,以确定是否输出所述疑似异常用户检测结果;第三异常检测模块,用于如果所述疑似异常用户检测结果的不确定度低于预设阈值,则直接输出所述本次疑似异常用户的检测结果;如果所述疑似异常用户检测结果的不确定度高于所述预设阈值,则对该不确定度高的疑似异常用户的电费数据进行最终异常研判,输出该不确定度高的疑似异常用户中的正常用户。
16.本发明提供的基于增量主动学习的电费异常检测方法具有以下优点:(1)将异常检测模型与现有的核算体系相结合,保留现有核算规则异常研判方式,通过引入数据驱动的异常检测模型突破了现有核算规则对于电费异常难以实现精准研判的性能瓶颈;(2)拓展了现有的异常研判模式,不同于单纯依赖规则研判或模型研判,而是提出了一种新方法将两者结合,既保证了模型可以通过数据实现自动迭代更新,拓展了模型的灵活性,又保证了模型在主动学习技术下,可以获取业务专家知识的支撑,拓展了模型的稳定性;
(3)通过增量学习策略,避免了检测模型在迭代更新过程中需要重新训练的弊端,每次模型更新仅需从每月的业务工作中获取增量数据,且数据选择过程由模型自主完成,免去了人工挑选数据的工作量。
附图说明
17.附图是用来提供对本发明的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本发明,但并不构成对本发明的限制。
18.图1为本发明提供的基于增量主动学习的电费异常检测方法的流程图。
19.图2为本发明提供的基于增量主动学习的电费异常检测方法的具体实施方式流程图。
具体实施方式
20.需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互结合。下面将参考附图并结合实施例来详细说明本发明。
21.为了使本领域技术人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
22.需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包括,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
23.在本实施例中提供了一种基于增量主动学习的电费异常检测方法,图1为本发明提供的基于增量主动学习的电费异常检测方法的流程图。如图1所示,所述基于增量主动学习的电费异常检测方法,包括:步骤s1:获取多个目标用户的当前电费数据,每一所述目标用户的当前电费数据包括档案数据、业务变更数据以及量价费数据;步骤s2:基于核算规则体系对所述目标用户的当前电费数据进行初次异常检测,如果所述目标用户的当前电费数据不触发异常规则,则直接输出目标用户无异常的检测结果;如果所述目标用户的当前电费数据触发所述异常规则,则输出多个目标用户中的疑似异常用户;需要说明的是,不触发异常规则指的是不触发所述核算规则体系中的任意一个异常规则,触发所述异常规则指的是触发所述核算规则体系中的任意一个或多个异常规则。
24.步骤s3:基于svdd异常检测模型对所述疑似异常用户的电费数据进行二次异常检测,以得到疑似异常用户检测结果,并对所述疑似异常用户检测结果的不确定度进行判断,以确定是否输出所述疑似异常用户检测结果;步骤s4:如果所述疑似异常用户检测结果的不确定度低于预设阈值,则直接输出
所述疑似异常用户的检测结果;如果所述疑似异常用户检测结果的不确定度高于所述预设阈值,则对该不确定度高的疑似异常用户的电费数据进行最终异常研判,输出该不确定度高的疑似异常用户中的正常用户。
25.需要说明的是,基于主动学习策略,对该不确定度高的异常用户进一步开展人工研判(根据专家经验运行的一套研判机制),得到最终异常用户。
26.下面结合图2对本发明提供的基于增量主动学习的电费异常检测方法的具体实施过程进行详细说明。
27.优选地,所述基于核算规则体系对所述目标用户的当前电费数据进行初次异常检测,如果所述目标用户的当前电费数据不触发异常规则,则直接输出目标用户无异常的检测结果;如果所述目标用户的当前电费数据触发所述异常规则,则输出多个目标用户中的疑似异常用户,还包括:根据所述核算规则体系中的每一条异常规则的定义,判定该条异常规则是否被所述目标用户的当前电费数据触发;对于所述目标用户的每一个当前电费数据,计算其触发异常规则的情况,将触发至少一条异常规则的目标用户,计入疑似异常用户,等待二次异常检测。
28.优选地,还包括:选取所述核算规则体系中的多条异常规则开展验证;需要说明的是,选取现有核算规则体系中每月触发次数排名靠前的12条异常规则开展算法验证。
29.如果,则表示所述目标用户的当前电费数据x触发了第k条异常规则;如果则表示所述目标用户的当前电费数据x未触发第k条异常规则;则每个所述目标用户的当前电费数据x的初步检测结果表示为,其中p表示所述核算规则体系中异常规则的数目。
30.优选地,所述基于svdd异常检测模型对所述疑似异常用户的电费数据进行二次异常检测,以得到疑似异常用户检测结果,并对所述疑似异常用户检测结果的不确定度进行判断,以确定是否输出所述疑似异常用户检测结果,还包括:根据所述疑似异常用户所触发的异常规则,采用对应的svdd异常检测模型,计算所述疑似异常用户的电费数据与支持向量描述模型中心点之间的距离度量,并根据度量值对所述疑似异常用户进行二次研判,得到疑似异常用户检测结果;同时,为了保证异常用户不被误判,即使异常用户已经被模型研判为异常,仍需根据所述疑似异常用户的电费数据的异常分布特点,确定所述疑似异常用户检测结果的不确定度,对于该不确定度高的疑似异常用户的电费数据,需要进行人工再研判。
31.由于模型研判过程伴随着实际业务工作,因此异常样本的人工再研判的模式与当前基于核算规则的业务人员再研判模式保持一致,其优点在于引入的不确定度度量进一步削减了需要人工研判的异常量,同时伴随模型的扩充完善,未知异常分布的样本会被模型通过添加到支持向量集合的方式完成模型记忆,因此,人工研判的工作量会不断降低。
32.优选地,还包括:
对于每个所述目标用户的当前电费数据x的初步检测结果,如果,则表示多个目标用户中存在疑似异常用户,然后对所述疑似异常用户的电费数据进行二次异常检测;根据每条异常规则对应的异常类别,实现了一个svdd异常检测模型,用fk表示第k条异常规则对应的svdd异常检测模型,一共有p个svdd异常检测模型,svdd异常检测模型包含一组支持向量集合和模型参数;假定所有正常电费数据在高维空间中被最小边界包围,位于最小边界上的电费数据被称为支持向量,通过svdd异常检测模型检测所述疑似异常用户的电费数据是否位于最小边界内来判定异常用户;上述过程形式化描述为,其中z指代用于训练的电费数据样本,如果,则所述疑似异常用户的电费数据是异常点,其中表示在高维空间中所述疑似异常用户的电费数据最小边界包围中心之间的平方和距离度量,表示最小边界包围空间的半径度量,r2可以根据支持向量求解获得;p个检测模型对应输出的异常用户检测结果可以得到一个向量集合,其中,之后基于信息熵公式计算检测结果的不确定度,其中;如果不确定度h(q)大于设定的经验阈值,则通过人工研判环节来进行最终研判,研判结果记为,其中。如果则表示最终异常用户的电费数据确实不存在第k类规则下的异常,将正常用户的电费数据加入到集合xk中。在每次完成一批新用户检测后,将得到p个样本集合{}。xk指的是不触发第k类异常规则的所有正常用户的电费数据。
33.优选地,还包括:基于所述正常用户的电费数据,对所述svdd异常检测模型进行增量训练。
34.具体地,根据集合xk对p个svdd异常检测模型进行增量训练,训练方式采用fisvdd算法,对于单个svdd模型,假定原模型的特征向量集合为s
tk
,其构成的相似度矩阵记为a
t
,其中t为训练轮次的指代,参数向量记为,对于每个来自样本集合xk的新增样本z,svdd异常检测模型的训练过程如下:(1)根据判定当前样本z是否在当前检测模型参数下被判定为异常样本,如果,则样本z是异常样本,则进入步骤(2),如果,则直接继续考察
下一个样本;(2)将当前异常样本z加入到支持向量集合中,并更新相似度矩阵:,同时更新模型参数,更新公式为,其中表示全1向量。为了简化计算过程,可以通过和实现增量计算:,其中,而,和为用于简化模型表示的中间变量。
35.(3)如果,则表示当前的参数不符合模型最小包围的假设,至少有一个支持向量在当前包围内部,需要对模型进行调整,将不符合要求的支持向量剔除支持向量集,并重新计算步骤(2)中的模型参数。
36.详细训练流程如下:输入:svdd模型参数α
tk,
支持向量集s
tk
,增量训练样本集tk;输出:更新后的模型参数α
t+1k
和支持向量集s
t+1k
;step 1: 按样本存储顺序依次获取训练样本集合中的单个样例z;step 2: 根据支持向量集s
tk
计算训练样例z是否位于支持向量集所构成的样本空间内;step 3: 根据步骤2的判定结果生成扩充样本集:如果样例z落入在样本空间中,则舍弃该样本,否则将该样本与原有的支持向量集合形成扩充样本集;step 4: 根据扩充样本集形成的相似度矩阵计算模型参数α
t+1k
,并通过对模型参数的数值约束完成对扩充样本集的修正,将扩充样本集划分成新的支持向量集合和保留集合;step 5: 对保留集合中的样本开展二次数据校核,将满足条件的样本重新加入到支持向量集合,形成最终的支持向量集s
t+1k
,并依据最新的支持向量集合更新对应的模型参数α
t+1k
。
37.优选地,所述档案数据包括用户的用电类型、市场化属性、电压等级、计量方式、运行容量、合同容量、定价策略类型、功率因数考核方式、基本电费计算方式、电源数量、电量计算方式、参与功率因数计算方式、临时用电标志、行业类别、用能类别、分时用电标志等。
38.优选地,所述业务变更数据包括新装增容、暂停、减容、改类、计量设备故障处理、改压、计量设备更换、暂停恢复、减容恢复、受电设施改造等。
39.优选地,所述量价费数据包括电价类型、输配电价、电度电价、加收电价、上次抄表示数、本次抄表示数、有功电量(总)、有功电量(尖峰)、有功电量(峰)、有功电量(平)、有功电量(谷)、需量示数、无功电量(总)、基本电费、电度电费、力调电费等。
40.作为本发明的另一个实施例,提出了一种基于增量主动学习的电费异常检测装置,所述基于增量主动学习的电费异常检测装置包括:获取模块,用于获取多个目标用户的当前电费数据,每一所述目标用户的当前电费数据包括档案数据、业务变更数据以及量价费数据;第一异常检测模块,用于基于核算规则体系对所述目标用户的当前电费数据进行
初次异常检测,如果所述目标用户的当前电费数据不触发异常规则,则直接输出目标用户无异常的检测结果;如果所述目标用户的当前电费数据触发所述异常规则,则输出多个目标用户中的疑似异常用户;第二异常检测模块,用于基于svdd异常检测模型对所述疑似异常用户的电费数据进行二次异常检测,以得到疑似异常用户检测结果,并对所述疑似异常用户检测结果的不确定度进行判断,以确定是否输出所述疑似异常用户检测结果;第三异常检测模块,用于如果所述疑似异常用户检测结果的不确定度低于预设阈值,则直接输出所述本次疑似异常用户的检测结果;如果所述疑似异常用户检测结果的不确定度高于所述预设阈值,则对该不确定度高的疑似异常用户的电费数据进行最终异常研判,输出该不确定度高的疑似异常用户中的正常用户。
41.综上所述,本发明提供的基于增量主动学习的电费异常检测方法,结合了现有核算规则体系和主流的异常检测模型svdd,解决当前核算规则体系命中率低、无法应用业务数据自主完成模型迭代更新的问题。
42.可以理解的是,以上实施方式仅仅是为了说明本发明的原理而采用的示例性实施方式,然而本发明并不局限于此。对于本领域内的普通技术人员而言,在不脱离本发明的精神和实质的情况下,可以做出各种变型和改进,这些变型和改进也视为本发明的保护范围。
技术特征:
1.一种基于增量主动学习的电费异常检测方法,其特征在于,所述基于增量主动学习的电费异常检测方法包括:步骤s1:获取多个目标用户的当前电费数据,每一所述目标用户的当前电费数据包括档案数据、业务变更数据以及量价费数据;步骤s2:基于核算规则体系对所述目标用户的当前电费数据进行初次异常检测,如果所述目标用户的当前电费数据不触发异常规则,则直接输出目标用户无异常的检测结果;如果所述目标用户的当前电费数据触发所述异常规则,则输出多个目标用户中的疑似异常用户;步骤s3:基于svdd异常检测模型对所述疑似异常用户的电费数据进行二次异常检测,以得到疑似异常用户检测结果,并对所述疑似异常用户检测结果的不确定度进行判断,以确定是否输出所述疑似异常用户检测结果;步骤s4:如果所述疑似异常用户检测结果的不确定度低于预设阈值,则直接输出所述疑似异常用户的检测结果;如果所述疑似异常用户检测结果的不确定度高于所述预设阈值,则对该不确定度高的疑似异常用户的电费数据进行最终异常研判,输出该不确定度高的疑似异常用户中的正常用户。2.根据权利要求1所述的基于增量主动学习的电费异常检测方法,其特征在于,所述基于核算规则体系对所述目标用户的当前电费数据进行初次异常检测,如果所述目标用户的当前电费数据不触发异常规则,则直接输出目标用户无异常的检测结果;如果所述目标用户的当前电费数据触发所述异常规则,则输出多个目标用户中的疑似异常用户,还包括:根据所述核算规则体系中的每一条异常规则的定义,判定该条异常规则是否被所述目标用户的当前电费数据触发;对于所述目标用户的每一个当前电费数据,计算其触发异常规则的情况,将触发至少一条异常规则的目标用户,计入疑似异常用户,等待二次异常检测。3.根据权利要求2所述的基于增量主动学习的电费异常检测方法,其特征在于,还包括:选取所述核算规则体系中的多条异常规则开展验证;如果,则表示所述目标用户的当前电费数据x触发了第k条异常规则;如果则表示所述目标用户的当前电费数据x未触发第k条异常规则;则每个所述目标用户的当前电费数据x的初步检测结果表示为,其中p表示所述核算规则体系中异常规则的数目。4.根据权利要求3所述的基于增量主动学习的电费异常检测方法,其特征在于,所述基于svdd异常检测模型对所述疑似异常用户的电费数据进行二次异常检测,以得到疑似异常用户检测结果,并对所述疑似异常用户检测结果的不确定度进行判断,以确定是否输出所述疑似异常用户检测结果,还包括:根据所述疑似异常用户所触发的异常规则,采用对应的svdd异常检测模型,计算所述疑似异常用户的电费数据与支持向量描述模型中心点之间的距离度量,并根据度量值对所述疑似异常用户进行二次研判,得到疑似异常用户检测结果;
根据所述疑似异常用户的电费数据的异常分布特点,确定所述疑似异常用户检测结果的不确定度,对于该不确定度高的疑似异常用户的电费数据,需要进行人工再研判。5.根据权利要求4所述的基于增量主动学习的电费异常检测方法,其特征在于,还包括:对于每个所述目标用户的当前电费数据x的初步检测结果r,如果,则表示多个目标用户中存在疑似异常用户,然后对所述疑似异常用户的电费数据进行二次异常检测;根据每条异常规则对应的异常类别,实现了一个svdd异常检测模型,用f
k
表示第k条异常规则对应的svdd异常检测模型,一共有p个svdd异常检测模型;假定所有正常电费数据在高维空间中被最小边界包围,位于最小边界上的电费数据被称为支持向量,通过svdd异常检测模型检测所述疑似异常用户的电费数据是否位于最小边界内来判定异常用户;基于信息熵公式计算所述疑似异常用户的电费数据的不确定度。6.根据权利要求1所述的基于增量主动学习的电费异常检测方法,其特征在于,还包括:基于所述正常用户的电费数据,对所述svdd异常检测模型进行增量训练。7.根据权利要求1所述的基于增量主动学习的电费异常检测方法,其特征在于,所述档案数据包括用户的用电类型、市场化属性、电压等级、计量方式、运行容量、合同容量、定价策略类型、功率因数考核方式、基本电费计算方式、电源数量、电量计算方式、参与功率因数计算方式、临时用电标志、行业类别、用能类别和分时用电标志。8.根据权利要求1所述的基于增量主动学习的电费异常检测方法,其特征在于,所述业务变更数据包括新装增容、暂停、减容、改类、计量设备故障处理、改压、计量设备更换、暂停恢复、减容恢复和受电设施改造。9.根据权利要求1所述的基于增量主动学习的电费异常检测方法,其特征在于,所述量价费数据包括电价类型、输配电价、电度电价、加收电价、上次抄表示数、本次抄表示数、有功电量、需量示数、无功电量、基本电费、电度电费和力调电费。10.一种基于增量主动学习的电费异常检测方法装置,其特征在于,所述基于增量主动学习的电费异常检测装置包括:获取模块,用于获取多个目标用户的当前电费数据,每一所述目标用户的当前电费数据包括档案数据、业务变更数据以及量价费数据;第一异常检测模块,用于基于核算规则体系对所述目标用户的当前电费数据进行初次异常检测,如果所述目标用户的当前电费数据不触发异常规则,则直接输出目标用户无异常的检测结果;如果所述目标用户的当前电费数据触发所述异常规则,则输出多个目标用户中的疑似异常用户;第二异常检测模块,用于基于svdd异常检测模型对所述疑似异常用户的电费数据进行二次异常检测,以得到疑似异常用户检测结果,并对所述疑似异常用户检测结果的不确定度进行判断,以确定是否输出所述疑似异常用户检测结果;第三异常检测模块,用于如果所述疑似异常用户检测结果的不确定度低于预设阈值,则直接输出所述本次疑似异常用户的检测结果;如果所述疑似异常用户检测结果的不确定度高于所述预设阈值,则对该不确定度高的疑似异常用户的电费数据进行最终异常研判,
输出该不确定度高的疑似异常用户中的正常用户。
技术总结
本发明涉及信息处理和电力营销技术领域,具体公开了基于增量主动学习的电费异常检测方法,包括:对获取到的多个目标用户的当前电费数据进行初次异常检测,如果触发异常规则,则输出多个目标用户中的疑似异常用户;对疑似异常用户的电费数据进行二次异常检测,以得到疑似异常用户检测结果,如果疑似异常用户检测结果的不确定度低于预设阈值,则直接输出疑似异常用户检测结果;如果高于预设阈值,则对不确定度高的疑似异常用户的电费数据进行最终研判,输出该不确定度高的疑似异常用户中的正常用户。本发明还公开了基于增量主动学习的电费异常检测装置。本发明能够解决当前核算规则体系命中率低、无法应用业务数据自主完成模型迭代更新的问题。迭代更新的问题。迭代更新的问题。