基于机器学习的电网工程量计价预测模型

更新时间:2023-06-24 01:34:17 阅读: 评论:0

Vol. 43 No. 3Mny. 2 0 2 1
第43卷第3期
2 02 1年5月
沈阳工业大学学报
Journal  of  Shenyang  University  of  Technology
厂+“+“+“+•殏 dot  : 10.7688/j. issn. 1000 -1646. 2221.03.01
99宿舍六级成绩查询+电气工程t
基于机器学习的电网工程量计价预测模型*
收稿日期:ZOZl  -01 -12.
基金项目:湖南省科技计划项目(S2219CXCPB2464).
作者简介:肖立华(066 -),湖南宁乡人,教授级高级工程师,硕士,主要从事电力高电压系统等方面的研究.
*本文已于2221 -04 - 22 10: 2 在中国知网优先数字出版.网络出版地址:http : 〃 kns. cnOI. net/kcms/detail/21. 1189. T.24212421.1032. 710. htmi
肖立华1张 博2,胡 伟2,陈继军3,韩智忠4
(1.清华大学电机工程系,北京100084; 2.国网湖南省电力有限公司建设部,长沙410024; 3.湖南电力工程咨询有限公司,长沙
410110; 4.湖南华杰工程咨询有限公司,长沙410000)
摘要:针对电网工程量清单计价方法中,综合单价计价基础不合理、确定流程繁琐、调整不科学
等问题,提出了一种基于机器学习算法的综合单价预测模型.通过研究电网工程量清单的计价规
则以及综合单价的组成成分,分析了综合单价的影响因素,建立了基于决策树的随机森林模型,并 在市场价格波动的情况下对综合单价实现预测.选取100个电网工程项目进行模型训练及测试.
结果表明,评价指标MAPE 为0 55% ,MAE 为9. 46.验证了该预测模型的正确性及可行性,为合理
确定电网工程价格提供了新的思路1
关 键词:电网工程;工程量清单;预测模型;综合单价;机器学习;计价规则;随机森林;市
场价格波动
中图分类号:TM 76
文献标志码:A  文章编号:1000 -1646(2021 )03 -0241 -04
Forecasting  model  for  power  grid  engineering  quantity
pricing  bal  on  machine  lecrning
XIAO  Li-hun 0,ZHANG  Bo 2,HU  Wet 2,CHEN  Ji-jun 3,HAN  Zhi-zhoug 4
(1. Depanment  of  Elecyical  Engineering ,Tsinghun  University ,Ben —g  100084,Chinn ; 2. Ministrn  of  Coostnichoo ,State
Grit  Hunan  Electee  Powes  Co. Ltr., Changshn  410004,Chinn ; 3. Hunan  Electee  Powes  Engineering  CoosnOing  Co. Ltr., Changshn  410116, Chinn ; 4, Hunan  Huajin  Engineering  ConsnOiny  Co. Lti., Changshn  410000,Chinn )
Abstreci : In  orSer  tn  solve  the  pToblemt  of  unreasonanie  pTicing  basit , camplicatee  determyatiou  process  ang  uyscientifie  adustmeei  of  00X1^)1010000 unii  price  in  the  pricing  for  engiyeering  quantity  1110 of  power  grin ,
n  cempTeheyOe  unii  price  forecasting  model  bar  or  machine  learning  aleorithm  wns  pTopod  n
compTeheyOe  understanying  oO  pricing  rules  oO  ehgiyeehng  quantity  biOs  ang  he  8X1100000 oO  compTeheesOe
unii  price , the  influencing  factors  oO (011100110000 unii  price  were  analyzer . n  ranOom  foresi  moUel  bar  ou
decisiou  hee  wcs  esnCOshen ,anO  the (011100110000 unii  price  unOer  the  situatiou  of  marker  price  fluctuatiou
wcs  forecaster. 100 power  griC  pTojeclu  were  lectee  Ou  mouel  Uaining  anO  testing. The  osu O s  show  0^0 Oe
evaluatiou  inOex  MAPE  is  1. 45% and  MAE  is  9. 46. The  cauectoess  anO  feasibilitz  of  as-ho
pon  forecasting  mous  are  veVfieV ,providing  c  new  iOec  for  reasouanic  determinatiou  of  power  griO  projeaO  puce.
Key  word : power  gkO  engioeeTOg  ; bit  of  engioeekng  quantity  ; forecasting  moUee  ; 001110100X800 unii
price  ; machine  learning  ; pricing  o O  . raneom  foresi  ; market  price  fluctuatiou
《电力建设工程工程量清单计价规范》是电 程的招投标计价行为,促进了电网建设招投标市
网工程建设的经济标准,并进一步规范了电网工
场健康有序协调发展[1].工程量清单U -3是目前
242沈阳工业大学学报第43卷
国际上通用的一种招投标方式,招标人在投标前根据项目情况提供工程量清单,投标人根据工程量清单及相关要求计算综合单价.采用工程量清单模式招投标,能充分体现量价分离、风险共担的原则,逐步放开价格,形成市场竞争机制.招标人承担工程量变更的风险,投标人承担价格风险,因此综合单价的确定是工程量清单计价的核心内容,是投标人能否中标、盈利的关键.
胡丹萍⑷利用层次分析法建立了基于风险动态量化的综合单价预测模型,以工程项目施工阶段为划分,计算每一阶段的综合单价风险系数;王维方等[7]分析了综合单价的风险因素,将三角模糊数引入构建风险因素的判断矩阵,计算出风险因素的权重,利用模糊综合评价法结合投标人的预期利润率得到综合单价的综合风险系数;刘必君7]分析了工程施工成本的主要影响因素及控制因素,通过构建影响因素指标体系明确影响施工成本的各个组成部分,选取栈式降噪自动编码器算法进行成本预测.
以上这些研究均未考虑市场价格波动的影响,缺乏市场主导性.本文在市场价格波动的基础上,根据市场信息和已建电网工程项目的造价数据和资料,在工程量清单计价模式下采用机器学习-随机森林算法构建预测模型.对影响综合单价的因素进行预测,编写Python程序实现预测模型的仿真分析,得到电网工程的综合单价.
1综合单价影响因素
1.1工程量清单计价规则
工程量清单计价规则是目前电网工程项目招投标普遍推广的一种计价方式.招标人根据电网工程招投标文件的要求和工程图纸,按照电力行业统一的工程量计算规则及工程项目划分,为投标人提供电网工程项目的实体工程量清单和技术措施;投标人根据招标人提供的工程量清单及施工组织方案,并结合
工程情况且考虑企业自身管理水平、技术水平、设备水平,综合各种风险因素,以自主报价的方式填报规定计量单位项目的综合单价,以此作为工程结算时价格调整的依据.
工程量清单计价实施搜集的资料包括完整的工程施工图纸、工程计价依据、市场价格信息、人工费调整文件等.工程量的计算是最终工程造价计算的基础,其工作量庞大且繁琐,因此,应在计算过程中添加层次、位置、轴线等标注,以便清晰地按照顺序逐项计算,防止复算和漏算.
工程造价包括分部/分项工程费、措施项目费、其他项目费、零星项目费、规费项目费以及税金的计算,最后,对工程造价款进行复核并编制相关情况说明,包括但不限于工程量清单的编制依据、工程图纸编号、计价规则依据等.
11综合单价组价分析
综合单价7J指完成一个单位清单项目需要的人工费、材料和工程设备费、施工机具使用费、企业管理费、利润以及可能存在的风险费.人工费主要受日工价格影响;材料和工程设备费随着所有清单项目中材料和设备的价格变化而变化,并且波动性较大,风险性较高;施工机具使用费同样受材料价格的影响,主要包括水电费、油价的波动;企业管理费和利润无论采用何种综合单价计算方式,均是在人工费、材料和工程设备费、施工机具使用费三者之间的组合基础上乘以对应的费率(利率)来进行计算的.因此,人工费、材料和工程设备费、施工机具使用费是综合单价的重要组成部分及影响因素.
2机器学习
机器学习[11-12〕是一门集计算机学、统计学、概率学、经济学等多领域学科为一体的综合交叉学科•本质上属于算法范畴,通过确定一个目标函数/,使输入变量x到输出变量『可以形成最优映射.
根据算法的功能和形式的类似性,机器学习常见算法包括回归类的最小二乘法、以决策树为基础的集成算法、基于概率论的朴素贝叶斯及适用于推荐关联规则的人工神经网络等.综合单价预测模型属于有监督学习,需要标识数据,回归类、决策树类、贝叶斯类、人工神经网络类算法均可适用于预测模型.综合单价的主要影响因素均属于典型的时间序列[13'15],且样本数据集较小,因此,选择决策树类中随机森林算法进行预测.
3综合单价预测模型
3.1数据预处理
电网工程项目中,综合单价相关的信息数据基本由人工进行采集,存在一定的缺失及异常值.数据建模的前提是要保证数据的准确性及完整性,因此需要对数据进行预处理.本文采用箱线图方法进行异常值的判定,采用线性填充法进行缺失值的处理.图1为某地混凝土C33从2215年
第3期肖立华,等:基于机器学习的电网工程量计价预测模型243
1月到2219年12月的月均价格,明显可以看到2217年5月,混凝土C33的价格为522元/m3,远高于其余月均价格,属于异常值.
图1混凝土C30价格
Fig.1Concrete C30price
采用箱线图的方式对该异常判定进行量化,即
R=U-L(1)
U lim=U+1.5R(2)
L lm=L-1.5R(3)式中:U为该组数据的上四分位数;L为该组数据的下四分位数;U m为上界值;L’m为下界值.计算该组数据的中位数及均值,绘制箱线图如图2所示.其中“X”表示均值,高于上界值或低于下界值均判定为异常值.异常值可视为缺失值处理,采用线性方式对缺失值进行填充.2217年5月的混凝土C30价格填充为2217年4月与2217年6月的均值353.8元/m3.
®--------------异常值(520元/n?)
citadel------------------上界(494.15元/m‘)
-----------------上四分位(408.8元/m‘)
-W--------------------中位(379.57E/m3)
-----------------下四分位(351.9元/m)
-----------------下界(266.55%/m3)
图2混凝土C30价格箱线图
Fig.2Boxploe of ccncrett C33price
3.2基于随机森林算法的预测模型
随机森林是一种以决策树为基础的评估器袋装式集成算法,随机森林模型的构建流程如图5所示.输入容量为N、特征为M的样本,随机且有放回地抽取N次,每次抽取一个样本,作为一棵决策树跟节点处样本;随机选择m个特征(mW M),由于综合单价的预测属于回归问题,通常采取方差或最小二乘拟合法进行节点分裂,直到节点不能继续分裂形成一棵决策树;当决策树的棵树小于设定值,重复以上步骤继续建立决策树,直至达到设定值,形成森林.
C容量为N、特征为M的样本J
随机抽样训练决策树
随机选取特征选择节点分裂特征morgana
节点继续分裂
Yes
形成一棵决策树
图3随机森林模型构建流程
Fig.1Constriction precess of rrndom forest model 当用于综合单价预测时,输入新的样本数据,森林中的每一棵决策树分别进行预测,所有决策树的预测均值将作为随机森林模型的输出预测结果.当模型表现效果较差时,说明模型的泛化程度不足,泛化误差大.泛化误差受到模型的结构复杂度影响,模型结构过于复杂或者简单均使泛化误差增大,故需要通过模型调参确定最优模型复杂度.
对于随机森林中的单棵决策树而言,节点分裂次数越多则深度越深,树的模型越复杂.默认的决策树参数可以让树无限生长下去直到满足停止条件,因此决策树一般容易过拟合.调参时需要注意减少模型复杂度,本文使用的重要影响参数如表7所示.
4实验结果分析
选取190个电网工程项目的现浇基础清单项进行两组对比实验,一组不考虑特征价格随时间的波动性,一组考虑市场价格的波动性.根据综合单价影响因素分析,综合单价中人工费、材料和工程设备费以及施工机具使用费的主要影响因素包括:人工、板方材、混凝土C30、汽车起重机、载重汽车等,收集相关数据并进行预处理,结果如表2所示.样本容量N为11,特征M为2综合单价为模型的预测目标.
采用Python开发工具将前7。个样本数据作
为训练集构建综合单价预测模型(使用默认参
222沈阳工业大学学报第23卷
表1随机森林模型重要参数
Tab.4Important parameter-of random forest model
参数说明对模型性能的影响n_es_mators基评估器个数,默认为19
ma__depth最大树深,默认最大深度
min—SampPS—leaf叶子节点最小样本数,默认为1
min_samples_s_ln 内部节点划分所需最小样本数,默认为2
ma__Seature 最大特征数,默认为auto,特征
总数开平方
不影响单棵树的复杂度,但是过小容易欠拟合,太大容易过拟合
最大深度即最高复杂度,减小max_depth,降低模型复杂度
默认值为最高复杂度,增大min_samplps_leaf,降低模型复杂度
默认值为最高复杂度,增大min_samples_s_lit,降低模型复杂度
默认值为中间复杂度,降低ma__leature,降低模型复杂度;反
之,增大模型复杂度
表2现浇基础清单项相关数据
Tab.2Relevant data of cast-in-place foundation bills
序号综合日工板方材混凝土C39汽车起重机1t载重汽车1t综合单价(元•日T)(元-m3)(元-m3)(元.台1)(元.台1)(元-m-3)
133.513393991150233633022 279.517393661026229669009 336.121792271137210663030 231.029993661280392662062 979591999372907209639012
96395923392231203362620039 9773.113793621001379692063 9331.01929363939396661093 9939531629402939209699099 19969.022293971172207699017
数),后33个样本作为测试集验证模型的预测效
果,结果如图2所示.训练集中,真实值与预测值
的平均绝对误差(MAE)等于9.83,平均绝对误
差率(MAPE)为1.51%,说明训练集的模型拟合
效果较好;测试集中,MAE为22.59,MAPE为
3-86%,则说明预测模型存在过拟合的情况,泛化
误差大.除了模型参数影响外,经分析影响综合单
价的因素均受市场价格波动的影响,因此在建立
模型时应考虑时间特征.
800 600 400 200 0
—真实值—-预测值
I
-
训练集测试集-
1112131415161718191101
工程序号
图4随机森林模型预测结果
Fig.4Forecasting resultt of random fores-model
收集所有工程前15个月的特征价格信息,与综合单价进行皮尔逊相关性分析,即
n
X(x厂可((厂刃
竞争上岗演讲稿范文”=广(2)JX(x,-x)2X(y,-y)2
式中:为各特征与综合单价的相关系数;n为工程样本量;和y分别为特征和综合单价在所有样本中的均值.相关系数为正表示正相关,为负表示负相关,绝对值介于0和1之间,越接近1说明相关性越强•相关分析结果如图9所示,各特征与综合单价的相关性随着时间增加逐渐降低,当绝对值低于0.09时,可忽略该特征对综合单价的影响.因此在建立随机森林预测模型时,每个样本数据加入前9个月的特征价格信息,共计29个时间特征进行预测.
通过学习曲线方法确定最优参数,以n_es_mators参数为例,考虑模型的运行效率,经验上n_es_mators参数从1开始每隔19取1个数,直到取到221,保持其余参数不变,测试每一次模型训练集的得分,得分越接近1表示模型训练效果越好,其学习曲线如图6所示.当n_eshmators 参
第3期
肖立华,等:基于机器学习的电网工程量计价预测模型245
0 5
0 5 0
5 0
.3J .2J  J .O  o.o.a o.0.0.2 3 4 5 6 7 8 9 10 11 12
月份
w
冰是
图5前12个月特征价格与综合单价的相关系数
Fig. 7 Correlation  coeftcient  between  charvcteristic  pica
and  comprehensive  unit  price  in  trsi  12 months
数等于81时,得分最高为0. 96,因此从82开始每
隔1取1个数,直到取到99,训练集得分最高为
0. 975.按照此方法依次对其余参数进行调优,最
后结果 max_depth  = 3 , min_samples_leaf  = 2, mio _
samples_spOt  = 2,max_feature  =5.测试集中真实
值、优化前预测值、优化后预测值的对比如图6所 示.优化后MAE 值为9. 46,MAPE 为1. 55% ,明 显预测效果优于优化前的预测模型.
8.9 o.6 4 2 0
9 9 9 90.0.0.0.0.88 k
0.86 ——1——1——1——1——1——1——1——1——1——1
1 21 41 61 81 101 121 141161 181201
n_estimators  值
图6 学习曲线(n_estimatore 参数)
Fig. 7 Lerrring  curve  (n__stimatore  parrmetre )
(
T
日.'K
、伞<<n
查英语单词
特朗普鸡-■-真实值
♦优化前预测值
优化后预测值
550 -------------------------------------------------81 84 87 90 93 96 99 102 105 108 111
工程序号
图7优化前后测试集预测效果对比
Fig. 7 Comparison  of  forecasting  effeci  of  tesi
i  before  and  after  optimization
英语名言名句
5结论
工程量清单计价的核心为综合单价的确定, 综合单价的确定主要受人工费、材料和工程设备
费及施工机具使用费的影响•考虑市场价格波动
的影响,选取机器学习中回归预测效果较好的随
机森林算法,加入各项影响因素的时间特征进行 建模.与优化前相比,优化后的综合单价预测结果
MAE  减小 了 14. 99, MAPE  降低 了 2. 31% ,由此
验证了所提模型的精确性和可行性.但本文只收 集了电网工程项目中现基础清单项的数据进行综
discrimination
合单价预测,后期将收集一个项目完整的清单项
数据建立综合单价预测模型,研究如何进一步提
高测试集上的预测精度.
参考文献(References ):
[1]刘玉林,郭雅娟,陈锦铭,等.基于自然语言处理技
术的电网招标资料查重系统研制[J].电力信息与 通信技术,2018,16(5):11-17.
(LIU  Yu-lin, GUO  Ya-juan, CHEN  JO-mOg, et  ai. Rearch  ou  the  dupUcated-checking  system  for  bid ­ding  documents  of  power  griO  bah  ou  NLP  techooloj  gZ  [ J]. Electro  Power  Information  anO  Communica- hou  Technologz,22 1 8,1 6(5) : 1 -1 0. 1
[2 ]王茹,方超,王柳舒.基于我国清单计价规范的RevO
模型工程量提取[J ],图学学报,2017,38(3) :447 - 4520
(WANG  Ru , FANG  Chao , WANG  Lio-shu. Extract  quantities  of  the  RevO  moUee  bah  on  China ' s  list  valuation  specification  [ J  ], Journci  of  Graphics , 2017,38(3) :447 -452.)
[3] 张友全,陈起俊•工程造价管理[M ],北京:中国电
力岀版社,2019.
(ZHANG  You-quan, CHEN  Qi-jun  , ProjecS  cos/ mc- ogemens  [M]. Beping :China  Electro  Power  P oss , 2019.)
[4] 李国良,廖恒枭,王磊,等.基于MC 方法的模拟工
程量清单综合单价合理性评价研究 [ J ] 0工程管理 学报,2020,34(() :137 -142.
( LnGuojenngg , LnAO  Heggjxnno , WANG  Len , eine  StuUs  on  the  effectiveness  evaluation  of  enmpohen- sive  unO  price  of  simulateh  biO  of  quanO/es  bah  ou  MC  methoU  [ J  ]. J ouoc I  of  Engineering  Manage- mens,2020,34(l) :137 -142.)
[5 ]方晓洁,黄伟琼,黄宇柏,等.线路构造物GII 信息
库的建立及单价估算方法分析[J].计算机与数字 工程,2020,48(8) :2064 -2266.
(FANG  Xiao-jie, HUANG  Wei-qiong , HUANG  Yu- bo,2t  aL  Es/nUshmenS  of  GII  da/ba  Ou  line  can- stochon  and  the  aolysis  of  unO  price  eshmatiou  methoU  [丿].Computer  and  Digitcl  Engineering , 2222, 4(8) :2064 -2066.)
[6] 胡丹萍.基于层次分析法的工程项目招标控制价影
响因素研究[D].成都:西华大学,2217.
口头表达能力(HU  Dan-qing. Bah  ou  the  analyZc  hierLchz  process  (AHP) projecS  /―^ cnntrol  price  influence  fac/o  of  rearch  [ D  ]. Chengdu : Xihua  University , 2017.)
[7] 王维方,朱建君,徐佳欣.基于模糊综合评价法的综
合单价风险量化[J ] 土木工程与管理学报,2217, 34(5) :165 -169.
destination是什么意思
(WANG  Wei-hang, ZHU  JOn-jun, XU  Jia-sin  . Rish  quanOfica/on  of  cnmpreVevsive  unO  price  bah  ou  fuzzy  cnmprePevsive  evaluatiou  method  [ J  ]. Joumal  of  COO  Engineering  anO  MaogemehS,2217,34(5)
:

本文发布于:2023-06-24 01:34:17,感谢您对本站的认可!

本文链接:https://www.wtabcd.cn/fanwen/fan/78/1025272.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:综合   模型   单价   预测   工程量   影响
相关文章
留言与评论(共有 0 条评论)
   
验证码:
推荐文章
排行榜
Copyright ©2019-2022 Comsenz Inc.Powered by © 专利检索| 网站地图