文章编号!007-757X(2021)02-0169-04
混沌分析和最小二乘支持向量机的毕业生就业率预测模型
翟晓鹤
(新疆医科大学护理学院,新疆乌鲁木齐830054)
摘要:毕6生就业率是评价一个高校学生质量8—个重要指标,毕业生就业率建模与预测对高校就业工作具有重要的指导意义。由于毕业生就业率的影响因素多,使得毕6生就6率具有比较强8随机性和混池变化特点,为了提高毕6生就6率预测精度,提出了混池分析和最小二乘支持向量机8毕6生就6率预测模型°根据Takess定理,结合毕6生就6率变化特点,t入混池分析理论对毕6生就6率历史数据进行相空间重构,然后'用相空间重构后8毕6生就6率8历史数据训练最小二乘支持向量机,根据最优参数建立毕6生就6率预测模型,最后与当前经典毕6生就6率预测模型进行了仿真对比分析,结果表明这个毕6生就6率模型预测精度平均值超过了93%,预测误差要明显少于当前经典模型,同时简化了毕6生就6率预测建模过程,减少了预测时间,获得了更优8毕6生就6率预测结果°
关键词:毕6生就6率;相空间重构;Takess定理;最小二乘支持向量机;随机性
中图分类号:TP273文献标志码:A
Prediction Model of Graduate Employment Rate Bad on Chaos
Analysis and Least Square Support Vector Machine
ZHAI Xiaohe
济南游玩攻略(School of Nursing,Xinjiang Medical University,Urumqi830054,China)
Abstract:The employment rate of graduates is an important index to evaluate the quality of college students.Modeling and predicting graduates employment rate is of great guiding significance to the employment work of colleges and universities.There aremanyfactorsinfluencingthegraduateemploymentrate,whichmakesthegraduateemploymentratehavestrongrandomness andchaos Inordertoimprovethepredictionaccuracyofgraduateemploymentrate,aprediction modelofgraduateemploy-mentratebadonchaosanalysisandleastsquaressupportvectormachineisdesigned AccordingtotheTakerstheorem,com-bined with the change characteristics of graduate employment rate,the chaos theory is introduced to reconstruct the pha space ofthehistoricaldataofgraduateemploymentrate,andthentheleastsquaresupportvectormachineistrainedwiththehistori-caldataofthegraduateemploymentrateafterphaspacereconstruction Accordingtotheoptimalparamet
ers,aprediction modelofgraduateemploymentrateistablished Fina l y,it is compared with the current classic employment rate prediction model the results show that the average prediction accuracy of the model is more than93%,and the prediction error is obvious-ylessthanthecurrentclassicmodel Atthesametime,itsimplifiesthemodelingprocessofgraduateemploymentratepredic-ion,reducesthepredictiontimeofgraduateemploymentrate,andobtainsbe t erpredictionresultsofgraduateemployment rate
Key words:graduate employment rate;pha space reconstruction;Takess theorem;least squares support vector machine;randomness
0引言
随着高校的扩展,学生人数不断增加,毕业生的数量随之增多,大学生就业竞争十分激烈,就业压力越来越大(12)&人们对毕业生就业问题十分关注,同时毕业生就业率是高校学生培养质量的一个重要指标,因此高校对毕业生就业率高度重视,这样需要对毕业生就业率进行建模与分析,找到影响毕业生就业率的一些主要因素,从而使高校能够相应的调整学生培养模式,给高校毕业生管理者提供有效的建议,同时为毕业生提供有价值的信息⑶&
对于毕业生就业率预测问题,国内外许多学者都进行了各种尝试研究,最初为线性建模技术,如:基
于ARIMA的毕业生就业率预测模型、基于灰色系统的毕业生就业率预测模型,基于决策树的毕业生就业率预测模型46)&它们主要针对小规模、变化简单的毕业生就业率进行预测,当毕业生就业率变化比较复杂时,则就业率预测误差急剧上升;随后出现了一些非线性建模技术,如基于机器学习算法的毕业生就业率预测模型,最具有代表性的为人工神经网络,其具有比较好的非线性建模预测性能,能够从毕业生就业率历史数据中挖掘出毕业生就业率变化特点,预测建模效率要优于线性
作者简介:翟晓鹤Q980-),女,硕士,讲师,研究方向:大学生就业、大学生创业、大学生心理健康教育&
建模技术⑺8)。由于毕业生就业率具有一定的混沌性,而当前机器学习算法进行毕业生就业率预测建模时,忽略了该特点,使得预测结果并未达到最理想的状态,同时预测精度不太稳定&
以获得更优的毕业生就业率预测结果为目标,提出了混沌分析和最小二乘支持向量机的毕业生就业率预测模型(Chao-LSSVM),该模型根据Takess定理对毕业生就业率历史数据进行混沌分析,采用最小二乘支持向量机拟合毕业生就业率变化特点,为了验证该预测模型的有效性,与当前经典模型进行对比实验,验证了Chao-LSSVM的毕业生就业率预测结果的优越性&
1混沌分析和最小二乘支持向量机的毕业生就业率预测模型
#1混沌分析理论
设毕业生就业率样本数据集合为{4-!=1,2,…,N,N 为样本长度,根据Takess定理,一个混沌毕业生就业率样本数据可以重构一个具有等价空间的数据,能够更好地把握毕业生就业率变化规律,等价空间的多维毕业生就业率数据,如式(1)。
XQt)=\_xQt)4(+厂),…,4((1—1)+^))
H=1,2,…:(1)式中,表示嵌入维'表示延迟时间:表示相空间中的点数如口式(2)。
M=N—(1—1)(2)从式(2)看出,毕业生就业率历史数据的混沌分析主要是确定嵌入维、延迟时间,把毕业生就业率历史数据中把蕴藏的信息充分地挖掘出来,通过相空间重构技术恢复毕业生就业率的混沌特性,本文分别采用饱和关联维数法确定最优的嵌入维,自相关函数法确定最优的延迟时间&
1.2最小二乘支持向量机
由于人工神经网络经常出现一些预测结果偏差比较大的点,即出现所谓的过拟合缺陷,为了改善毕业生就业率预测结果,本文引入最小二乘支持向量机对相空间重构后的毕业就业率数据行,二乘 向机
仅不存在人工神经网络的过拟合缺陷,建模预测性能十分优异,而且其建模效率更高。对于训练样本集合,在支持向量机的基础上,最力、二乘支持向量引入如下的约束条件如口式(3$。
y k_M T'/(4k)+&)=1—e k(3)如式(3$的,二乘向机通式行
求解如口式(4)、式(5)。
min#$T$+e k(4)
$!22k=#
N
y4)='%!k y k/(44k)+&(5)
k=1
式中+表示正则化参数(0)。
定义拉格朗日方程,如式(6)。
N
%!k{y k_$T/4k)+&))—1+d/-(6)
说开k=1
式中!k表示拉格朗日乘子&
根据如下KKT条件,得到以和&的值,如式(7)—式10$。
(—=0;$=
%!k y k/4k)(7)澳门怎么叫濠江
k=#
N
—=0;%gy k=0(8)
学=0;a k=e a k(9) (=0;y k_$T/4k)+&))—1+e k=0(10)
(a k
引入核函数解决非线性回归问题,即:K(4,不)= 0(4/4),最才、二乘支持向量机回归的决策形式,如式11$。
@4)=%a K4,4*)+&(11)
*=#
选择RBF核函数如口式(12)。
K4,4)=exp{—
\4—4I2-(12)式中!2表示核函数参数&
1.3混沌分析和最小二乘支持向量机的毕业生就业率预测步骤
(1)收集若干年的毕业生就业率历史样本数据,根据时间先后进行排序,建立一维样本集合,并对样本数据做如下归化理,如式13)。
/亠*人m in/d o\
4*=---------------(13)
max min
飞扬的(2)确定一维的毕业生就业率样本集合的嵌入维和时间延迟,根据嵌入维和时间延迟进行相空间重构,这样会产生一个多维的毕业生就业率数据,该数据空间变化轨迹与原始毕业生就业率数据变化轨迹相
近。
(3)初始化最小二乘支持向量机的相关参数如口正则化参数,函数参数。
(4)采用最小二乘支持向量机对相空间重构后的多维毕业生就业率数据进行学习,并采用10折交叉验证法确定精度高的二乘向机立毕业就业率
型。
综合上述可知,混沌分析和最小二乘支持向量机的毕业就业率程,如1示。
图#混沌分析和最小二乘支持向量机的毕业生就业率预测流程
2仿真测试析
2.1仿真测试环境设置
为了全面分析混沌分析和最小二乘支持向量机的毕业生就业率预测效果,在相同的仿真测试环境下,选择当前经典的毕业生就业率预测模型进行对比测试,经典模型具体为:(1)基于ARIMA的毕业生就业率预测模型(ARIMA);
(2)灰色系统的毕业生就业率预测模型(GM);(3)BP神经网络的毕业生就业率预测模型(BPNN);(4)没有混沌分析的最才、二乘支持向量机的毕业生就业率预测模型(LSSVM)o所有模型的测试环境如口表1所示&
表1所有模型的测试环境设置
测试环境参数CPU类型及内核数量CPU的工作频率
内存
操作系统
编程软件
具体描述及设置AMD锐龙53500X,6核
3.6GHz
金士顿DDR4240016G
Windows
Java
2.2仿真测试的数据
选择10所学校的毕业生就业率作为实验对象,每所学校毕业生就业率历史数据如口表2所示&
表2的数据
学校号数据大8个学校号历史数据数110615
220715
312810
415920
5141015
2.3混沌分析结果
对表2的仿真测试的数据进行混沌分析,确定每一所学校的毕业生就业率数据的嵌入维数和延迟时间,如表3所示。进行相空间重构,得到毕业生就业率预测学习样本集合&
2.4毕业生就业率预测精度对比
ARIMA、GM、BPNN、LSSVM的毕业生就业率预测精度的平均值如口图2所示&
%
、
墨
|
学校编号
Chao-LSSVM■■-LSSVM
占BPNN X GM
*ARTMA
图2毕业生就业率预测精度对比
对图2的 果进行对比和分析。
(1)ARIMA.GM的毕业生就业率预测精度低于85%,这是由于ARIMA.GM属于线性建模技术,只能描述毕业生就业率的线性变化规律,而对随机性变化规律无法进行有效描述,使得ARIMA、GM的毕业生就业率预测误差高于15%,超过了毕业生就业率预测的实际应用区间,无法应用于毕业生就业管理中,建模结果没有什么实际意义&
(2)BPNN、LSSVM的毕业生就业率预测精度要高于ARIMA.GM的毕业生就业率预测精度,因为它们属于非线性建模技术,可以描述毕业生就业率的随机性变化规律,但是由于没有考虑到毕业生就业率的混沌特性,使得毕业生就业率预测精度没有超过90%,说明BPNN、LSSVM的毕业生就业率结果不理想&
(3)Chao-LSSVM的毕业生就业率预测精度高于ARI-MA、GM、BPNN、LSSVM,预测精度平均值超过93%,大幅度减少了毕业生就业率预测误差,这是因为其结合了混沌分析和最小二乘支持向量机的优点,可以对毕业生就业率变化规律进行精确建模,获得了理想的预测结果&
2.5毕业生就业率预测模型的执行效率对比
随着高校毕业生人数不断增加,执行效率也成了评价毕业生就业率预测模型的一个重要指标,采用平均建模时间(秒,s)描述毕业生就业率型的执行效率,如图3
表3嵌入维和时间延迟的确定学校编号m(学校编号
116 233 336 454 524
645
765
接下来的英文823
912
1026
23个声母怎么写
25
20
Chao-LSSVM■■-LSSVM
BPNN*GM
ARIMA
<
叵
當
心
痛
5
从表3可以看出,不同学校的毕业生就业率数据,它们的混沌特性是不一样的,得到嵌入维数和延迟时间有一定的差别,根据嵌入维数和延迟时间对表2的毕业生就业率数据
°________________________
123456789
学校编号
图3
毕业生就业率预模型的建模时间对比
从图3的平均建模时间可以知道,Chao-LSSVM的毕业生就业率预测模型的执行时间要明显少于ARIMA、GM、BPNN.LSSVM的执行时间,这是因为Chao-LSSVM的建模速度更快,提升了毕业生就业率预测建模效率,实际应用价值更高&
3
毕业生就业率预测是当前高校关注的一个重要问题,结合毕业生就业率的变化特点,设计了混沌分析和最小二乘支持向量机的毕业生就业率预测模型,并通过与当前经典毕业生就业率预测模型的对比实验可以得到如下结论&
(1)通过引入相空间重构将原始毕业生就业率历史数据映射到多维空间,更好的挖掘了毕业生就业率历史数据隐含的变化规律,有助于后续的毕业生就业率预测模型的构建&
(2)利用最小二乘支持向量机的自适应学习能力,对混沌分析后的毕业生就业率历史数据进行训练,可以更好地拟毕业就业率化特,的毕业就业率
红蔷薇歌词结果&
(3)与经典毕业生就业率预测模型相比,混沌分析和最小二乘支持向量机的毕业生就业率预测精度得到了明显的改善,同时毕业生就业率预测效率也得到了有效的提升,预测结果可以为高校就业管理人员提供有意义的参考信息&
参考文献
:1*张学敏,柴晓旭.我国高校毕业生就业率与高校教育质量评价研究[J].东北师大学报(哲学社会科学版),
(上接第162页)
3
本文以加权数据包络分析模型为基础,综合考虑投入和产出两方面的因素,构建了适用于生产技改的评价指标体系和评价方法&该研究成果有利于提高电网公司投资计划管理人员的决策效率以及生产技改项目的投资效果,对电网公司投资计划制定具有一定指导意义&
参考文献
)1*董祯,吴磊,刘光辉)电网生产技改大修立项辅助决策研究[J*企业管理,2017(S2):198#99.
)2*孔祥美,刘程)电网建设项目投资优化研究综述[J*.
科技和产业,2019,19(5):100-104.
)3*诸德律,朱金龙,凌俊斌)浅谈电网生产技改大修项目管理中存在的问题[J*.中国管理信息化,2019,22
(22):91-92
)4*吴华清.基于DEA的奥运会相关效率评价研究[D*.
2019(3):131-141
)2*初旭新.高校毕业生就业条件保障体系对初次就业率的影响因素分析[J*黑龙江高教研究,2016,34(10):
107-110
)3*王先述)基于Cramer法则和ARMA模型的我国高业生就业)J*决策,2010(22) 97-99
)4*黄红兰,温德华,肖忠优)基于ARIMA模型对南康家具产业劳动力就业趋势预测[J*林业经济问题,
2016,36(5):469-474
)5*张稳,恰汗・合孜尔)毕业生就业率预测及质量评估研究[J*.计算机工程与科学2009,31(5):141-143.
)6*程昌品,陈强)基于信息增益比的决策树用于毕业生就业)J*,201027(2):299-302
)7*亓红强,张福O,高大鍵,等.基于灰色系统的大学生就业率预测[J*现代电子技术,2019,42(11):
174-177
)8*苏变萍,王!,王一平.改进BP神经网络及其在陕西就业预测中的应用[J*.数学的实践与认识,2006,36
(9):271-275
)
9*李世玺,孙宪坤,尹玲,等)一种基于混沌理论和LSTM的GPS高程时间序列预测方法[J*.导航定位
学报2020,(1):65-73.
[10*朱霄瑜,韩中合)基于PSO参数优化的LS-SVM风速预测方法研究[J*.中国电机工程学报,2016,36(23):
6337-6342哈尔滨好玩吗
(收稿日期:2020.05.28)
合肥:中国科学技术大学2007.
)5*汤小华)输配电价改革对电网企业经营影响研究[J*,2017(24):91-92
)6*张村,李明伟)电改对电网有效资产核定与管理的影响[J*中国电力企业管理,2017(10):4245.
)7*杨俊权,陶文伟,李金,等.计及成本风险效能的二次设备技改策略[J*广东电力,2017,0(3):51-57. )8*朱玉翠,张引颖,杨先碧,等)基于数据包络分析的成都市综合公立医院运行效率分析[J*现代预防医,2019,4610):1811-1815
)
9*张雪莉,罗玉英,张子武,等.基于数据包络分析的四川省卫生资源配置效率分析与评价[J*.卫生软科学,
2019,3310):52-55
)10*SaatyT L,Kearns KP Systemscharacteristicsand the analytic hierarchy process[M*//Analytical Plan
ning Amsterdam:Elvier,1985:63-86
(收稿日期:2020.07.02)