基于知识图谱的大学生职位推荐方法

更新时间:2023-06-09 18:06:27 阅读: 评论:0

㊀收稿日期:2021-09-20基金项目:辽宁省教育厅科学研究基金面上项目(LJKZ0085)ꎻ辽宁省普通高等教育本科教学改革项目(2021-22)ꎻ辽宁大学
本科教学改革项目(2021-10)ꎻ辽宁省经济社会发展研究课题研究成果基金项目(2022lslwzzkt-018)
作者简介:徐红艳(1972-)ꎬ女ꎬ辽宁沈阳人ꎬ硕士ꎬ教授ꎬ研究方向:个性化推荐ꎬ大数据技术.㊀∗通讯作者:王嵘冰ꎬEmail:wrb@lnu.edu.cn.
㊀㊀辽宁大学学报㊀㊀㊀自然科学版第49卷㊀第2期㊀2022年JOURNALOFLIAONINGUNIVERSITYNaturalSciencesEditionVol.49㊀No.2㊀2022
基于知识图谱的大学生职位推荐方法
徐红艳ꎬ王碧莹ꎬ冯㊀勇ꎬ王嵘冰∗
(辽宁大学信息学院ꎬ辽宁沈阳110036)
摘㊀要:近年来ꎬ我国大学生的就业压力一直较大.我国经济的发展虽然创造出大量的职位ꎬ但应届大学
生由于缺乏工作经验和社会阅历ꎬ面对大量的职位招聘时很难作出正确和理性的选择.为更好地推动大学生就业ꎬ本文提出了一种基于知识图谱的大学生职位推荐方法.该方法首先运用知识图谱技术构建职位知识图谱ꎬ使用图形数据库Neo4j完成知识的存储工作ꎬ通过将知识图谱中的实体与关系进行向量化表示ꎬ计算简历与职位描述间的相似度ꎻ然后通过用户对职位的行为矩阵计算得到职位间的相似度ꎻ最后将2种相似度进行融合ꎬ生成职位推荐列表.对比实验结果表明ꎬ本文所提方法在准确率和召回率等指标上均有显著提升ꎬ相较于主流职位推荐方法具有更高的精准度.
关键词:职位推荐ꎻ知识图谱ꎻ大学生就业ꎻ向量化表示
中图分类号:TP319㊀㊀㊀文献标志码:A㊀㊀㊀文章编号:1000-5846(2022)02-0107-09
减肥口号搞笑
AMethodofJobRecommendationforCollegeStudents
BasedonKnowledgeGraph中村心音
XUHong ̄yanꎬWANGBi ̄yingꎬFENGYongꎬWANGRong ̄bing∗
(CollegeofInformationꎬLiaoningUniversityꎬShen练口语
yang110036ꎬChina)
Abstract:㊀Inrecentyearsꎬtheemploymentpressureofcollegestudentsinourcountryhasbeengreat.Althoughthedevelopmentofthenationaleconomyhascreatedalargenumberofjobsꎬitisdifficultforrecentcollegestudentstomakeaccurateandrationalchoicesinthefaceofalargenumberofjobsduetolackofworkandsocialexperience.Inordertobetterpromotetheemploymentofcollegestudentsꎬthispaperproposesajobrecommendationmethodforcollegestudentsbasedonknowledgegraphs.Thismethodfirstconstructsajobknowledgegraphꎬusesgraphdatabasetocompletetheknowledgestorageworkꎬandvectorizestheentitiesandrelationshipsintheknowledgegraph.Meanwhilecalculatethesimilaritybetweentheresumeandthejobdescriptionꎻthencalculatethe
similaritybetweenthepositionsthroughtheuserᶄsbehavior
㊀㊀matrixforthepositionsꎻfinallyꎬthetwosimilaritiesaremergedtogenerateajobrecommendationlist.Theresultsofcomparativeexperimentsshowthatthemethodproposedinthispaperhasasignificantimprovementinindicatorssuchasaccuracyrateandrecallrateꎬandhashigheraccuracythanotherjobrecommendationmethods.
Keywords:㊀jobrecommendationꎻknowledgegraphꎻemploymentofcollegestudentsꎻvectorizedrepresentation
0㊀引言
在国内经济稳定㊁高速发展及国际重视中国市场的背景下ꎬ各行业都在扩大生产经营规模ꎬ藉此产生了更多的职位需求.在信息技术的推动下ꎬ这些职位需求数据在网络空间迅猛增长和快速传播ꎬ进而引发
信息过载问题[1].在海量的职位信息中找到适合的职位对求职者来说是一件复杂而又耗时的事情ꎬ尤其对缺乏工作和社会经验的应届大学生ꎬ职位选择显得愈发困难.
游击队歌当前的职位推荐系统大多是热门职位推荐或是基于关键词匹配的推荐ꎬ然而热门职位推荐缺乏针对性ꎬ基于关键词匹配的推荐不能满足用户的个性化职位需求[2].知识图谱作为一种新兴知识处理技术ꎬ它可以从知识层面表述知识实体及知识间的关联ꎬ将其应用于职位推荐领域可以更好地处理职位供需间的匹配ꎬ带来更为准确的职位推荐.面对互联网中海量的招聘数据ꎬ基于知识图谱的职位推荐不仅能满足求职者对所需职位的高覆盖率ꎬ也能体现出职位推荐的个性化特征.因此ꎬ本文提出了一种基于知识图谱的大学生职位推荐方法ꎬ通过借助知识图谱工具显示招聘资源间的结构关系以及职位的分布情况ꎬ根据知识图谱中展现的关系ꎬ将与求职大学生有着直接或间接关系的职位推荐给他们ꎬ这样有助于提高大学生的就业率.本文通过引入知识图谱相关技术ꎬ开发出来的职位推荐系统能为高校毕业生提供一个简洁高效的职位推荐平台ꎬ使学生可以更精准地获取到适合自己的职位信息ꎬ这样可以加快毕业生的求职速度ꎬ有效地缓解学生的就业压力ꎬ也能为企业节约时间和招聘成本.
1㊀相关工作1.1㊀知识建模
知识建模是知识图谱构建技术的基础.有2种搭建知识图谱的方法:自顶向下(top ̄down)和自底向上(bottom ̄up).自顶向下是预先定义好本体和数据模式ꎬ然后把实体加进知识库系统中ꎬ
这种搭建方法必须采用当前的部分结构化知识库系统作为基础知识库系统ꎬFreeBase知识库就是采用这种方法构建而成的.自底向上是从一些对外界开放的数据信息中获取实体ꎬ选择可靠性比较高的放到知识库系统中ꎬ然后对顶层的本体模式进行搭建ꎬ很大一部分知识图谱就是依靠自底向上的方法搭建出来的ꎬ这里面最具代表性的是Google和微软构建的知识库ꎬ这也符合互联网数据内容知识产生的特点.
1.2㊀知识抽取
知识抽取中最重要的是如何从异构数据库中自动抽取信息内容以获得替代的知识单元.相对于
劳务协议范本801㊀㊀㊀辽宁大学学报㊀㊀自然科学版2022年㊀㊀
㊀㊀垂直领域的知识图谱ꎬ其数据通常采用2种方式获得:1)业务本身的生成数据信息ꎬ这类数据大体上是指企业内部的数据库表ꎬ并将其以结构化形式存储起来ꎻ2)以网页形式存在的非结构化数据ꎬ这类数据一般是从Internet上抓取的公开数据.第1种类型的数据通常经过简单的预处理就可以用作AI系统后续的输入数据ꎬ而后1种类型的数据就要依靠自然语言的处理技术来获得结构化的数据信息.这一点恰好是知识抽取部分的一个难题ꎬ它涉及的核心技术包括实体抽取㊁关系抽取以及属性抽取[3].
1.2.1㊀实体抽取实体抽取指的是从文本数据中自动检索出命名实体[4]ꎬ它的目的是在知识图谱中构建节点.实体抽取的质量很大程度上影响着后面知识获取的质量和获取速度ꎬ所以说实体抽取是知识抽取环节中最基础也是最重要的模块.
1.2.2㊀关系抽取文本语料在前面的实体抽取后获得的是一系列分散开来的命名实体ꎬ为了更好地从中获得语义信息ꎬ在把这些实体和概念关联在一起之前ꎬ必须从与之对应的语料中获取出实体间的关联信息ꎬ这样才能得到知识系统的网状结构.关系抽取技术ꎬ归根结底就是从文本语料中抽取实体之间关联关系的一项技术[5].
1.2.3㊀属性抽取属性抽取的最终目的是要从不一样的信息源中收集指定实体的属性相关信息ꎬ以达到详细描述实体属性这一目的[6]ꎬ如针对某款笔记本电脑ꎬ可以从互联网中获取多源异构的数据ꎬ从中得到其品牌㊁配置等信息.
如果把实体的属性值看作是一种特殊的实体ꎬ那么属性抽取实际上也是一种关系抽取.百科类网站提供的半结构化数据是通用领域属性抽取研究的主要数据来源ꎬ但具体到特定的应用领域ꎬ涉及大量的非结构化数据ꎬ属性抽取仍然是一个巨大的挑战[7].
1.3㊀知识表示
知识表示旨在通过计算机来展现知识的可行性和有效性ꎬ它想要达到数据结构与控制结构的统一ꎬ因此ꎬ不仅要注意知识存储上容易出现的状况ꎬ也要想到知识使用方面的问题.知识表示可以看作是叙述一组事物的约定ꎬ从而将知识表示为能够被机器识别处理的数据结构[8].
2㊀基于知识图谱的大学生职位推荐方法描述
雇佣兵本文提出了一种基于知识图谱的职位推荐方法ꎬ推荐方法的框架如图1所示.通过将知识图谱的概念引入到职位推荐中ꎬ以此来弥补当前职位推荐方法中存在的推荐精度不高㊁缺乏个性化等问题.所提方法的思想:首先将知识图谱映射到低维稠密向量空间里ꎬ以获取职位信息中的职位相似度ꎻ接下来依据职位信息生成用户的行为矩阵ꎬ进而计算出职位之间的相似度ꎻ然后通过融合这2种类型的职位相似度ꎬ得到融合后的职位相似度矩阵ꎬ并以该矩阵作为基础ꎬ得到用户对职位库中所有职位的估算分值ꎻ最后依据这个分数得出推荐给用户的职位排序列表.下面分别对方法中的核心环节加以详细描述.
2.1㊀向量化表示
关于知识建模等构建知识图谱的相关技术和方法已经在第1节中详细介绍ꎬ下面介绍知识图谱
901㊀第2期㊀㊀㊀㊀㊀㊀徐红艳ꎬ等:基于知识图谱的大学生职位推荐方法
㊀㊀的向量化表示
.
图1㊀基于知识图谱的大学生职位推荐方法框架
㊀㊀这里使用TransE算法将知识图谱中的实体与关系嵌入到低维向量空间中[9]ꎬTransE算法的主要思想是将三元组(hꎬrꎬt)中的关系看作从实体head到实体tail的翻译.其中ꎬh是头实体的向量表示ꎬr是关系的向量表示ꎬt是尾实体的向量表示.通过不断调整三者的向量表示ꎬ使得h+r尽可能与t相等ꎬ即h+r=tꎬ那么就说明知识图谱中的三元组成立.如果成立ꎬTransE算法就必须达到公式(1)和公式(2)的要求:对正样本三元组:h+rʈt
(1)对负样本三元组:h+rʂt
(2)在上面两式中ꎬh+r与t的关系表示与向量相似度的近似等价程度.这里向量相似度通过计算欧氏距离实现ꎬ得分函数的公式如式(3)所示:
f(hꎬrꎬt)= h+r-t L1/L2
(3)得分函数值越小ꎬ越有利于正样本三元组ꎻ得分函数值越大ꎬ对负样本三元组越有利[10].接着ꎬTransE算法通过损失函数测试表示学习的效果ꎬ损失函数的计算如公式(4)所示:
L=ð(hꎬrꎬt)ɪSð(hᶄꎬrꎬtᶄ)ɪSᶄ(hꎬrꎬt)[γ+f(hꎬrꎬt)-f(hᶄꎬrᶄꎬtᶄ)]+(4)
其中ꎬS是正样本的集合ꎬSᶄhꎬrꎬt是三元组(hꎬrꎬt)的负样本.知识图谱中三元组的负样本是通过随机替换头实体h或尾实体t后经过大量训练得到的.以x表示公式(4)中方括号内的式子ꎬ则[x]+
指的是max(0ꎬx)ꎻγ表示函数间隔的大小ꎬ且γ>0.TransE算法通过不断地训练和优化算法ꎬ损失函数的值可以达到最小.算法通过不断地迭代来更新参数ꎬ直到收敛或者达到最大迭代次数ꎬ这时知识图谱中的实体就会被映射到向量空间中的相应位置[11].
2.2㊀相似度计算
本小节主要对系统中职位的相似度进行计算ꎬ分为2个部分:基于简历的职位相似度计算和基于用户行为的职位相似度计算.011㊀㊀㊀辽宁大学学报㊀㊀自然科学版2022年㊀㊀
㊀㊀本文所提方法的相似度计算有2个来源:1)通过提取用户简历中的信息计算其与职位的相似度ꎻ2)由用户在系统上对职位作出查看或收藏等用户行为而得到的职位相似度.最后融合这2种来源的相似度ꎬ以此获得最终的职位信息相似度.
2.2.1㊀基于简历的职位相似度前文介绍了知识图谱中富含大量的语义信息ꎬ可以从语义的层面描述职位之间的相似度[12].2.1节里又详细地阐明了知识图谱中实体向量化表示的具体步骤ꎬ因此获得了实体在高维空间里的向量表示.接下来根据职位的嵌入向量ꎬ介绍职位语义相似度的详细计算.
首先ꎬ把知识图谱上职位信息的实体和关系都映射到d维空间里去ꎬ职位Ii嵌入一个d维的向
量如公式(5)所示:
Ii=(E1iꎬE2iꎬ ꎬEpi)T
(5)这里的Epi指的是职位Ii在第p维上嵌入向量的数值.然后使用欧几里得距离计算后获得的评分函数ꎬ对知识图谱中的实体和关系做嵌入操作[13].还需使用它测算向量的语义相似度ꎬ以此来精准表达用户的简历与职位信息之间的相似性.在这一步之前ꎬ需要先用公式(6)来计算职位之间的距离:
d(IiꎬIj)=
ðdk=1(Eki-Ekj)2(6)
通过公式(6)的计算最终欧几里得距离大于等于零ꎬ再经过公式(7)的计算ꎬ可以把它控制在区间(0ꎬ1]:
simknowledge_graph(IiꎬIj)=11+d(IiꎬIj)=11+ðdk=1(Eki-Ekj)2(7)这个式子的计算结果越大ꎬ就表明用户的简历信息与职位信息之间的语义相似度数值越大.如果该数值是等于1的ꎬ简历信息与职位信息之间的语义相似度就是最大的ꎬ可以认定两者相似程度很高ꎻ反之ꎬ如果该值是趋近于0的ꎬ就认定两者之间毫无关联.
2.2.2㊀基于用户行为的职位相似度根据用户行为得到的所有信息可以看出用户自身对于职位信息的关注[14].基于物品的协同过滤推荐的主要思路也是如此.基于物品的协同过滤推荐可实现领域范围叶问李小龙
之内的推荐ꎬ是依据访问系统的全部用户对物品做出的用户行为进而得到物品之间的相似度ꎬ接着把认定是相似的物品按照用户行为的历史数据进行推荐.本文将用户对职位信息的用户行为划分成许多个类别ꎬ这里以最为寻常的评分信息作参照对职位信息进行向量化表示.
假设本文实现的系统里有访问系统的m个用户U=(U1ꎬU2ꎬ ꎬUm)和被单位发布出来的n个职位I=(I1ꎬI2ꎬ ꎬIn)ꎬ那么用户对职位的评分信息可以表示为如公式(8)所示的mˑn矩阵Rmˑn:
R=R11R12 R1nR21R22 R2n⋮⋮⋮⋮Rm1Rm2 Rmnæèçççççöø÷÷÷÷÷(8)
接下来ꎬ要把职位Ii表示成如公式(9)所示的一个m维的向量ꎬ它的数值意味着在每一个维度
杀手界1
11㊀第2期㊀㊀㊀㊀㊀㊀徐红艳ꎬ等:基于知识图谱的大学生职位推荐方法

本文发布于:2023-06-09 18:06:27,感谢您对本站的认可!

本文链接:https://www.wtabcd.cn/fanwen/fan/82/913242.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:职位   知识   推荐   图谱   信息   实体
相关文章
留言与评论(共有 0 条评论)
   
验证码:
推荐文章
排行榜
Copyright ©2019-2022 Comsenz Inc.Powered by © 专利检索| 网站地图