互联网点击率最高的博客

点击率最高的博客  时间:2021-05-19  阅读:()
StatisticsandApplication统计学与应用,2016,5(4),389-396PublishedOnlineDecember2016inHans.
http://www.
hanspub.
org/journal/sahttp://dx.
doi.
org/10.
12677/sa.
2016.
54042文章引用:王冬冬,周小燕,向晶晶,郭小敏,王群.
网络招聘信息的分析与挖掘[J].
统计学与应用,2016,5(4):389-396.
http://dx.
doi.
org/10.
12677/sa.
2016.
54042AnalysisandMiningofNetworkRecruitmentInformationDongdongWang,XiaoyanZhou,JingjingXiang,XiaominGuo,QunWangDepartmentofMathematicsandComputerScience,GuizhouNormalCollege,GuiyangGuizhouReceived:Dec.
8th,2016;accepted:Dec.
22nd,2016;published:Dec.
29th,2016Copyright2016byauthorsandHansPublishersInc.
ThisworkislicensedundertheCreativeCommonsAttributionInternationalLicense(CCBY).
http://creativecommons.
org/licenses/by/4.
0/AbstractTheemploymentandnetworkrecruitmentinformationisbasedonthestudyoftheeraofbigdataproblemsthroughtheRlanguageanalysisoftheNetworkRecruitmentInformationandtextmin-ing,mainlyfromthecity,industry,andseveralaspectsofthisposition.
Theanalysisisrelatedtothecurrentsituationoftalentdemand,forecaststhenumberofpostsandprovidesjobseekerswithgreynumberofthepredictionmodel,accomplishingtheenterpriseandtalentperformanceinnetworkplatforminteraction.
Thiscanachievebetterfunction.
Finally,thethesiswillputfor-wardproposalstotherelevantcorporaterecruitmentandemploymentplanningguidance.
KeywordsRecruitmentInformation,TextAnalysis,WordCloud,GreyPrediction网络招聘信息的分析与挖掘王冬冬,周小燕,向晶晶,郭小敏,王群贵州师范学院,数学与计算机科学系,贵州贵阳收稿日期:2016年12月8日;录用日期:2016年12月22日;发布日期:2016年12月29日摘要本文以研究大数据时代下人才就业与网络招聘信息之间的问题为基础,主要从城市、行业、职位这几个OpenAccess王冬冬等390方面通过R语言对网络招聘信息进行文本分析与挖掘,分析目前的人才需求情况,并用灰色预测模型预测出提供岗位数与求职人员数,实现企业与人才间在网络平台上的互动,达到更好的匹配功能,最后给相关企业的人才招聘以及大学生的就业规划指导提出自己的建议.
关键词招聘信息,文本分析,词云,灰色预测1.
引言信息时代,我国互联网得到迅速发展,网络人才市场势头迅猛,严重冲击了传统的人才市场,网络人才市场占有率不断扩大,人才招聘渠道呈现多元化的发展,网络招聘作为网络技术在人力资源管理中应用最快的领域,已经被人们所接受,据统计全球每天约有2000万就业信息发布,约有3000万人在互联网上发出求职简历.
网络招聘的发展促进了网络招聘市场的繁荣,它与传统招聘渠道相比有着更为明显的优势.
网络招聘信息一方面能够直接反映用人单位对人才基本条件、能力和素质的要求,为应聘者提供求职参考;另一方面也能够反映出社会和各行业对人才的需求现状,或未来一段时间的人才需求趋向;同时也能够为高等院校及时了解社会对人才的需求变化情况,分析预测未来的人才市场的热点,有针对性的调整人才培养方案和设置安排相关课程提供重要的参考信息,促进高校培养出更多适用的优秀人才以满足社会的需求.
因此,对网络招聘信息进行分析研究,了解社会和相关行业的需求特点与趋势,使企业在人力资源招聘中节省成本、招聘到企业实际需要的人员,招聘网站能更好的实现企业与人才间的互动,达到更好的匹配功能,为广大求职者提供正确的就业指导都有着非常重要的意义.
2.
分析过程2.
1.
数据来源本文数据来自于国内招聘网站(赶集网,58同城,前程无忧网)2016年1月到3月的招聘信息以及中国人力资源市场网2012年第一季度至2016年第一季度的招聘信息.
其中城市、行业和职位数据属于非结构性数据.
2.
2.
数据处理对数据进行预处理[1],先把异常值和缺失值筛选、整理,再把处理后的数据进行词频统计,这里保留词频大于100的数据,因为100以下的所占比重较小,可以忽略,简化数据,降低分析难度.
2.
3.
数据分析对收集到的招聘信息数据中的城市,行业,职位这三列数据进行词频统计,进行频数统计分析,通过频数分布表、条形图、地域分布图,以及集中趋势和离散趋势的各种统计量来描述数据的分布特征,可以直观的得到,热门城市间差距的大小、热门行业以及热门职业间竞争的相对大小,同时通过R语言分别画出它们的词云[2],在词云图中,通过字体的大小判断热门城市、行业及职位.
表1是对前十名热门城市的词频统计,可以直观的看出城市间热门差异的大小.
图1是热门城市的词云统计图,明显的看出北京、上海、深圳、广州、杭州这几个城市比较突出,由此我们可以得到这几个城市在中国是热门的城市,而且和上面的词频统计结果也是吻合的.
从图2可以很明显的看到全国的就业热门城市基本上集中在东部地区,而且主要集中在沿海城市.
王冬冬等391Table1.
Statisticsoffrequencycity表1.
十大热门城市词频统计表城市北京上海深圳广州杭州成都武汉南京厦门西安频数197,25888,40864,51646,37041,65415,5219960855959014950Figure1.
Popularcitystatistics图1.
热门城市统计图Figure2.
Regionaldistributionofhotcities图2.
热门城市区域分布图表2是热门行业的词频统计,由上可知在中国的就业市场中移动互联网·电子商务、金融、移动互联网·O2O等是非常热门的行业,同时可以得到行业间竞争的激励程度,从表2得到移动互联网·电子商务的频数为42,227,金融的频数为39,410而移动互联网·O2O的频数为29,997由此可见移动互联网·电子商务和金融行业的人才需求量特别大.
图3是对各城市前三的行业的一个对比,广州、杭州、等的第三热门行业未在图中显示(数据太小,图上显示不明显),从图中可以很明显的得到,北京不仅是最热门的城市,而且他的各个行业的热度相比于其他城市同类行业也处于领先地位.
王冬冬等392Table2.
Statisticsofhotindustries'wordfrequency表2.
热门行业词频统计表行业频数移动互联网·电子商务42,227金融39,410移动互联网·O2O29,997电子商务29,752移动互联网·金融25,434移动互联网·数据服务17,444移动互联网·企业服务15,489移动互联网·教育12,740移动互联网·游戏12,366Figure3.
Hotindustrydistribution图3.
热门行业分布图图4是反映职业的词频统计[3],也可同上面做类似的分析,得到产品经理和Java这两个职业的热门程度不相上下.
由图5可以直观的得到:在中国的就业市场中产品经理、Java、web前端、等职业的需求量比较大.
从中国人力资源市场网收集了2012年第一季度到2016年第一季度全国各单位所提供岗位数和全国求职人数,对全国的供求结构进行下面的分析,并对其做预测[4].
通过excel对2015年第三季度用人单位对学历的需求数作雷达图,形象的描绘出不同学历的需求情况.
从图6中可以看出,需求数最高的是大专其次才是本科,且对高学历人才的需求数相对较少.
由此可以得出结论:我国现阶段的大部分职位高学历人才并不多,反而是以专科等技术性人才为主,这些高校培养的是技能型人才,毕业后,大部分都从事生产性岗位,相比本科生来说,他们的技能可以更直接的运用到生产工作中,但这也很可能导致部分企业形成技术落后、市场竞争力不强、经济效益差、人才引进难等恶性循环的局面.
虽然企业对求职人员学历的要求并不高,但并不代表企业不需要高学历人才,王冬冬等393Figure4.
Thefrequencyofpopularcareerstatistics图4.
热门职业的频数统计图Figure5.
Popularcareerstatistics图5.
热门职业统计图Figure6.
Radarchart图6.
雷达图王冬冬等394由于我国中小型企业占全国企业总数的99%以上,其中一大部分企业因为人才成本过高且本身从事制造业,他们更愿意用学历较低的廉价劳动力,但实际上,企业还是很缺乏高学历人才的.
图7是反映的不同地区的市场供求总体状况气泡图,圈大小表示供求需要的数量,从图中可以看出,华东地区的人才供求量最大,其次是华南、华北等地区.
而西北、东北地区的供求量相对偏低.
说明岗位的需求大部分集中在了华东、华南等地区,这些地方的经济发展水平较高,相应的人才需求也就越大.
为了预测全国供求未来发展趋势的状况,我们可以通过灰色预测模型来预测求职人数与提供岗位数.
灰色预测是一种对含有不确定因素的系统进行预测的方法,通过鉴别系统因素之间发展趋势的相异程度,即进行关联分析,并对原始数据进行生成处理来寻找系统变动的规律,生成有较强规律性的数据序列,然后建立相应的微分方程模型,从而预测事物未来发展趋势的状况.
用等时距观测到的反应预测对象特征的一系列数量值构造灰色预测模型,且认为原始数据本身就是一种多因素综合作用的结果,与其进行因素的多层剖析,不如就以原始数据为依据进行预测.
故用单因素模型GM(1,1)作预测[5].
GM(1,1)模型的理论[6]令()()()()()()()()()()0000012,3,xxxxxn=,为原始建模序列作一次累加生成k()()mxkx=∑消除数据的随机性和波动性m=1有()()()()()()()()()()111111,2,3,xxxxxn=()()()()()()()()()()()111111,12,,1xxxxnxn=++x可建立白化方程:ddxtaxu+=即GM(1,1).
该方程的解为:()()11expxkxuaakua其中:α称为发展灰数;μ称为内生控制灰数.
用R语言进行编程得到结果如图8所示.
求职人数拟合函数:()()131640.
87exp0.
0293730231640.
87xt+=Figure7.
Bubblechart图7.
气泡图王冬冬等395最终下一期求职人数大约为560万人.
由于C(后验差比值)<0.
35,说明GM(1,1)模型预测[7]精度等级为好.
相对精度为91.
91678%,说明这个模型的精度非常高,具有一定可靠性(图9).
拟合函数:Figure8.
Jobapplyingforecastchart图8.
求职预测图Figure9.
Positionforecast图9.
岗位预测王冬冬等396()()114778.
48exp0.
0315853714778.
48yt+=最终预测下一期的提供岗位数大约为271万,由于C值<0.
35,说明GM(1,1)模型预测精度等级为好.
相对精度为91.
07493%,同样说明这个模型的精度非常高,具有一定可靠性.
从预测情况看出,从2016第一季度开始未来六个季度劳动力市场需求大于供给.
从供求对比看,用人单位提供岗位数约为271万.
进入市场的求职者约560万人,市场需求大于供给.
3.
结论通过以上的分析,我们得出北京、上海、广州等是中国的热门就业城市,而移动互联网·电子商务、金融、移动互联网·O2O等是排名靠前的行业,同时产品经理、Java、web前端等的人才需求量很大.
我国现阶段大部分职位以技术性人才为主.
由本文预测结果来看,劳动力市场需求大于岗位供给,就业形势仍然严峻.
而且现在的热门行业中需要的是高端技术人才,互联网是最近几年逐步发展起来得,很多学生所学专业与该行业不符,这也是就业难的一个原因.
造成"企业招工难,大学生就业难"的尴尬局面.
基于本文研究结果提出下列建议:1)高校应该适当增加互联网领域相关的专业,或对这些专业加大资源投入和调整课程设置加强对学生专业技能的训练.
2)从人才类型来看,需求量大的是技术型人才,对于应用型学校可请企业技术人员到学校做讲座,加强校企合作,提高学生就业率和综合素质能力,培育出适合未来就业形势的高技能创新型人才.
3)大学生在做职业规划时应多从这些热门行业上做准备.
4)大学生应该准确的认知自我,不能盲目随主流,从基层做起,在择业时多考虑中部与西部的二线城市,缓解就业压力.
基金项目贵州师范学院校级学生科研项目(项目编号:2016DXS094);贵州省2014年省级本科教学工程项目"计算机科学与技术"专业综合改革(项目编号:黔教高发[2014]378号);卓越工程师教育培养计划项目(黔教高发[2013]446号);2015年省级本科教学工程建设项目(黔教高发[2015]337号).
参考文献(References)[1]李妍.
微博数据预处理及话题检测方法研究[D]:[硕士学位论文].
石家庄:河北师范大学,2014.
[2]王成城,孙丽丽,朱立萍,巩妙宇.
NGO组织人力资源管理的困境与对策——基于网络招聘信息的文本分析[J].
中国人力资源开发,2015(17):20-25.
[3]钟晓旭.
基于Web招聘信息的文本挖掘系统研究[D]:[硕士学位论文].
合肥:合肥工业大学,2010.
[4]王立敏.
人才市场需求预测模型的研究与应用[D]:[硕士学位论文].
石家庄:河北师范大学,2013.
[5]居柏成.
基于灰色理论的大学生就业市场信息数据挖掘研究[D]:[硕士学位论文].
长春:东北师范大学,2006.
[6]百度百科.
灰色预测[Z/OL].
http://baike.
baidu.
com/linkurl=tCdFYbL3eShziNnz0Uq1PSlI2FqlDVlXr0S1ri3LV7TG3Ineza9tcn0yL3MEUBblLjjN4Rp2Rlkp8G9Z9xx01q#5[7]李梦婉,沙秀艳.
基于GM(1,1)灰色预测模型的改进与应用[J].
计算机工程与应用,2016,52(4):24-30.
期刊投稿者将享受如下服务:1.
投稿前咨询服务(QQ、微信、邮箱皆可)2.
为您匹配最合适的期刊3.
24小时以内解答您的所有疑问4.
友好的在线投稿界面5.
专业的同行评审6.
知网检索7.
全网络覆盖式推广您的研究投稿请点击:http://www.
hanspub.
org/Submission.
aspx期刊邮箱:sa@hanspub.
org

BeerVM1GB内存/VDSps端口1GB,350元/月

beervm是一家国人商家,主要提供国内KVM VPS,有河南移动、广州移动等。现在预售湖南长沙联通vds,性价比高。湖南长沙vps(长沙vds),1GB内存/7GB SSD空间/10TB流量/1Gbps端口/独立IP/KVM,350元/月,有需要的可以关注一下。Beervm长沙联通vps套餐:长沙联通1G青春版(预售)长沙联通3G标准版(预售)长沙联通3G(预售)vCPU:1vCPU:2vCPU...

EdgeNat 新年开通优惠 - 韩国独立服务器原生IP地址CN2线路七折优惠

EdgeNat 商家在之前也有分享过几次活动,主要提供香港和韩国的VPS主机,分别在沙田和首尔LG机房,服务器均为自营硬件,电信CN2线路,移动联通BGP直连,其中VPS主机基于KVM架构,宿主机采用四路E5处理器、raid10+BBU固态硬盘!最高可以提供500Gbps DDoS防御。这次开年活动中有提供七折优惠的韩国独立服务器,原生IP地址CN2线路。第一、优惠券活动EdgeNat优惠码(限月...

BuyVM迈阿密KVM上线,AMD Ryzen 3900X+NVMe硬盘$2/月起

BuyVM在昨天宣布上线了第四个数据中心产品:迈阿密,基于KVM架构的VPS主机,采用AMD Ryzen 3900X CPU,DDR4内存,NVMe硬盘,1Gbps带宽,不限制流量方式,最低$2/月起,支持Linux或者Windows操作系统。这是一家成立于2010年的国外主机商,提供基于KVM架构的VPS产品,数据中心除了新上的迈阿密外还包括美国拉斯维加斯、新泽西和卢森堡等,主机均为1Gbps带...

点击率最高的博客为你推荐
支持ipad支持ipad更新iphone特斯拉苹果5photoshop技术什么是ps技术iphone连不上wifi苹果8p连接不了WiFi联通iphone4联通iphone4合约googleadsense如何通过Google adsense???css选择器css3的选择器有哪些?杀毒软件免费下载2013排行榜杀毒软件排行榜2015有哪些?
域名备案 免费申请网站域名 域名服务器是什么 日本软银 oneasiahost 百度云100as gomezpeer parseerror patcha 好看qq空间 hostker 韩国名字大全 服务器维护方案 135邮箱 域名接入 阿里校园 卡巴斯基是免费的吗 怎么建立邮箱 asp空间 mteam 更多