我们爬了100万招聘需求,竟发现这些技能最值钱

craw-job.jpg

现在流行这么一句话:“找工作的时候,只有两种专业——计算机系的和非计算机系的。”这些年,选择了计算机系的人都在虐人模式的人生游戏里开挂,而非计算机系的人则在被虐模式里挣扎。
可是你注意到了吗?即使是同为计算机专业的人,薪酬待遇也有高低差别。

计算机方向不同行业的薪酬价值,各大招聘网站每天写来写去,想必大家都看烦了。今天,处座想和大家聊聊不同的东西——抛开物质回报不谈,身为码农的你,在工作中积累的各种技能,究竟值多少钱?

从招聘需求中挖掘技能价值

我们从招聘网站上抓取了100多万条有关计算机专业的职位招聘文本,每条文本主包含职位工资和职位要求。我们要做的是从文本中识别“技能”,然后将其和职位工资关联起来。

为了从职位要求描述中抽取技能,我们采用weak-supervised learning的方法。我们首先对职位招聘文本进行句法分析,生成一个粗略的职位技能集合,这个集合是满足语义树正则表达式的所有名词或动名词短语。
 
然后进行少量的人工标注建立训练集,采用BiLSTM的实体识别模型对招聘要求描述中的技能进行识别和抽取。最后不断迭代“标注-训练-预测”这个过程,优化识别结果。算法框架如图一所示。

/uploads/fox/26142131_0.jpg
图一
 
最后,将抽取的技能实体和职位工资关联,并人工分为了几组。下面让我们看看每一组技能价值的结果吧。
 
PHP是最好的语言?
 
好吧,这其实是一个广为流传的笑话。说是有三个程序员坐在格子间里编程。第一个程序员一言不发。第二个程序员写一会儿就按一下编译,然后就玩会儿手机。第三个程序员坐在那里浏览网页,不时飞快的键入一些字符,看起来不怎么干活,尽在上网。请问,他们分别是用的什么语言?
/uploads/fox/26142131_1.jpg
图二
 
言归正传,学会各种编程语言究竟能给你增加多少身价?
 
我们的文本挖掘结果显示,排名第一的编程语言是Scala,价值17.68k,而最后一名是C语言,仅有9.46k,是Scala的一半多一点。Scala作为大数据处理、建模的函数式语言,之所以这么值钱,主要源于前些年大数据产业的爆发。但处座认为,随着近几年大数据产业重归理性,以及Scala人才数量的增加,其价值也会逐渐回归到正常价值。

还有一个在数据挖掘领域讨论比较激烈的话题是,我该学Python还是学R?文本挖掘结果显示,Python的价值比R高出30%。这可能是由于,在近年来越来越火的人工智能领域里,很多算法框架都优先支持Python,从而导致Python的价值逐年升高。所以,如果是初入数据分析行业,还是学Python吧。

其他的我们就不一一分析了,反正除了PHP,你们都是最好的语言。

码农生存工具鄙视链
 
聊完了编程语言,我们再聊聊码农们赖以生存的开发工具。如今,做移动应用的码农要使用Recat Native、Weex、Cordova或者Ionic等框架;做深度学习的算法工程师要使用keras、theano或者tensorflow等框架;做项目管理的架构师要使用word、excel和ppt等(咦?)。那么,不同的开发工具,在价值上有多大的差别呢?
/uploads/fox/26142131_2.jpg
图三

分析结果显示,排名前三的工具分别是keras、theano和tensorflow,其价值分别达到了45k、29.29k和26.71k,在码农生存工具鄙视链上远远超过其他工具。随着人工智能概念的火爆和深度学习人才的稀缺,掌握这三款用来进行深度学习建模的框架,对码农个人价值的提升是极大的。
 
当然,从另一个角度来看,这不合理的差距,也说明了深度学习产业存在泡沫。作为深度学习的算法工程师,也当居安思危,多掌握一些其他的工具框架,以应对泡沫破灭的到来。
 
另一个有趣的点是处于码农生存工具鄙视链最底端的办公三兄弟word、excel和ppt。十年前有一句老话说:写word的不如写excel的,写excel的不如写ppt的,写ppt的不如讲ppt的,讲ppt的不如听ppt的……从鄙视链上来看,确实如此,ppt技能价值8.36k,excel技能价值8.05k,而word技能仅价值7.30k。
 
在这一节的最后,我想说的是,其实生存工具鄙视链并不应该存在,做深度学习的并不优于做移动开发的。
这不过是因为技术的发展和经济结构的转型而造成的误会而已。
 
有人曾感叹:“现在在公司的格子间里面哼哧哼哧做ppt的那些人,和当年踩着缝纫机的女工们,其实没有本质的区别。”
 
是的,没有本质的区别,而我们的表现并没有优于我们的父母,这一切都不过是经济结构转型造成的生存工具的变化而已。

哦,不,还是有区别的。起码纺织工做完一个成品以后,可不会被关到一个小房间里,投到一个大屏幕上,然后让一群人围着羞辱你……
 
高考填志愿该如何选专业?
 
六月已过,高考结束。数百万的学子难抑兴奋的跨出“新手村”,走到了自己人生的节点,将要选择人生之路。

陶杰说:“何时决定自己的学校和专业、什么时候出国读书、什么时候决定第一份职业、何时选定了对象而恋爱,其实都是命运的巨变。只是当时站在三岔路口,眼见风云千樯,你做出选择的那一日,在日记上,相当沉闷和平凡,当时还以为是生命中普通的一天。”

是的,高考填志愿选专业,无论如何强调它的重要性都不为过。你未来12年的人生轨迹(本科四年+研究生三年+工作前五年),都会被这个决定影响。那么,如何选择专业?

计算机专业出身的学生有很多方向可以选择(你在问为什么只说计算机?请重读本文第一句话)——计算机硬件、大数据、人工智能、互联网开发等。下面处座列出了这四个方向技能树价值,供高考结束的学子们选专业时参考。

计算机硬件技能价值表
/uploads/fox/26142131_3.jpg
图四

大数据技能价值表
 
/uploads/fox/26142131_4.jpg
图五
 
互联网开发技能价值表
/uploads/fox/26142131_5.jpg
图六
 
人工智能技能价值表
/uploads/fox/26142131_6.jpg
图七
 
最后,处座希望这篇文章对于处在人生上节点的你能有所帮助,不管你是高考结束的准大学生,还是正在读书的校园才俊,亦或是工作遇到瓶颈的职场小白。愿你能活在自己的节奏里,修炼内功,点好自己的技能树,让自身越来越有价值。

作者:
文若,Gammar Lab成员。自然语言处理爱好者一枚,致力于将人工智能技术应用于金融领域。
勃勃,Gammar Lab成员。麻省理工博士,爱好讲故事的算法工程师,擅长金融+人工智能产品研发。

原创文章,作者:ItWorker,如若转载,请注明出处:https://blog.ytso.com/256318.html

(0)
上一篇 2022年5月18日
下一篇 2022年5月18日

相关推荐

发表回复

登录后才能评论