消息中心
无消息通知

大数据揭秘如何成为一名谷歌数据科学家

数据侠

· NYCDSA

SangYeon Choi  2018-12-18

数据科学家(Data Scientist)被视为“21世纪最性感的工作”!不论在硅谷还是在中国,数据科学家的需求都极其旺盛,那么如何成为一位谷歌数据科学家呢?或者数据科学家都需要哪些技能呢?本文数据侠SangYeon Choi获取了谷歌相关的招聘数据,并通过Shiny App可视化项目,为读者揭晓上述问题的答案。

为什么要学习数据科学?

当然,你可以列出各种各样的原因,但是最重要的原因是要找到数据科学家的工作。学生们学习了各种各样的数据科学技能,并且将其与他们自己领域里的技能相结合。一些值得注意的技能包括:

  • 数据科学能力
  • 面试技巧
  • 社交人脉
  • 找工作的机会

数据科学家是很有前途的工作,随着企业对于大数据分析需求的增长,各个相关领域的需求也跟着增加。

(图片说明:数据科学家工作需求趋势 永久工vs.合同工)

所以,我们需要掌握哪些技能?我能进入哪些公司?

(图片说明:数据科学家的用户画像)

上图是一个对数据科学家的集体画像。70%是男性,至少懂一门外语,硕士或者博士学位,大家在数据科学家岗位上的平均工作年限是2年,全部的工作年限大多是4年半,有2到4年的使用 R/Python 的工作经验。

那么是否雇主在招聘时候也看重这些背景呢?我决定拿Google的招聘作为案例,进行数据分析。

数据准备

这些数据来自Kaggle的现成数据库,这些都是使用 Selenium包从Google官方招聘网站爬取的信息。

(图片说明:Kaggle上关于谷歌工作技能的数据集)

由于这里只有7个数据维度,有些不够,所有我提炼了新的维度。我使用了简单的文字匹配方法。

Shiny App可视化展示

最后,我根据获取的数据设计了一个Shiny App的可视化展示。首先展示的是一个职位地图。

我把这些职位信息进行可视化,呈现在一个简单的地图上。作为一家全球公司,Google在全世界不同城市都有招聘。然而,可以看出,大部分还是集中在美国。

技能领域

以上一个数据可视化是关于工作年限、语言以及整个雇佣状况的信息的页面。整体来看,可以看到对于Java的需求最高,C语言、Python、Javascrip和SQL分别排名1-5位。

在我们研究的数据科学家岗位方面,我们可以看到对于工作年限一般的人,Matlab/Python能力的需求比较高。

另外,教育水平方面,本科生是最常见的。这说明在数据科学领域,实战经验和学科知识是最重要的。

需求技能词云

如果你仔细看这组从招聘信息里列出的最低要求信息中提取出的词云,你可以发现很多有趣的点。

职位最低要求强调相关的工作经验,而列在那些“更倾向于招聘”的信息后的,则更多是诸如沟通能力等软实力。这可以理解为作为一个团队的一员所需要的不只是简单的工作经历。

更多细节可以查看我的R Shiny与Github上的数据与代码。

  • R Shiny : https://hellotheresy.shinyapps.io/way_to_googler/
  • Github : https://github.com/hellotherecsy/way_to_google

我只是简单地使用R Shiny进行了数据的可视化,如果我也用NLP(自然语言处理)处理一下相关文档,会有更好的结果。

注:本文编译自纽约数据科学院文章How to become a googler?

数据侠门派

SangYeon Choi是一名大数据工程师,曾就职于韩国SK控股集团。毕业于韩国东国大学,并在纽约数据科学学院学习。

关于DT×NYCDSA

DT财经与纽约数据科学学院是战略合作伙伴。DT×NYCDSA 系合作开设的系列专栏。

加入数据侠

数据侠计划是由第一财经旗下DT财经发起的数据社群,包含数据侠专栏、数据侠实验室系列活动和数据侠联盟,旨在聚集大数据领域精英,共同挖掘数据价值。申请入群请添加微信公号dtcaijing003并备注“数据社群”,合作请联系datahero@dtcj.com。

 

 

相关推荐