100字范文,内容丰富有趣,生活中的好帮手!
100字范文 > 如何成为数据科学家?

如何成为数据科学家?

时间:2020-12-31 06:42:52

相关推荐

如何成为数据科学家?

自我介绍一下,我毕业于MIT的Business Analytics项目,这个项目虽然叫Business Analytics,但是也可以被称为是Data Science项目。现在毕业后即将入职FLAG一家公司,成为一位Machine Learning Scientist,想和大家分享一下我的看法。

数据科学家的岗位定义其实很模糊。

A在是HYPSM名校博士毕业,在纽约一家对冲基金工作,写着最核心的交易策略,工资20万,年底奖金25万。

B在一家大型的互联网公司的核心组,每天处理着TB级的数据,很多时候和深度学习的模型打交道,也要读最新的Paper复现结果。

C在一家顶级咨询公司工作,每天见客户,向客户解释着模型,PPT玩得贼6,business sense极为强大。

D在在一家银行工作,每天写SQL,用Tableau做报表,年薪10万,奖金3万。

你猜怎么着?ABCD四个人的title都叫Data Scientist

所以说起来,Data Scientist这个概念有点模糊,其实我们所说的Data Scientist,有些可能可以是Quantitative Researcher,多数其实是Data Analyst,有些其实更像Consultant,也有一些其实就是SDE。所有这些岗位其实都和Data Scientist沾些边。

所以,今天不聊怎么找一个名叫“Data Scientist”的岗位,而是想和大家聊一下,你有Data Science相关的技能(以就读Data Science和Business Analytics相关专业的同学为例)

(1)能找哪些岗位

(2) 这些岗位分别需要什么技能,待遇如何

(3) 如何准备和提升这些技能

1. 学习DSBA可以从事什么岗位方向?

DSBA专业的同学其实就业的时候,选择面非常的广,这是优势,也是劣势。

优势是如果你所有技能都真的很强,你可以在多个行业全都拿到offer,职业选择的面广了很多。劣势是,如果你背景不够硬,而且没有针对某个方向好好准备,那你有可能一个offer都没有。

首先,这几个方向是:

(1)咨询公司

DSBA方向大多数的毕业生,其实最适合的是去咨询公司。

DBA方向大多数的毕业生,其实最适合的是去咨询公司。,但是在咨询公司做做data scientist或者偏向tech的consultant已是足够。另外,BA专业的同学有比较强的优点:会沟通,会展示。这使得BA专业去咨询公司简直如鱼得水。

就拿我们项目来说,44个人中,大概有10个人拿了bcg gamma的offer,5个人拿了麦肯锡的offer。咨询行业无愧BA毕业生的最佳去处。

我的好朋友

@Iker Wang

就即将成为BCG一名光荣的Data Scientist。

@Pace Han

则加入了麦府。

(2)互联网和科技公司

互联网科技公司内部,可供选择的岗位也很多。

如果你编程像我一样强,完全可以直接申software engineer。去年我们项目有两个学长就去了google做software engineer。

如果你编程稍微弱一些,希望自己的工作内容中多一些machine learning和modeling,data scientist这个岗位很适合你。但是值得注意的是,大部分公司的data scientist其实都偏向于招博士生,硕士生可能有时候面试会觉得比较吃力。在amazon,这个岗位叫applied scientist。

如果你想接触更多的业务,你可以选择data analyst或者product analyst,在amazon这个岗位又叫business intelligence engineer。这是一个科技公司中分析产品分析市场的岗位,不那么hardcore,sql用得比较多。

当然,如果你想接触更多的business,你也可以选择当一个产品经理 product manager。

(3)金融公司

金融公司,可以选择Quantitative Researcher,或者Data Scientist,或者Quantitative Trader。

(4)其他传统企业

在传统的行业,也有market analyst或者data analyst的岗位。

2. 有哪些可以学习的skillset?

为了找一份上述的工作,你主要的skillset要有如下这些:

(1)算法和数据结构(比如leetcode,topcoder)

(2)数据编程语言:SQL>Python>R(面试中的重要性)

(3)数学、统计及建模应用:统计学、运筹学、机器学习等;

(4)数据知识在实际领域中的应用:digital marketing,healthcare analytics,machine learning in finance这些。俗称领域知识。

(5)纯智商,brainteaser能力强,解数学难题能力强,临场反应快

(6)会表达,会交流,会展示,对于中国人在美国求职,这一项也包含了语言水平

每个岗位对应的skillset要求是不一样的,薪酬待遇也是不一样的。具体可以看如下的介绍。

3. BA就业个方向的薪资与技能要求

为了更好地展示,大家可以看我做的表。

需要注意的是,这里的薪资水平(包含公司+股票+奖金),我是参考了每个行业里顶尖的公司的水平。比如quant researcher我参考的是citadel, two sigma。sde我参考的是facebook,google。consulting参考麦肯锡bcg。行业里其他公司不一定有这么高的薪酬,但是总体来说,基本这几个行业、岗位的工资差距是类似的(比如一家比较一般的企业的data analyst,就是会比data scientist要工资稍低)。

工资的单位是美元。这是我的直观感觉,如果有数据不准确的,欢迎指出。

在接下来的部分中,主要的内容有:

前文讲到的几个skillset该如何提升?(我的建议)

话不多说,直接开始!

上文中我们提到了几个BA学生在北美求职的重要技能,他们分别是:

(1)算法和数据结构(比如leetcode,topcoder)

(2)数据相关的编程语言:SQL>Python>R(面试中的重要性)

(3)数学、统计及建模应用:统计学、运筹学、机器学习等;

(4)数据知识在实际领域中的应用:digital marketing,healthcare analytics,machine learning in finance这些。俗称领域知识。

(5)纯智商,brainteaser能力强,解数学难题能力强,临场反应快

(6)会表达,会交流,会展示,英语水平

从这个(我自制的)图中,大家可能有看得出每个技能的“价值”几何。

下面就逐一讲讲该如何提升。

(1)算法和数据结构(比如leetcode,topcoder)

算法和数据结构,是software engineer招聘考察的核心,考察的是对计算机程序的核心内容:算法 algorithm和数据结构data structure的理解运用能力。这一项技能对于很多从商科、文科转来的BA学生简直是个噩梦。但是这项技能很值钱,因为只要你这个技能过关,可以把你的工资上限提高很多。我本人的求职过程,因为这个技能强,就占了很大的便宜。

具体怎么提升呢。最简单粗暴的方法:刷leetcode。只要在google搜一下”刷leetcode“,就有成百上千的攻略教你怎么操作。

我本人因为是信息竞赛选手,初三的时候水平就能秒杀所有leetcode hard了,所以几乎没怎么准备。对于一般的同学,如果你想申靠近sde的岗位的话,建议还是leetcode刷至少150题吧。

等你可以轻松写出“树链剖分”,拿下SDE的offer应该闭着眼睛就能做到了

所以,这是一个目标明确、可提升性强的技能。

(2)数据相关的编程语言

剥离上述和leetcode相关的编程题。

编程技能还有两种考察方式,

第一种是直接让写SQL。Facebook的Data Scientist就是这么考的。

第二种是让用python或者r直接分析一个数据集,展示结果。这当中,会涉及到大量的data manipulation,所以pandas(如果你用python)和dplyr(如果你用r)还是要玩得很熟悉。

具体的提升方式,最好的还是通过实战来练习,sql写得多了,自然也就熟悉了。pandas的技能也是百炼成钢的,没法一蹴而就。

成为Data Analyst或者是Data Engineer,SQL永远是你最重要的技能之一。但是也别只会SQL,那样你就成了别人口中的SQL Monkey,职业发展也会受限。

(3)数学、统计及建模应用:统计学、运筹学、机器学习等;

这一类的知识会被从两种方式考察。

第一种,直接问conceptual的machine learning questions。

举几个例子:

a. Why is GDBT different from Random Forest?

b. What is the difference between l1 norm and l2 norm?

c. What is Thompson Sampling?

d. What is the objective function of explore and exploit?

e. What is dropout layer, why is it important?

第一种问题,我推荐,还是要系统的学一下machine learning。可以看李航的《统计学习方法》,可以看《Elements of statistical learning theory》,可以看MLAPP,这三本书我都觉得很有帮助。如果想抱佛脚,可以推荐你看《Heard In Data Science Interviews: Over 650 Most Commonly Asked Interview Questions & Answers》

第二种,需要你分析一个数据集,做一个take home test (一般给你3天到7天的时间),让你根据要解决的问题建模,然后给出ppt展示。Takehome做起来真的不容易,占用很多时间,也不容易通过,我们下篇文章细讲。

(4)数据知识在实际领域中的应用:digital marketing,healthcare analytics,machine learning in finance这些。俗称领域知识。

这方面的能力,一般会在一些业务题、case question中考察,需要你对公司、岗位面对的业务场景非常熟悉,能用一个公司员工(或者consultant)的思维去思考问题。这类的题目我不是特别的擅长。

如果面的是咨询公司,你面对的case你并不知道会来自于哪个行业,最好能大量地mock interview。

如果面的是科技公司,比如uber,最好能和公司里现在的人聊聊,看看他们看问题的角度。比如uber的业务分析,一定有两个方面,一方面是driver,一方面是rider(这是我从现任员工口中得知的)。比如分析Facebook的业务题的时候,可能加上“网络效应 Network Effect”相关的分析,可能会迎合他的口味(这仅是我的猜测)。

我个人发现去Youtube上看一些对方公司senior data scientist或者marketing vp这样的人物的演讲,可以快速帮助你建立那个公司的分析思路。

(5)纯智商,brainteaser能力强,解数学难题能力强,临场反应快

在quant相关的职位当中,经常会被问到一些需要脑子聪明才能解出来的数学题。有一些是和概率相关的,有一些是和统计相关的,有一些就是纯推理。我面了四家Hedge Fund,都碰到过这样的题目。如果岗位是Quant Researcher这样的题目会少一些,但如果是Quant Trade,那对不起,你80%的面试题都是这样。

brainteaser的能力,临场解数学题的能力,还是可以通过刷题提升的。我的感觉是面试越面到后面,也就熟悉了一些常用的套路。我还可以一本书《A Practical Guide to Quantitative Finance Interviews》。

至于纯智商嘛。。。我也不知道该怎么提升了。希望有人寻找到答案以后可以顺便告知我。

(6)会表达,会交流,会展示,英语水平

全方位提高你的表达能力!

多和你的外国同学一起做课程项目吧!别整天和中国人宅在一起!

有机会说英语就说英语!

试着练习presentation,用录像的方式不断改进!

多mock interview!不仅是自己要多说!还要在帮别人mock的时候学习别人怎么说!

今天更新到这,接下来的文章中,我会以自己的求职经历,回顾各类公司问的问题,让大家对于不同公司的面试考法有个大致的”感知“。

同时我也会针对于一些特别的问题和大家分享我的经验:take home test、薪酬谈判、求职期的心态,etc.

敬请期待。

欢迎关注!

MIT商业分析硕士在读 /程序员/数据玩票/商业咨询/保持谦卑与好奇

欢迎关注我的个人账号:AndrewHuang

以及Business Analytics知乎专栏:Business Analytics

MIT学长教你DIY :申请季注意事项​

MIT 学长教你 DIY 申请:流程和材料​

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。