最近几年大数据的概念比较火,越来越多的人感受到数据的价值,许多公司都开始招聘数据分析相关的职位。但如果你去看看国内的高校,会发现没有一所大学开有数据分析专业的,职位的成熟度还不够。相比之下,从2003年兴起的互联网产品经理职位,就成熟一些,至少你可以找到大量的书,教你如何成为一名产品经理。而数据分析领域就没这么幸运了,相关的书籍虽然也有,但总觉得还没到火候。
都有哪些人想要成为数据分析师
从我看到想要成为数据分析师的人大致有三类:
第一类是非计算机专业的在校生,不知道怎么回事,反正就是对数据感兴趣了,然后想毕业之后从事相关工作,但对职位要求、该做什么准备一无所知,处于懵懂期;
第二类是互联网公司的产品经理和运营经理,及少数的市场经理。这些人在实际工作中,发现确实数据很有用,但对自己的数据分析能力感到不满意,进而想做出提升;
第三类是传统企业的业务人员,也是不知道怎么就对数据感兴趣了,想要从事数据分析相关的岗位,但缺少时间系统学习,工作经历又不足以支撑自己跳到数据分析职位。
对于不同的背景,采用一样的方法去训练,显然是不合理的。我先来讲解一下数据相关的角色以及职责,说不定你认识清楚了就不想成为数据分析师了,就可以不用往下看了。如果还有信心,那我就介绍一下要学习的基础内容,然后再介绍进阶的内容。
数据相关的角色
围绕数据分析,主要有六种角色。从平台建设线上,包括:
数据平台工程师:负责数据平台的研发,牵涉到从数据采集到分析的相关组件开发。
数据挖掘工程师:利用机器学习/数据挖掘相关技术,研发算法模型,用于个性化推荐、用户画像、精准广告等。
数据产品经理:把数据相关的需求抽象为数据平台的功能产品。
从数据流向的角度,包括:
ETL工程师:把工程团队的模块产生的数据,不管是日志、数据表,还是埋点的数据,进行清洗、转换,建模成利于数据分析的数据。ETL是Extract–Transform–Load的缩写。
数据分析师:利用ETL工程师处理好的数据,满足业务人员的数据需求。
业务人员:产品、运营、市场、管理层等,因为产品改进、运营活动、商业决策等,有数据需求。
数据分析师的职责范围
通过上面的角色划分,我们可以清楚数据分析师在整个数据版图中的位置。数据分析师一方面要和业务人员打交道,满足业务人员的数据需求,另一方面,要借助ETL工程师建模好的数据,以及数据平台工程师开发的平台,来更高效的完成工作。
有些公司在人员紧缺的情况下,会把ETL工程师要做的工作,也安排给数据分析师,这样对数据分析师的开发能力和建模能力,就会有更高的要求。最后一点是提供洞察,前面的工作更多的是被动的,数据分析师还要主动的发现数据中的异常,将这些异常指导业务。
看了这些工作内容,可能并不会觉得特别高大上。我曾经有个组员,干了一年多的数据统计工作,觉得整天写脚本太枯燥了,坚决要求再也不做相关工作了。其实数据分析师如果做的不好,就会发现自己无非是在“取数”。业务人员提了需求,然后把要的数据给提取出来,自己就是一个流水线工人,没有一点成就感。
这里发挥一下抽象能力,就可能把一些重复的“取数”工作给解决掉,用机器代替人工。所以理解业务,提供自己的思考与抽象,很重要。
数据分析师的基本要求
对数据感兴趣:是不是看到一行行的数字就头大,选择直接跳过?还是愿意花些时间研究这些数字背后意味着什么?如果你看苹果的发布会的话,会看到乔布斯的幻灯片里出现最多的就是数字,卖了多少部,分了多少钱,厚度减少到多少毫米之类的,他相信数字简单明了。
如果对数据不感兴趣,这个角色一定不适合你。
良好的理解和抽象能力:把业务人员说的只言片语,抽象为明确的数据需求,清楚怎么从基础数据中实现出来。还有把一些重复性的需求,抽象出模式来,用机器来替代。
良好的表达能力:数据分析师有个天然的优势,能够直接和老板打交道,这就要求你能站在老板的层面来表达。把一堆堆的数据,很好的呈现给业务人员,帮助他们做出正确的决策。
快速动手能力:业务人员提的数据需求,巴不得下一秒都拿到。
兴趣是可以培养的,既然愿意看这篇文章,说明有兴趣。理解、表达、动手能力,是要有意识的训练。数据分析的专业能力,是可以通过学习提升的。
数据分析师要学习的内容
统计学:我看一些人推荐了不少统计学的专业书籍,直接把人吓跑了。我自己就大学时候学过《概率论与数理统计》,其他统计相关的内容也没怎么看过。对于互联网的数据分析来说,并不需要掌握太复杂的统计理论。所以只要按照本科教材,学一下统计学就够了。
一是让你相信统计本身是一门科学,这不是星座算命。
二是在研究数据时,知道一些特征是负责统计学规律的。我在刚参加工作时,看到百度知道过亿的用户访问,但每天访问的量波动不超过3%,感觉太神奇了。
编程能力:学会一门编程语言,会让你处理数据的效率大大提升。如果你只会在Excel上复制粘贴,动手能力是不可能快的。我比较推荐Python,上手比较快,写起来比较优雅。
数据库:数据分析师经常和数据库打交道,不掌握数据库的使用可不行。学会如何建表和使用SQL语言进行数据处理,可以说是必不可少的技能。
数据仓库:许多人分不清楚数据库和数据仓库的差异,简单来说,数据仓库记录了所有历史数据,专门设计为方便数据分析人员高效使用的。
数据分析方法:对于互联网数据分析人员来说,可以看一下《精益创业》和《精益数据分析》,掌握常用的数据分析方法,然后再根据自己公司的产品调整,灵活组合。
数据分析工具:SAS、Matlab、SPSS这些工具经常有人推荐,我要说的是在互联网公司一般都用不上。
做可视化的Tableau,统计分析的友盟、百度统计,还有像我们神策分析等。
这些工具本身不一定能满足你的所有需求,但会让数据分析变的更高效。我自己整理过一个豆瓣书列,有兴趣的可以看看:数据分析师豆列。上面的内容学习后,只能说成为一名合格的数据分析师。
要成为高级数据分析师的话,一方面是要强化对业务的理解,最好是做到通过数据分析帮助公司决策方向,或者说促进企业快速增长。另一方面,要加强机器学习/数据挖掘的专业知识学习,将机器学习成为数据分析的手段。比如预测用户的流失,对用户进行自动分类等。你能提供的价值就大不相同了。最后,要强调的是,数据分析师是一个实践的职位,要在实际项目中不断的训练,才能成为高手。