1
数据分析师先学工具是本末倒置。
很多数据分析的书籍和课程都是从统计学知识入门的,很多人在被一堆概念*之后,反而不知道该如何入手。
先要有分析思路,其实在实践中学习是最快的成长路径,假设你已半路出家或者正在做分析项目,在此过程中遇到的难题,就是你成为分析师所需要具备的能力。
做数据分析师十之八九都会面临以下情景:“我们有一堆数,你分析分析吧,看看能有什么结果。”
有经验的分析师因为经验老道,会清楚地知道从什么角度分析,可以解决哪些问题,适用于哪些场景,预计产生什么结果,会将业务问题转化为数据分析问题。
因此数据分析师要具备用数据分析思路和方法,具备分析思维来考虑问题的能力。
那作为小白,在没有项目经验时候,可以充分利用模仿技能,参考他人优秀的分析思路和方法。
实际业务分析的大多数问题都是有前车之鉴可以学习的。很多分析已经是成熟的分析方法,例如客户画像,营销提升,网站运营,信用卡评分,欺诈作弊等等。
学习领会他人的分析思路,转化为自己的知识,是迈出分析的第一步。
业务知识重要性
所有数据分析师都会告诉后来人“业务知识很重要”,因为大家在踩了坑之后才恍然大悟分析中遇到的很多难题问题都源于对业务的不了解。数据分析可以说是一门通用的技术,可以运用于各行各业,但是想在行业中成功则需要结合行业知识。
例如,同样是对客户进行分析,互联网电商的客户与保险客户具有明显区别,前者重视来源,活跃度,购买率,流失率,后者关注渠道,报价,理赔风险,投诉。业务知识包括这种大方向的行业知识,也包括公司内部特殊情况,了解得越详细可以避免绕很多弯路。
例如,有些行为是内部人员参与的造成的数据异常要提前做处理,有些业务开展是带地区特性的,分析时候要区分对待等。
恶补专业知识
当模仿别人的分析思路和方法时候,分析大方向已经确定了,具体部分需要结合自己的项目情况进行细化。如果只是简单的数据汇总就能解决的问题就可以直接进入实操阶段,但是如果发现需要运营一些复杂的分析方法,则不得不恶补专业知识。
例如做营销提升,看到多数分析思路中都提到了产品关联分析。什么是产品关联分析,需要具备哪些数据,用什么算法,结果怎么应用,产品关联分析适不适合你目前的场景,这些问题需要恶补分析知识才能回答出来。
眼花缭乱的分析工具
真正做分析时候,你会发现市面上有太多的分析工具,需要掌握的实在是太多了,其实不必纠结于此,依据个人能力,配合当前的数据分析环境,适用的工具自然会被选出。
数据分析过来人都会说80%的时间都在做数据处理工作,所以数据处理能力是必须的,简单工具有Excel、SQL,复杂的有R,Python,Java。商业工具的报表finereport,SASS。
然后分析建模的能力,鉴于目前有丰富的算法与成熟的模型调用机制包括商业软件,开源工具等,多数时候仅需要懂得算法原理,然后在实际中调用工具实现即可,不必惊慌。最后是分析结果展示能力,如果是报告或报表则需要运用图表,有效表达分析观点,使分析结果一目了然。图形的选择、版式的设计、颜色的搭配等等,需要掌握一定技巧。如果是线上应用则需要掌握部署的能力,利用接口调用连接分析与业务。
啰嗦了很多,总结一下数据分析师应该从思维开始,以业务与专业知识为助力,以实际动手操为入口,开启新征程~
2
1)
想吐槽下sql,python,r,spss,excel,sas都是工具,做数据处理的,完全没必要用这么多,以我为例,主要是sql,python,excel为主。以前我也学过r,工作中python几乎都能搞定,没想到什么场景python不行r上的。我个人觉得sql必备,python,r和选一个熟练即可,至于spss,sas这种收费的,互联网一般不咋用。
2)
数据分析师是比较看重经验:换句话说,你应届生没有经验想拿高薪不是不行,首先你地点是一线,或者部分二线(例如杭州,成都)。其次,你学校最好是985.211(应届生学校专业太关键了)。再者,你要有较有含金量的项目(例如算法比赛TOP排名)
3)、9012年了,做数据还不懂机器学习真得不咋行:题主技能和统计学都ok的情况下,那机器学习可能要开始的,常见的模型的推导以及python库的应用要懂。还要了解一些计算机相关的,比如计算机网络(TCP协议/IP协议),一些前端的基础知识html,css,能够在linxu环境下跑脚本等等。
总得来说:面试官对于应届生较看重的应该是学习及专业,如果TOP学校会加分很多。其次是项目、技能、面试表现。学校不行就要在这些地方下功夫,项目做得有亮点,数据分析报告一两份准没错,算法比赛去打打肯定也是OK,除此之外你还可以做一些数据产品,比如自定义bi(web),这个可以参考python的plotly.dash这个库,和一些前端的知识,做完后租一个服务器部署上去,这个项目能体现(数据处理能力,linxu,前端,部署能力等等)。再或者基于python的itchat库做一个微信聊天机器人(主要用于别人简单的数据需求,可以用这个自动化回复),这块又需要一些flask的知识。讲了这么多,我觉得在这个数据竞争激烈年代,还口口说sql,python,excel之类的东西真得很小白,想与众不同,该有的是“数据产品开发”的能力,让面试官看到项目的亮点。
最后,大厂的数分岗优秀的应届生上万真得很普遍,但如果刚出来,数分和java的薪资对比,那肯定是java高些呀。
3
既然你是数据分析师,那我就问你,现在你想知道会spss,SQL,Python,r,Excel,sas,信息科学专业的学生能赚多少钱,你需要做哪些分析才能得出一个比较准确的结论?
首先是你的数据获取,能查询到应届生相关薪资的途径是很多的,比如你登录各种求职网站和公司秋招网站,分别取和你条件完全匹配的公司招聘职位;略胜过你条件的职位;你完全能胜任的职位,分别取个七八家,可以加上一线城市等等一系列自定义条件,然后看人家开的薪资范围,自己计算一个大概波动值和对薪资影响比较大的因子,不难吧?
知乎的问答里面,每年秋招各大大厂的offer均价和sp offer都会有很多人分享,你愿意付钱的话还有各种匿名投薪资的网站,应届生有offershow的微信小程序
秋招季各个公司来学校的宣讲会也很多,去问问人家hr不比你来知乎提一个“我是不是只能赚6K”的问题好很多?简历都不给,谁知道你写代码是什么水平,现在我给你一个kaggle的数据集,你能独立完成一个从样本选取-建模-测试的项目来坚决问题吗,自己有没有建模能力,还是只会R里面调调人家调好的tidyverse ggplot做掉包侠?如果我不给你数据集,要你自己去市场调研,你怎么取数据?如果我给你的数据是乱的,你有能力清洗然后建立数据库吗?如果我给你一家上市公司的财报数据,你给我分析一下它未来的业务方面有什么潜在风险,你能答多少呢?
其次是你的数据源有多可靠的问题,“接触到一位做数据分析的朋友”,请问这位朋友的职业,所在城市,公司在行业中的情况,他本人的简单经历?他为什么给了你这个判断,他看过你的简历没有?他的年薪又是多少,是不是管理职级?我的同学毕业后也有只8k的,我是15k,请问我同学和你说“做数据分析只能赚8k”和我和你说“做数据分析能赚15k”,你相信谁?
我再重复一次下面@李启方提到的数据分析师经典名句:数据分析师先学工具是本末倒置
数据分析师的能力核心是发现问题并解决问题,至于你提到的一系列数学能力和编程工具,只是解决问题的工具,对发现问题、思维训练这一块是没有覆盖的。
会SQL Python,r ,spss ,Excel,只能成为薪资6k左右的业务数据分析师吗?