不能成为数据科学家?没关系,你还可以拥有数据思维

不能成为数据科学家?没关系,你还可以拥有数据思维

数据科学家日益突显的影响力令人惊叹——每次读到这种论调的文章我都感到好笑。虽然不是所有文章都像《哈佛商业评论》一样宣称数据科学家将是“21世纪最热门的职业”,但是,几乎都是千篇一律的“我们预见了未来”的语气。我认为这种观点并没有错,但是在这种趋势中,我没有发现什么是值得惊奇或者是新鲜的。如果《洋葱报》(The Onion, 美国最受欢迎的幽默讽刺杂志)要报道,我想标题应该是:


最新研究表明,精通数学和编程的人被大量地雇佣”。


这有什么新鲜的呢?自从上世纪70年代以来,擅长数学和编程的人们就在华尔街发家致富了。随着越来越多的公司产生海量的数据,对于数学和编程技能的需求已经延伸到了新兴的行业,更不必说技术部门了。但是,数学和编程只是价值正在迅速上升的量化分析能力中的一部分。去年8月纽约时报的一篇文章是一个极好的例子,能够说明新闻媒体对此的热切关注度:一位在旧金山工作的服务生Paul Minton,在决心成为一名数据科学家后,经过3个月的编程和数据分析课程,年薪就从2万变成了六位数。看呐,一个数据科学的奇迹!


补充一点细节(这篇文章指出了此点非常值得赞扬,虽然只是略带而过):Minton拥有数学专业的本科学位。换句话说,他是一位非常聪明的服务生。我不了解Minton,也不想妄加评论他本人或者纽约时报或者服务生。但是,大多数人是没有天资在如此短的时间内实现同样的转变的。我在以前的博客和书中曾经说过,我是编程学校和非传统学习平台的忠实拥护者。但是不能只注意到Minton“仅仅3个月”就完成了他的非凡转变,却忽略了他之前数年的教育中包含了微积分,统计学,概率论和其他这些除了编程技术以外的高深课程,这些都是取得数学本科学位所必须的。我猜Minton至少对MATLAB有一点印象。对于大多数人而言,他们不仅没有数年的相关训练,而且即使接受免费培训他们也不一定能够掌握编程能力。我就是其中之一。


相比于我大学时期,现在的就业市场需要数学和统计学能力已经不再是秘密,但是这并不意味着它们更容易学习。在我大学的朋友中,我的量化分析能力至多是略高于平均水平。虽然我的微积分和统计学学得非常好,但是良好的数学基础使我能够应付我的经济学专业的同时,也让我发现擅长数学不再是我的长期优势。我清楚地认识到,我的职业生涯无法仅仅建立在我比其他人数学更好的基础上。对于数学,我想大多数人有这样的意识后都会比周围人更加困扰。


我之所以提出这些是希望当你为自己的数学学位感到害羞,听到数据科学家的需求量巨大就如听到国家橄榄球联盟的四分卫收入很高一样时,能够清醒地说,“是的,当然如此。”

好消息是,即使不能成为一位数据科学家,通过培养自己的数据思维,你仍然能够提升自身价值,使工作更出色。

 

◆ ◆ 

当今职场秘密武器:用数据说话

  

这些年有一件让事情让我震惊:大多数人对自己公司的数据的了解少之又少。我接触过的大多数公司里根本没有几个人有能力用最基本的方法分析他们的数据,更别提有足够的数据科学家人手了。最近有个大型酒店集团的营销经理向我吐槽:公司里“也就2-3个人”可以分析原始的销售数据,只有他们对业务和内部信息系统都有足够的了解。我接触的另一个商用品分销公司有几万名员工,但是只有5、6个人可以快速地回答公司高层提出的问题,其他的人要么不够了解数据库要么不够了解公司业务。还有一个大型零售连锁集团里只有很小一撮人可以很快地分析他们的原始数据。很多公司甚至专门设立了”客户洞察”部门。他们的使命是专门帮助其他部门解决跟那些该死的数据有关的问题。

 

是什么造成了这种现象呢?

 

这些公司的信息系统应该负一部分责任。现在有很多企业因为时间的积累或者是多次并购,继承了很多个不同类型的信息系统。这些系统对于没有技术背景的人来说非常难以使用。仅仅这一条就可以让大多数的人对于公司的原始数据望而却步。但是更大的障碍其实是人的惰性。就算公司有还不错的分析数据的工具(比如一个关系型数据库),也只有少数的人有耐心和好学心去了解。其他大多数人只是想等待数据出现在一个Excel表格里或者一个展示板上供他们使用。这不简单是需要学习一门新的查询语言(SQL)的问题。要想要明白公司的数据模型是怎样的,数据是怎么样存储的这些都需要反复实验,这会消耗很多耐心和精力。现实世界中的数据和在商学院中用的数据是完全不一样的,手里的数据永远没有书里的那么整洁可靠。这就是为什么绝大部分人都直接使用他们的IT部门整合好的数据。这些数据比较靠谱,不需要考虑太多跟数据本身无关的事情。

 

但是仅仅使用这些别人写好的数据报告和展示板有一个问题,就是你很难在职场中脱颖而出。因为大家的信息都是对称的,这些数据的一丝一毫所有人都看的清清楚楚。虽然数据的质量很重要,但这会大大限制你创新的能力。当你手中别人给你做好的数据并不能帮助你解答你想知道的问题时怎么办?举个例子,假设你想测试一下那些全家自驾游的客人在酒店的消费特征。这时你需要自己筛选分析那些只来过酒店一次,点了儿童菜单的东西到房间里而且还加了一张折叠床的客户。这种分析可以让你的老板认真听取你报告的内容。这种问题如果可以自己解决比要要别人帮助好十倍。

  

解决这些问题并不难,不需要高中毕业就可以搞定。你只需要合适的数据加上一颗好学心。

  

◆ ◆ 

提出简单的问题可以事半功倍

 

有人说聪明的人喜欢问复杂的问题,但是绝顶聪明的人往往会问简单的问题。的确,最重要的业务问题往往也是最简单的问题。比如:为什么客户没有选择竞争对手的产品而是选择了我们的产品?为什么曾经选择了我们产品的人却最终放弃了这个产品?我们应该为了增加销售量而降价吗?当你是职场新人的时候你往往在埋头做一些细节的工作,没人会问你这种问题。但随着你经验增多,真正可以搞定这些问题的时候你可以开始为解决公司最根本最重要的问题做贡献,升职加薪走向人生巅峰!

 

回顾我的职业生涯,我学到最有用的业务技能就是SQL,用这个语言我可以直接查询一个公司的原始运营数据,直接了解关于这个公司业务的基本特点。我渐渐发现自己很擅长提出不错的问题,需要的只是一些能帮我解决这些问题的工具。更重要的是,当一个人用过内部的数据库查询过公司的信息后你就会发现,使用数据库的经验可以教你提出更好的问题。说白了就是,用过数据库之后就知道怎样可以提出一个在数据库中可以精确回答的问题。这让人没有以前那么懒惰,因为计算机和人不一样,它并不懂得怎样揣摩你真正的意图。这样在不知不觉中就学会了如何更加系统地思考。

原文发布时间为:2016-03-18

本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号


上一篇:Java事务处理总结


下一篇:【最佳实践】运用 Logstash Fingerprint 过滤器处理并删除 Elasticsearch 重复数据