我,大专毕业2年,从前端转型大数据开发,薪资涨了10K!

今天分享学习群一位同学的转型经历,他19年大专毕业后从事了前端开发,今年顺利转到大数据,从薪资8K涨到18.5K,分享一下他的学习经历给大家参考。


我,大专毕业2年,从前端转型大数据开发,薪资涨了10K!


一、自身情况


大家好,做个简单的自我介绍。本人今年23了,98年生人,没有经历过高考,所以直接是去上了一所大专,专业是移动互联,也是打小对互联网比较感兴趣报了这个专业。因为是大专毕业,算起来工作时间应该是两年多了。大学里基本没能学到啥东西,学校也是基本是属于啥都教的状态,像什么安卓开发,苹果开发,C语言,java,前端,嵌入式,低代码平台等等...不过也意味着一个问题,啥都教就等于啥都学的很浅,我记得当时的前端只教了html还有css,js都没有去学过,就离谱...


二、工作经历


再讲讲工作经历,得益于上学的时候自学过微信小程序的开发,找了一份前端开发的实习工作,小声逼逼一下很感谢当时的公司并没有嫌弃我。


后来干了一年多公司黄了。又找了一个游戏开发的工作,主要是做安卓端app的开发,然后干了没半年,老板跑路了,被社会上了第一堂课,劳动仲裁了两三个月,直到现在钱也还没拿回来....


再后来同学内推我进了一家医疗公司,主要干sql运维的活,当然,也就是这样,了解到还有大数据这个行业,我又从网上了解了下大数据行业的薪资,当时就是一句卧槽,于是决定转行到大数据。


三、转行过程


转行过程相对于来说还是比较痛苦的吧,当时也是没有目的的去网上找一些资料去看,后来就刷到了峰哥,加进去了学习群,然后就跟着群里的学习资料慢慢来,还记得当初在本地搭虚拟机,就搭了一周,心态快崩了23333。



因为我是大专学历,总怀疑自己学了之后能不能转成功,但每当我低落的时候就看看峰哥发的这些转型案例:《大数据转型案例合辑》,顿时就打了鸡血,能不能行得自己努力了才知道。


有点低下。本来想裸辞报培训班,后面混入了一个培训班学生建的群了,里面都是各种吐槽培训班,什么学习进度太快,学完之后老师也不管,直接丢给你简历让你照抄,收到面试通知之后培训班老师帮忙面试等等。


于是我打消了报培训班的念头,让峰哥帮忙规划了学习路线和给到我一些资料,峰哥也让我别这么早裸辞,可以先把基础学完再说。



按照峰哥给的学习计划和资料,我利用业余时间把基础学的大差不差。于今年年前辞职,然后过年后在家脱产学习了两个月,感觉到差不多了。一个人北上去找工作,不负这半年多来的学习,当时收到offer的时候都快哭了。


 四、面试


刚开始投简历的时候也怕没有面试机会,但担心多余了中小公司的面试机会多的让我猝不及防。


我,大专毕业2年,从前端转型大数据开发,薪资涨了10K!


,基本临场就脑子一片空白。刚开始面得几家,基本都是属于被面试官吊打,一问三不知的状态。


不过多面面就好了,项目上面多花一点心思,跟面试官多聊聊,有不会或者有疑问的还可以问问面试官,面试完总结复盘,然后再让峰哥把把关,没有什么其他的技巧了,多总结,查漏补缺就是了....就是多面试,多总结,可以先拿小公司练练手hhh。


总结一下我当时面试的情况吧:


1)技术框架部分:  (1)会根据面试者简历上的技能点进行考察。注意技能点描述用词,不要随便用熟悉,觉得特别熟的可以说熟练使用  (2)常用的大数据框架是肯定会问的,比如Hive、Spark、Kafka等。常见的如Kafka精准消费问题的多种解决办法对比,Spark的Task调度规则  (3)Java,MySQL,Redis必问,MySQL的索引及优化,Redis数据结构、集群、缓存淘汰


2)项目部分:  (1)一般会让你挑你最熟的一个项目讲。考察从项目背景到实现的把控  (2)重点是参与的部分,遇到的难点  (3)常见业务难题的解决和优化,层层递进,追求做到极致  (4)没有做过的项目、模块不要乱讲,容易被问懵逼或者被太简单被鄙视


3)算法部分:  (1)数据结构必考,手写代码,大一点的公司每一面都会考。常见数组、链表、二叉树、跳表的题。有些部门会先笔试(电脑实际编码运行)再面试  (2)算法部分常见动态规划、概率题、二进制一类  (3)SQL题目,行列转换。分区函数,统计连续登陆天数这一类问题  (4)多刷Leetcode,题都是有套路的


4HR部分:  (1)想好跳槽理由,一般注重抗压能力和稳定性


五、部分面试题



因为我学习时间比较仓促,学了一个数仓项目和一个实时项目,但实时项目还不太熟悉,把数仓写在了第一个,所以面试基本都问数仓。



1. 自我介绍?2. 你是怎么接触的大数据?3. 你们的数仓模型是什么样的?4. 星型模式、雪花模型、星座模型各有什么好处?5. 数仓分层架构的设计及每一层干什么的?6. 你们数仓中拉链表怎么设置的?7. 你们拉链表有分区吗?拉链表分区是怎么控制的?(我说的是每天全量刷新,他接着问如果你们数据量特别大呢?怎么解决的?)8. 事实表有哪些?事实表中的历史数据怎么修改?(这个没答上来,面试官说你们没有做过快照表吗?这个没听说过)9. 你们工作中实际的工作流程是怎么样的?10. 如果给你提一个需求,需要将ods、dwd、dws层数据全部都要用到,并且需要全部都要重新在做一遍,然后为了生成这个ads层数据的结果,你是怎么避免这种烟囱式式开发的?(这个我没太懂意思,然后说的没遇到过)11. 你们元数据管理怎么做的?12. 你们数仓部门几个人?13. 你们集群是什么规模?每台服务器什么配置?14. 数仓中用的存储格式是什么?ORC和Parquet一般是什么场景下用?15. Hive中的UDF和UDTF?16. 开窗函数的介绍?排序的函数?17. Sort by和Order by的区别?18. 行转列和列转行用的哪些函数?19. Hive中Join的工作原理?20. mapJoin的工作原理?21. 你们工作中Azkaban怎么实现的跨工作流?比如说ads层的一个指标需要依赖于一个宽表,肯定不在一个工作流中,你们是怎么处理这种情况的?22. 工作中如果做一个指标需要依赖于别人开发设计好的一张宽表,这种场景你们是怎么处理的?23. 你为什么要离职?24. 你是主动提出离职的还是公司不给你续签合同了?25. 你们公司在哪个地方?26. 你住在哪个地方?去公司要多久时间?27. 数仓怎么搭建起来的?28. 你们数仓怎么建模型的?怎么分层的?29. 如果要让你设计一个模型的话,你会怎么设计?(可以随便举个例子来说)30. 指标分析你们主要是用的什么?31. 谈谈你对Hive的优化以及写SQL过程中的优化?32. Select * 与Select 写全部列名  这两个有什么区别吗?33. 一个SQL题:如何去求这一天24小时每隔5分钟的股票的一个峰值和低估值?(不是实时的,数据可以是昨天一天的数据)34. 你有什么问我的吗?


  六、总结

这次的转型学习和面试让我觉得大数据也没想象中的那么可怕,另外就是原本我一直担心的学历问题,会影响一些大公司的面试,但中小公司好像没什么影响,等工作稳定了之后还是需要再升个本,也补补实时和计算机基础,争取下一次能进大厂,干就完了!

--end--

上一篇:kvm虚拟化学习笔记(十二)之kvm linux虚拟机在线扩展磁盘


下一篇:手把手教你学Numpy,从此处理数据不再慌