三个周末的SAS课程宣告结束,
总结下来
第一周的统计原理简介
第二周/第三周讲解SAS的基本操作.
总体下来,对自己的知识结构有了一个新的梳理,对比大学时期,某个老师一上来就教我们SAS编程,而未考虑实际应用,这个课程无异是成功的.
在课程中期就开始使用onenote进行笔记记录.总结下来分为
1.SAS的窗口界面,字体设置,以及打开,定义库等基本操作;
2.SAS的基本语句,包括DATA步,PROC步,以及单独拎出来讲的PROC SQL步;
3.SAS对单个变量,或者对表对库的基本操作,如freq作图,option控制全局;
4.SAS对数据导入的格式处理,如默认为第一行的数据长度,容易出错的点,还有对数据集的查重,联合,追加,以及各个数据步的细微差异
5.SAS EG或EM的实际操作,包括信用卡数据挖掘,评分卡打分判断,以及对好坏客户的抽样演练等.
此次课程最大的感受是,
基础很重要,但是有数据实操更加重要.数据分析师或者数据挖掘的工作,一定程度上,都是用大数据喂出来的.所以,在企业内部做,肯定比在学校里,接触不到商业数据源的学生,短期内进步快.
然后,数据挖掘数据建模,至少60-70%的工作时间要花费在数据清洗方面,排除异常点,结合业务了解需求.除了机器采集的数据,其他人工数据,都是不能全信的.
另外,培训老师有一点讲的很有意思,有时候,一个软件学起来,或许会很慢很累.但是如果多个软件或者多个统计语言结合起来学习,虽然一开始会很麻烦,学习曲线比较陡峭,但是当找到入门的方法后,这个学习速度就会变得很快,因为软件之间的功能是可以相互照应的.
从书堆里翻出SAS编程和R语言实战,打算把这两个语言结合起来学习.