学习方式上,我发现我更喜欢遇到问题了然后去学习相应的知识来解决。而不是一次性把相关知识都看懂了,再来解决某个问题。这学期的学习基本上都是这个模式。以前处于各种原因,都是用第二种方式来学习的。现在尝试了一下第一种,感觉不错。以后就用这种模式了。
Paper什么的就不说了,自己略挫,做的也不值一提。
Get到的东西:
1. Python. 科研上的绝大部分事情现在可以用pyhon解决,已经度过了一开始动不动就去*的状态。用过的package有nltk, beautifulsoup, LA. 这些都是project或者实验需要的时候去现学现卖的。不过也因此,这些package了解的不算深,基本上都是把对应部分的文档看了看。python也是,并没有像原来学C++那样啃了一本书先。不过我觉得还是需要体系地看看的。
2. PMF. 这学期的research基本上和它在打交道。自己也用python实现了(实在看了太多遍了,现在估计都能不经思考直接写出来了)。不过感觉程序效率还不是很高,这也是以后要改善的地方。And它的原理其实没有完全掌握,也是future work了。
3. Weka. Data mining的project用到这个。project的题目是自定的,给定网页的文本和一些feature(事实证明这些feature不靠谱),训练出一个分类器,对网页分类(时效性网页与非时效性网页)。Weka主要是用来提取feature,对文本向量化,设定各种选项(ngram, stopwords, TF-IDF/BOW, stemmer)。选择各种分类器。现在只用了explorer,GUI下是很熟。接口上当时因为时间原因就没了解了。再度future work..
4. English Writing. 这个算是被写paper练出来的吧。说实话还是归功于考托福那段时间对这方面的总结。现在还很受用。有种阶梯性上升的感觉。
5. Big data. 这门课混了个A-。对Big data很多东西有了个初步的了解。其它的就没啥了。Assignment还是挺不错的。
6. Data Mining. 这门课混了个A。对各种技术都有所了解。如果要针对里面任何一项展开研究,都有些基础了。这学期我重心放在research上,没想到课业成绩混得不错,真是呵呵呵呵。狗改不了吃屎。
7. 对学术界的了解比以前深多了。
To learn:
1. 这学期修了一门Computer Network & Security. 对这方面几乎不懂。本着不作死就不会死的原则,我还是作死了一回。因为真觉得这挺interesting的。虽然可以继续选AI相关的course,不过那样永远接触不到新东西,会越来越固步自封。就算是偶尔地圆圆hacker的幻想,也需要好好学。
2. English Writing. 这是我的优势,要发展成胜势。要把standford那些视频给看了。
3. Python. 系统看看。最好能做个小project。
4. PMF的原理。
5. VIM
6. Bash Script & Linux Basics