时间规定:
- 2018.12.07-2018.02.15
能力养成:
- linux, shell
- python, c++(会多少算多少)
- tensorflow, keras, pytorch(tf优先)
- CNN, RNN(LSTM), BRNN, Seq2Seq, RL, Attention, fastText, TextCNN, TextRNN, TextRNN+Attention, TextRCNN(CNN+RNN)
- LR, SVM, RF, NB, CRF, LDA, XGB等
- 分词,新词发现,词性标注,短语识别,句法分析,语义角色标注,词向量理解,图embedding,NER,tcp-ip协议
- 文本分类+聚类,主题模型,命名实体识别,情感分析,意图发现,知识推理,语音识别,机器翻译,自动问答
- Hadoop / Spark
- Hive / Mysql
- 数据结构算法
- kaggle(文本分类):0.9872那个
- 可行性项目:评论文本分类(黑词参考:https://github.com/fighting41love/funNLP),机器问答(体育),