word2vec模型
word2vec 模型有两种: Continuous Skip-gram Model 和 Continuous Bag of Words Model (CBOW)。
本文主要讲解skip-gram, 因为Skip-gram用的多一些。
关于这两个模型的描述可以参考大神Mikolov的论文Efficient Estimation of Word Representations in Vector Space。
Skip-gram 利用一个句子中某个单词来推测上下文单词, CBOW利用一个句子中的上下文单词来推测句子中的某一个单词。
上面这句话比较抽象, 下面举个栗子: