TF-IDF模型

TF-IDF(Term Frequency-Inverse DocumentFrequency, 词频-逆文件频率),一种用于资讯检索和资讯探勘的常用加权技术。

词项t的词项频率(以下简称词频)tft,d是指词项t在文档d中出现的次数,是与文档相关的一个量,可以认为是文档内代表度的一个量,也可以认为是一种局部信息。

 

上一篇:分析一套源代码的代码规范和风格并讨论如何改进优化代码


下一篇:在PHP应用中简化OAuth2.0身份验证集成:OAuth 2.0 Client