TF-IDF(Term Frequency-Inverse DocumentFrequency, 词频-逆文件频率),一种用于资讯检索和资讯探勘的常用加权技术。
词项t的词项频率(以下简称词频)tft,d是指词项t在文档d中出现的次数,是与文档相关的一个量,可以认为是文档内代表度的一个量,也可以认为是一种局部信息。
2023-11-27 12:48:52
TF-IDF(Term Frequency-Inverse DocumentFrequency, 词频-逆文件频率),一种用于资讯检索和资讯探勘的常用加权技术。
词项t的词项频率(以下简称词频)tft,d是指词项t在文档d中出现的次数,是与文档相关的一个量,可以认为是文档内代表度的一个量,也可以认为是一种局部信息。