决策树Decision Tree

信息熵

H ( X ) = ∑ x ∈ X − P ( x ) l o g ( P ( x ) ) H(X)=\sum \limits_{x \in X}-P(x)log(P(x)) H(X)=x∈X∑​−P(x)log(P(x))

信息增益

特征A对训练样本集D的信息增益g(D,A),定义为集合D的信息熵H(D)与特征A给定的条件下D的信息条件熵H(D|A)只差
即公式为 g ( D , A ) = H ( D ) − H ( D ∣ A ) g(D,A)=H(D)-H(D|A) g(D,A)=H(D)−H(D∣A)
表示得知特征X的信息而使得类Y的信息的不确定性减少的程度

上一篇:Swoole学习笔记(二):进程和事件IO


下一篇:基于机器学习的心脏病预测方法(8)——决策树(Decision Tree)