第5章 分类的进一步探讨—算法评估及kNN
写给程序员的数据挖掘实践指南
回到上一章中关于运动员的例子。在那个例子中我们构建了一个分类器,输入为运动员的身高、体重,输出为其从事的体育项目—体操、田径或篮球。
因此,左图的Marissa Coleman身高6英尺1英寸,体重160磅。我们的分类器能够将她正确判断为篮球运动员:
>>> cl = Classifier('athletesTrainingSet.txt')
>>> cl.classify([73, 160])
'Basketball'
而另一个身高4英尺9英寸体重90磅的人可能是体操运动员:
>>> cl.classify([59, 90])
'Gymnastics'
一旦构建了分类器,我们就可能有兴趣回答类似下述的问题:
怎样才能回答上述问题呢?