机器学习十大算法之KNN算法
前段时间一直在搞tkinter,机器学习荒废了一阵子。如今想重新写一个,发现遇到不少问题,不过最终还是解决了。希望与大家共同进步。
闲话少说,进入正题。
KNN算法也称最近邻居算法,是一种分类算法。
算法的基本思想:假设已存在一个数据集,数据集有多个数值属性和一个标签属性,输入一个新数据,求新数据的标签。
步骤如下:
先将新数据拷贝n份,形成一个新的数据集;
逐行计算新数据集与原数据集的距离;
按距离长度排序后,统计前K个数据里,那个标签出现的次数最多,新数据就标记为哪个标签。
算法如下: