目录
一、下载LibSVM
LIBSVM -- A Library for Support Vector Machines
二、使用LibSVM制作鸢尾花数据集
将下载好的压缩包解压
打开后点击Windows,找到svm-toy.exe的运行程序并运行
手动生成
然后点击保存,在点几个数据,再点击保存
三、利用上述数据集实现模型训练并写出决策函数的数学公式
打开IDEA
新建一个java项目
将解压文件下的Java文件中的libsvm文件中的所有文件复制到项目中
在项目中新建一个Test
将Java中的4个文件复制进去
然后在test类中添加代码
package test;
import java.io.IOException;
class test1 {
public static void main(String args[]) throws IOException {
//存放数据以及保存模型文件路径
String filepath = "D:\\SVm test\\";
/*
* -s 设置svm类型:默认值为0
* 0– C-SVC
* 1 – v-SVC
* 2 – one-class-SVM
* 3 –ε-SVR
* 4 – n - SVR
*
* -t 设置核函数类型,默认值为2
* 0 --线性核
* 1 --多项式核
* 2 -- RBF核
* 3 -- sigmoid核
*
* -d degree:设置多项式核中degree的值,默认为3
*
* -c cost:设置C-SVC、ε-SVR、n - SVR中从惩罚系数C,默认值为1;
*/
String[] arg = {"-s","0","-c","10","-t","0",filepath+"456.txt",filepath+"line.txt"};
String[] arg1 = {filepath+"678.txt",filepath+"line.txt",filepath+"predict1.txt"};
System.out.println("----------------线性-----------------");
//训练函数
svm_train.main(arg);
svm_predict.main(arg1);
arg[5]="1";
arg[7]=filepath+"poly.txt";//输出文件路径
arg1[1]=filepath+"poly.txt";
arg1[2]=filepath+"predict2.txt";
System.out.println("---------------多项式-----------------");
svm_train.main(arg);
svm_predict.main(arg1);
arg[5]="2";
arg[7]=filepath+"RBF.txt";
arg1[1]=filepath+"RBF.txt";
arg1[2]=filepath+"predict3.txt";
System.out.println("---------------高斯核-----------------");
svm_train.main(arg);
svm_predict.main(arg1);
}
}
点击运行
输出参数说明
optimization finished,#iter = 17 //17表示迭代次数,
nu = 0.3844657082933367 //核函数的参数
obj = -138.55922083214205, rho = -1.426383952712586
//obj是SVM转换为的二次规划求解得到的最小值对偶题的最优目标值,rho是决策函数 //sgn(w^x-rho)中的偏差项(也是b,wx+b)。
nSV = 19, nBSV = 16 //nSV是支持向量的个数,nBSV是边界上支持向量的个数
Total nSV = 19 //支持向量的总的个数
Accuracy = 91.37931034482759% (53/58) (classification) //精度
分析结果可知多项式和高斯核训练的模型精度略高于线性
决策函数
在D:\SVm test目录下生成了
任意打开一个文件
可以看见文件中除了有上述输出参数以及所有支持向量的数据。
四、总结
使用LibSVM工具进行决策树训练,不仅能够直观地以图形界面显示,也能利用工具中的代码灵活地在项目中使用,并得到相关系数的输出