1、最小二乘支持向量机LSSVM基本原理
最小二乘支持向量机是支持向量机的一种改进,它是将传统支持向量机中的不等式约束改为等式约束, 且将误差平方和(SumSquaresError)损失函数作为训练集的经验损失,这样就把解二次规划问题转化为求解线性方程组问题, 提高求解问题的速度和收敛精度。
常用的核函数种类:
2、LSSVM工具箱的使用方法
2.1 最小二乘支持向量机Matlab工具箱下载链接:https://www.esat.kuleuven.be/sista/lssvmlab/(毫无疑问下载最新版本)
2.2 将LS-SVM文件添加到matlan使用路径中,便可直接使用。
具体使用步骤:
1 导入训练数据:load 读取mat文件和ASCII文件;xlsread读取.xls文件;csvread读取.csv文件。
2 数据预处理:效果是加快训练速度。
方法有:归一化处理(把每组数据都变为 - 1~ +1之间的数, 所涉及到的函数有premnmx, post mnmx, tramnmx)
标准化处理(把每组数据都化为均值为 0, 方差为 1的一组数据, 所涉及到的函数有 prestd,poatstd, trastd)
主成分分析 (进行正交处理, 减少输入数据的维数, 所涉及到的函数有 prepca, trapca)
3 LS-SVM lab用于函数回归主要用到 3个函数, trainlssvm函数用来训练建立模型, simlssvm函数用于预估模型, plotlssvm函数是 LS-SVM lab工具箱的专用绘图函数。
4 参数说明:
A =csvread(′traindata. csv′);
Ptrain0=A(:, [ 1:13] );Ttrain0=A(:, [ 14:16);
[ Ptrain, meanptrain, stdptrain] = prestd(Ptrain0′);
[ Ttrain, meant , stdt] = prestd(T train0′);
Prestd()是数据归一化函数, 其中 meanptrain是未归一化数据之前的向量平均值 stdptrain是未归一化数据之前的向量标准差。
gam =10;sig2=0. 5;type=′function estimation′;
LS-SVM 要求调的参数就两个。 gam 和 sig2是最小二乘支持向量机的参数, 其中 gam 是正则化参数, 决定了适应误差的最小化和平滑程度, sig2是 RBF 函数的参数。 在工具箱中有一个函数 gridsearch可以在一定的范围内用来寻找最优的参数范围。 type有两种类型, 一种是 classfication, 用于分类, 一种是 function estimation, 用于函数回归。
[ alpha, b] =trainlssvm({Ptrain′, Ttrain′, type, gam, sig2,′RBF_kernel′, ′preprocess′});
alpha是支持向量, b是阈值. 。 preprocess是表明数据已经进行归一化, 也可以是′original ′, 表明数据没有进行归一化, 缺省时是′preprocess′。
plotlssvm ({P, T, type, gam, sig2, ′RBF _ kernel ′,′preprocess′}, {alpha, b})plotlssvm函数是 LS-SVM 工具箱特有的绘图函数, 和 plot函数原理相近。
simlssvm函数也是 LS-SVM 工具箱的重要函数, 其中的参数如上述所示, 原理类似于神经网络工具箱中的 sim 函数。
通过调用 trainlssvm函数和 si m lssvm 函数我们可以看到最小二乘支持向量机和神经网络的结构有很多共同之处。
与神经网络进行对比:
神经网络建立的模型要比 LS-SVM 好, 但是在预估上, LS-SVM 要优于神经网络,具有较好的泛化能力, 而且训练速度要比神经网络快。
%===================================================================== %初始化 clc close all clear format long tic %============================================================== %%导入数据 data=xlsread('数值.xlsx','Sheet1','A2:E41');%训练 data1=xlsread('数值.xlsx','Sheet1','G2:J31');%测试 [row,col]=size(data); train_x=data(:,1:col-1); train_y=data(:,col); test_x=data(:,1:col-1); % test_y=data(:,col); train_x=train_x'; train_y=train_y'; test_x=test_x'; % test_y=test_y'; %%数据归一化 [train_x,minx,maxx, train_yy,miny,maxy] =premnmx(train_x,train_y); test_x=tramnmx(test_x,minx,maxx); train_x=train_x'; train_yy=train_yy'; train_y=train_y'; test_x=test_x'; % test_y=test_y'; %% 参数初始化 eps = 10^(-6); %%定义lssvm相关参数 type='f'; kernel = 'RBF_kernel'; proprecess='proprecess'; lb=[0.01 0.02];%参数c、g的变化的下限 ub=[1000 100];%参数c、g的变化的上限 dim=2;%维度,即一个优化参数 SearchAgents_no=20; % Number of search agents Max_iter=50; % Maximum numbef of iterations % initialize position vector and score for the leader Leader_pos=zeros(1,dim); Leader_score=inf; %change this to -inf for maximization problems %Initialize the positions of search agents % Positions=initialization(SearchAgents_no,dim,ub,lb); Positions(:,1)=ceil(rand(SearchAgents_no,1).*(ub(1)-lb(1))+lb(1)); Positions(:,2)=ceil(rand(SearchAgents_no,1).*(ub(2)-lb(2))+lb(2)); Convergence_curve=zeros(1,Max_iter); t=0;% Loop counter % Main loop woa1; %% 结果分析 plot( Convergence_curve,'LineWidth',2); title(['鲸鱼优化算法适应度曲线','(参数c1=',num2str(Leader_pos(1)),',c2=',num2str(Leader_pos(2)),',终止代数=',num2str(Max_iter),')'],'FontSize',13); xlabel('进化代数');ylabel('误差适应度'); bestc = Leader_pos(1); bestg = Leader_pos(2); gam=bestc; sig2=bestg; model=initlssvm(train_x,train_yy,type,gam,sig2,kernel,proprecess);%原来是显示 model=trainlssvm(model);%原来是显示 %求出训练集和测试集的预测值 [train_predict_y,zt,model]=simlssvm(model,train_x); [test_predict_y,zt,model]=simlssvm(model,test_x); %预测数据反归一化 train_predict=postmnmx(train_predict_y,miny,maxy);%预测输出 test_predict=postmnmx(test_predict_y,miny,maxy); figure plot(train_predict,':og') hold on plot(train_y,'- *') legend('预测输出','期望输出') title('鲸鱼优化svm网络预测输出','fontsize',12) ylabel('函数输出','fontsize',12) xlabel('样本','fontsize',12) disp(['预测输出']) YPred_best toc %计算时间