实现logisitc回归模型

1,库文件
首先载入几个需要用到的库函数:

  • numpy:python的基本库,用于科学的计算
  • matplotlib.pyplot:用于生成图片
  • 掊:定义load_data_sets() 方法,用于载入数据

2 载入数据
猫的图片数据集用hdf5的形式存储:
训练集:包含了train_num个数据集,数据的标签分为cat(y=1)和not-cat(y=0)
测试集:包含了test_num个数据集,数据的标签和上面一样
每个图片的存储格式都是(px-num,px-num,3)数字三表示
3,数据预处理
数据预处理就是为了获取数据的相关信息,如训练样本数,测试样本数和图片的长度和宽度。
接下来需要进一步数据处理,为了便于训练,可以忽略图像信息,将包含的长宽高和通道信息的三位数据组压缩成一维数据,图片的数据形状由(64,64,3)转变为(64643,1).数据再训练之前要进行归一化,因为图像的像素点是3通道存储的每个存储的像素都是256
4,模型结构
完成数据处理工作后,开始模型训练过程:初始化模型参数,正向传播和反向传播,利用梯度下降法更行数据参数,利用模型进行预测和分析数据结果。
首先是激活函数,接下来初始化模型参数(利用numpy函数完成),然后接下来就是定义正向传播和反向传播这两个过程包括在一个函数中,这个函数中。这个函数的关键就是计算成本函数和梯度函数。定义成本函数后在定义一个参数更新函数,利用dw和db进行参数更新。
接下来是定义优化函数,根据迭代次数调用参数更新函数,注意在参数更新的时候维护成本,每100次迭代一次计入成本。
5,模型检验
以上内容完成了模型的训练过程,得到的了最终的参数w和b,接下来利用函数训练完成的模型进行预测。

上一篇:jenkins常用插件汇总


下一篇:JDBC、MyBatis、Hibernate的区别