机器学习(四)
2.5 逻辑回归
逻辑回归,用于估计某种事物的可能性,现实中常用于广告预测、疾病诊断预测等场景。
2.5.1 逻辑回归原理
常用的分类方法,最常见的是用于处理二分类问题,即分类为0或1(逻辑值),用一条直线将实例分类。
2.5.2 Sigmoid()函数
Sigmoid()函数,简称S型函数,是数值和逻辑值的一个转化函数工具,作用是将x从负无穷到正无穷的取值范围映射到y的0~1的取值范围,0,1分类不是连续的,所以用一个平滑的函数拟合逻辑值。
2.5.3 逻辑回归算法
- 逻辑回归算法:发现逻辑函数——构建成本函数——求解成本函数。
逻辑回归算法流程图
2.5.4 逻辑回归法对鸢尾花分类(python实例)
from sklearn.datasets import load_iris
import matplotlib.pyplot as plt
import numpy as np
# 加载鸢尾花数据集
iris = load_iris()
# 获取数据集中的数据
data = iris.data
# 读取数据集中的目标数据
target = iris.target
x = data[0:100, [0, 2]]
y = target[0:100]
print(x[:5])
print(y[-5:])
# 存储单一数据类型的多维数组给label
label = np.array(y)
# 令label=0,生成新数组index_0
index_0 = np.where(label == 0)
plt.scatter(x[index_0, 0], x[index_0, 1], marker='x', color='b', label='0', s=15)
index_1 = np.where(label == 1)
plt.scatter(x[index_1, 0], x[index_1, 1], marker='o', color='r', label='1', s=15)
plt.xlabel('x1')
plt.ylabel('y1')
plt.legend(loc = 'upper left')
plt.show()
2.5.5 损失函数
- 损失函数的本质是衡量“模型预估值”与“实际值”的距离