将y=xw+b转换为分类问题,可以加一个sigmoid函数(也叫logistic),即y=(xw+b)
之后输出的值不再是一个连续的范围,而是约等于一个[0,1]的值。
即当p(y=0|x)接近于0的时候代表不是这一类,而接近于1的时候,代表是这一类。
对于classification问题,if p(y=1|x)>0.5,判别为1,否则判别为0
而对于多分类问题来说,就会有以下关系
这里我们有一个新的约束,。
如何生成这个约束条件?
我们可以使用之前介绍的softmax函数
可以从下边的笔记看出,本来是2,1倍数被放大,后来变成了0.7,0.1。直接从两倍变为了三倍。更容易分类了。