-
假说表示-进入it企业必读的200个.net面试题完整扫描版下载
资源介绍
6.2 假说表示
参考视频: 6 - 2 - Hypothesis Representation (7 min).mkv
回顾在一开始提到的乳腺癌分类问题,我们可以用线性回归的方法求出适合数据的一条
直线:
根据线性回归模型我们只能预测连续的值,然而对于分类问题,我们需要输出 0 或 1,
我们可以预测:
当 hθ大于等于 0.5 时,预测 y=1
当 hθ 小于 0.5 时,预测 y=0 对于上图所示的数据,这样的一个线性模型似乎能很好地
完成分类任务。假使我们又观测到一个非常大尺寸的恶性肿瘤,将其作为实例加入到我们的
训练集中来,这将使得我们获得一条新的直线。
这时,再使用 0.5 作为阀值来预测肿瘤是良性还是恶性便不合适了。可以看出,线性回
归模型,因为其预测的值可以超越[0,1]的范围,并不适合解决这样的问题。
我们引入一个新的模型,逻辑回归,该模型的输出变量范围始终在 0 和 1 之间。 逻辑
回归模型的假设是:hθ(x)=g(θTX)
其中:
X 代表特征向量
g 代表逻辑函数(logistic function)是一个常用的逻辑函数为 S 形函数(Sigmoid function),