使用1和0,或者positive和negative表示事件的相對立的兩種可能情況。(這里指二元分類問題)
e.g.
垃圾郵件與非垃圾郵件等
g(z) = 1/(1 e-z):值的范圍屬于[0,1]
hθ(x) = g(θTx),? ?g(θTx) = 1/(1 e-θTx),其中
?
?
?J(θ) = (1/m)?Σ1,m(1/2)(hθ(x(i)) - y(i))2
但是上述函數不是凸函數,存在多個極值點,為此我們轉換如下:
即:
?
?
?
?
overfitting--過度擬合--high varience:擬合線與點重合比較好,但是對未來的數據點預測性極差
just right--擬合剛好
underfitting--欠擬合--high bias:擬合不充分
?e.g.
Adressing Overfitting(過度擬合的解決方法)
1.刪除部分特質,可以使用人為選擇或者采用模型選擇算法,這種方法會丟失信息,有時會導致擬合失敗
?2.正則化,降低特征的值或維度,實際表現較好
?損失函數
梯度下降
正規方程
?
?損失函數
梯度下降
?
?
來源:http://www.icode9.com/content-4-155451.html