模式识别(二)线性分类器(待续)
模式识别(二)线性分类器2.1 引言2.2 线性判别函数和决策超平面2.3感知器算法2.4最小二乘法2.5 均方估计2.6逻辑识别2.7支持向量机2.1 引言2.2 线性判别函数和决策超平面2.3感知器算法2.4最小二乘法2.5 均方估计2.6逻辑识别2.7支持向量机...
2.1 引言
某些情况下,分类器等价于线性判别函数,其优点是简单和可计算性。
2.2 线性判别函数和决策超平面
l l l维空间中,各自的决策超曲面是一个超平面:
g ( x ) = w T x + w 0 = 0 g(x)=w^Tx+w_0=0 g(x)=wTx+w0=0
有:
d = ∣ w 0 ∣ w 1 2 + w 2 2 d=\frac{|w_0|}{\sqrt{w_1^2+w_2^2}} d=w12+w22∣w0∣
z = ∣ g ( x ) ∣ w 1 2 + w 2 2 z=\frac{|g(x)|}{\sqrt{w_1^2+w_2^2}} z=w12+w22∣g(x)∣
∣ g ( x ) ∣ |g(x)| ∣g(x)∣是x到决策超平面的欧几里得距离
2.3感知器算法
感知器代价函数:
J ( w ) = ∑ x ∈ Y ( δ x w T x ) J(w)=\sum_{x\in Y}(\delta_x w^Tx) J(w)=x∈Y∑(δxwTx)
利用梯度下降方法设计迭代算法:
w ( t + 1 ) = w ( t ) − ρ t ∂ J ( w ) ∂ w ∣ w = w ( t ) w(t+1) = w(t)-\rho_t \frac{∂J(w)}{∂w}|_{w=w(t)} w(t+1)=w(t)−ρt∂w∂J(w)∣w=w(t)
∂ J ( w ) ∂ w = ∑ x ∈ Y δ x x \frac{∂J(w)}{∂w}=\sum_{x\in Y}\delta_x x ∂w∂J(w)=x∈Y∑δxx
整合上面两式得:
w ( t + 1 ) = w ( t ) − ρ t ∑ x ∈ Y δ x x w(t+1) = w(t)-\rho_t\sum_{x\in Y}\delta_x x w(t+1)=w(t)−ρtx∈Y∑δxx
伪代码如下:
- 随机选择 w ( 0 ) w(0) w(0)
- 选择 ρ 0 \rho_0 ρ0
- t=0
- 重复
–Y=0
– For i=N to N
–IF δ x i w ( t ) x i ≥ 0 \delta_{x_i}w(t)x_i ≥ 0 δxiw(t)xi≥0 then Y=Y∪{ x i x_i xi}
– End {For}
–w(t+1)=w(t)- ρ t ∑ x ∈ Y δ x x \rho_t\sum_{x\in Y}\delta_x x ρt∑x∈Yδxx
–调整 ρ t \rho_t ρt
–t=t+1 - 直到Y=0
2.4最小二乘法
2.4.1 均方误差估计
计算权向量,使期望值和真实的输出值之间的均方误差最小化,即:
J ( w ) = E [ y − x T w ∣ 2 ] J(w)=E[y-x^Tw|^2] J(w)=E[y−xTw∣2]
w ^ = a r g min w J ( w ) \hat{w} = arg \min_w \ {J(w)} w^=argwmin J(w)
即:
J ( w ) = P ( w 1 ) ∫ ( 1 − x T w ) 2 P ( x ∣ w 1 ) d x + P ( w 2 ) ∫ ( 1 + x T w ) 2 d x J(w)=P(w_1)\int(1-x^Tw)^2P(x|w_1)d_x+P(w_2)\int(1+x^Tw)^2dx J(w)=P(w1)∫(1−xTw)2P(x∣w1)dx+P(w2)∫(1+xTw)2dx
最小化得:
∂ J ( w ) ∂ w = 2 E [ x ( y − x T w ] = 0 \frac{∂J(w)}{∂w}=2E[x(y-x^Tw]=0 ∂w∂J(w)=2E[x(y−xTw]=0
则
w ^ = R x − 1 E [ x y ] \hat{w}=R_x^{-1}E[xy] w^=Rx−1E[xy]
R x = ( E [ x 1 x 1 ] ⋯ E [ x 1 x l ] E [ x 2 x 1 ] ⋯ E [ x 2 x l ] ⋮ ⋮ ⋮ E [ x l x 1 ] ⋯ E [ x l x l ] ) R_x= \begin{pmatrix} E[x_1x_1]& \cdots &E[x_1x_l] \\ E[x_2x_1]& \cdots &E[x_2x_l] \\ \vdots & \vdots & \vdots \\ E[x_lx_1]& \cdots &E[x_lx_l] \\ \end{pmatrix} Rx=⎝⎜⎜⎜⎛E[x1x1]E[x2x1]⋮E[xlx1]⋯⋯⋮⋯E[x1xl]E[x2xl]⋮E[xlxl]⎠⎟⎟⎟⎞
称为相关或自相关矩阵,若各自的均值为0,则为协方差矩阵。
2.5 均方估计
2.6逻辑识别
2.7支持向量机
更多推荐
所有评论(0)