模式识别（二）线性分类器（待续）

模式识别（二）线性分类器2.1 引言2.2 线性判别函数和决策超平面2.3感知器算法2.4最小二乘法2.5 均方估计2.6逻辑识别2.7支持向量机2.1 引言2.2 线性判别函数和决策超平面2.3感知器算法2.4最小二乘法2.5 均方估计2.6逻辑识别2.7支持向量机...

柳叶吴钩

516人浏览 · 2020-05-18 01:10:46

柳叶吴钩 · 2020-05-18 01:10:46 发布

TOC

2.1 引言

某些情况下，分类器等价于线性判别函数，其优点是简单和可计算性。

2.2 线性判别函数和决策超平面

$l$ 维空间中，各自的决策超曲面是一个超平面：
$g(x)=w^Tx+w_0=0$
有：
$d=\frac{|w_0|}{\sqrt{w_1^2+w_2^2}}$
$z=\frac{|g(x)|}{\sqrt{w_1^2+w_2^2}}$
$∣ g (x) ∣$ 是x到决策超平面的欧几里得距离

2.3感知器算法

感知器代价函数：
$J(w)=\sum_{x\in Y}(\delta_x w^Tx)$
利用梯度下降方法设计迭代算法：
$w(t)-\rho_t \frac{∂J(w)}{∂w}|_{w=w(t)}$
$\frac{∂J(w)}{∂w}=\sum_{x\in Y}\delta_x x$
整合上面两式得：
$w(t)-\rho_t\sum_{x\in Y}\delta_x x$

伪代码如下：

随机选择 $w (0)$
选择 $\rho_0$
t=0
重复
–Y=0
– For i=N to N
–IF $\delta_{x_i}w(t)x_i ≥ 0$ then Y=Y∪{ $x_i$ }
– End {For}
–w(t+1)=w(t)- $\rho_t\sum_{x\in Y}\delta_x x$
–调整 $\rho_t$
–t=t+1
直到Y=0

2.4最小二乘法

2.4.1 均方误差估计

计算权向量，使期望值和真实的输出值之间的均方误差最小化，即：
$J(w)=E[y-x^Tw|^2]$
$\hat{w} = arg \min_w \ {J(w)}$
即：
$J(w)=P(w_1)\int(1-x^Tw)^2P(x|w_1)d_x+P(w_2)\int(1+x^Tw)^2dx$
最小化得：
$\frac{∂J(w)}{∂w}=2E[x(y-x^Tw]=0$
则
$\hat{w}=R_x^{-1}E[xy]$
$R_x= \begin{pmatrix} E[x_1x_1]& \cdots &E[x_1x_l] \\ E[x_2x_1]& \cdots &E[x_2x_l] \\ \vdots & \vdots & \vdots \\ E[x_lx_1]& \cdots &E[x_lx_l] \\ \end{pmatrix}$

称为相关或自相关矩阵，若各自的均值为0，则为协方差矩阵。

2.5 均方估计

2.6逻辑识别

2.7支持向量机

CSDN学习社区

CSDN联合极客时间，共同打造面向开发者的精品内容学习社区，助力成长！

更多推荐

Kaldi之父，IEEE Fellow，小米首席语音科学家Daniel Povey将出席2024全球机器学习技术大会并发表演讲！

CSDN学习社区

探索神经网络在商品销售和图像识别中的应用

CSDN学习社区

基于stm32F103的座面声控台灯

CSDN学习社区

所有评论(0)

查看更多评论

柳叶吴钩

@moge19

已为社区贡献4条内容