文献阅读 Linear Regression for Face Recognition
题目:Linear Regression for Face Recognition基于线性回归方法的人脸识别摘要翻译:本文提出了一种新颖的人脸识别方法, 通过线性回归的方法来表述模式识别问题. 使用位于线性子空间的单一对象类模式, 我们开发了一个线性模型, 将探测图像表示为特定类画廊的线性组合. 本文采用最小二乘法求解拟问题, 并判定有利于具有最小重构误差的类别. 所提出的线性回归分类(LRC)算
题目:
Linear Regression for Face Recognition
基于线性回归方法的人脸识别
摘要翻译:
本文提出了一种新颖的人脸识别方法, 通过线性回归的方法来表述模式识别问题. 使用位于线性子空间的单一对象类模式, 我们开发了一个线性模型, 将探测图像表示为特定类画廊的线性组合. 本文采用最小二乘法求解拟问题, 并判定有利于具有最小重构误差的类别. 所提出的线性回归分类(LRC)算法属于最近邻子空间分类. 该算法根据人类识别文献报告中的许多示例性评估协议, 在几个标准数据库上进行了广泛评估. 与最先进算法的比较研究清楚地反映了所提出方法的有效性. 针对连续遮挡问题, 我们提出了一种模块化LRC方法, 引入了一种新颖的基于距离的证据融合(DEF)算法.
问题提出:
在高维空间中进行识别通常容易受各种因素的干扰, 因此需要将高维特征映射到低维特征中去, 主要目的就是为这样的变换找到一个基函数, 使得在人脸空间中有区分地表示人脸. 本文就基于以上条件以及围巾遮挡问题, 提出了一种简单且高效的基于线性回归分类的人脸识别方法.
使用方法:
1.LRC (Liner Regression Classification) :
主要思想与步骤如下:
- 有 N N N 个训练图像类别, p i p_i pi 为第 i i i 种类别的图片数量. 且每个灰度图像的大小为 a × b a \times b a×b.
- 经过下采样后, 大小改变为 $c \times d $, 并通过列连接转换为向量.
- 每一个图片向量需要进行归一化, 最后经过叠加 q q q 维图像向量, 得到一个特定类别的模型 X i X_i Xi.
- 利用最小二乘法算出参数 β i \beta_i βi, 根据公式 y ^ i = X i β i \hat{y}_i =X_i \beta_i y^i=Xiβi 算出预测向量. 最后利用二范式找到预测最接近的类别 i i i.
2.Modular Approach for LRC
在模块化方法中, 我们利用像素的邻域特性将人脸图像分割成若干个子图像, 每一个子图像都被单独处理, 并通过融合所有子图像信息来做出最终决策 (多数投票). 缺陷是将带噪声图像和纯净图像同等对待.因此本文利用距离分类开发了一个简单高效的融合策略,被称为“基于距离的证据融合”.
主要思想与步骤如下:
- 每个训练图片被分割成 M M M 个分区, 每一块为 v n v_n vn.
- 将第 i i i 类的所有训练图片的第 n n n 块进行下采样, 并进行向量转换, 叠加后得到一个特定类别的模型 U i \mathbf{U}_i Ui.
- 然后同LRC一样, 算出误差, 找到误差最小的. 中间多了一个决策过程.
创新性:
提出了一个新的分类方法, 并把人脸识别任务描述为线性回归问题.
效果:
- 通过大量的实验证明, LRC算法解决了来自面部表情变化和连续遮挡的挑战, 并且更适用于真实场景;
- 同时也表明, 通过选择合适的分类器, 下采样图像比传统分类方法具有更好的分类效果;
- 计算效率高;
- 忽略没脸的部分, 有效的、动态的融合利用了充足的脸部子图像的信息去产生一个全局的识别.
局限与不足:
- 对于AT&T Database, LRC的表现并不是很好;
- 对于 Georgia Tech (GT) Database,LRC表现也不如ERE_ S ~ b \tilde{S}^b S~b;
- 不能承受严重的亮度变化;
- 对于AR Database, LRC对有围脖遮挡的图片识别效果不如SRC (严重遮挡), 因为在Modular LRC中, 有围脖的部分会被直接拒绝, 不能参与最终决策.
https://blog.csdn.net/pearl8899/article/details/51103688
更多推荐
所有评论(0)