几种基于直方图的图像全局二值化算法

图像二值化的目的是最大限度的将图象中感兴趣的部分保留下来，在很多情况下，也是进行图像分析、特征提取与模式识别之前的必要的图像预处理过程。这个看似简单的问题，在过去的四十年里受到国内外学者的广泛关注，产生了数以百计的阈值选取方法，但如同其他图像分割算法一样，没有一个现有方法对各种各样的图像都能得到令人满意的结果。在这些庞大的分类方法中，基于直方图的全局二值算法占有了绝对的市场份额，这些算法...

仰望星空_LiDAR

2429人浏览 · 2019-08-14 10:02:01

仰望星空_LiDAR · 2019-08-14 10:02:01 发布

在这些庞大的分类方法中，基于直方图的全局二值算法占有了绝对的市场份额，这些算法都从不同的科学层次提出了各自的实施方案，并且这类方法都有着一些共同的特点：

1、简单；

2、算法容易实现；

3、执行速度快。

本文摘取了若干种这类方法进行了介绍。

一：灰度平局值值法：

1、描述:即使用整幅图像的灰度平均值作为二值化的阈值，一般该方法可作为其他方法的初始猜想值。

2、原理:　　　

二、百分比阈值（P-Tile法）

1、描述

Doyle于1962年提出的P-Tile (即P分位数法)可以说是最古老的一种阈值选取方法。该方法根据先验概率来设定阈值，使得二值化后的目标或背景像素比例等于先验概率，该方法简单高效，但是对于先验概率难于估计的图像却无能为力。

三、基于谷底最小值的阈值

1、描述：

　　此方法实用于具有明显双峰直方图的图像，其寻找双峰的谷底作为阈值，但是该方法不一定能获得阈值，对于那些具有平坦的直方图或单峰图像，该方法不合适。

2、实现过程：

　　该函数的实现是一个迭代的过程，每次处理前对直方图数据进行判断，看其是否已经是一个双峰的直方图，如果不是，则对直方图数据进行半径为1（窗口大小为3）的平滑，如果迭代了一定的数量比如1000次后仍未获得一个双峰的直方图，则函数执行失败，如成功获得，则最终阈值取两个双峰之间的谷底值作为阈值。

注意在编码过程中，平滑的处理需要当前像素之前的信息，因此需要对平滑前的数据进行一个备份。另外，首数据类型精度限制，不应用整形的直方图数据，必须转换为浮点类型数据来进行处理，否则得不到正确的结果。

该算法相关参考论文如下：

　 J. M. S. Prewitt and M. L. Mendelsohn, "The analysis of cell images," innnals of the New York Academy of Sciences, vol. 128, pp. 1035-1053, 1966.
C. A. Glasbey, "An analysis of histogram-based thresholding algorithms," CVGIP: Graphical Models and Image Processing, vol. 55, pp. 532-537, 1993.

3、效果：

　原图二值图原始直方图　　　　　　　　　　　　　　　　平滑后的直方图

　　对于这种有较明显的双峰的图像，该算法还是能取得不错的效果的。

四、基于双峰平均值的阈值

1、描述：

　　该算法和基于谷底最小值的阈值方法类似，只是最后一步不是取得双峰之间的谷底值，而是取双峰的平均值作为阈值。

2、效果：

　原图二值图原始直方图　　　　　　　　　　　　　　　　平滑后的直方图

五、迭代最佳阈值

1、描述：

该算法先假定一个阈值，然后计算在该阈值下的前景和背景的中心值，当前景和背景中心值得平均值和假定的阈值相同时，则迭代中止，并以此值为阈值进行二值化。

2、实现过程：

　（1）求出图象的最大灰度值和最小灰度值，分别记为gl和gu，令初始阈值为：

(2) 根据阈值T0将图象分割为前景和背景，分别求出两者的平均灰度值Ab和Af:

(3) 令

　　　　如果Tk=Tk+1,则取Tk为所求得的阈值，否则，转2继续迭代。

3、效果：

　　　　原图二值图直方图　

六、OSTU大律法

1、描述：

该算法是1979年由日本大津提出的，主要是思想是取某个阈值，使得前景和背景两类的类间方差最大，matlab中的graythresh即是以该算法为原理执行的。

2、原理

Ostu方法又名最大类间差方法，通过统计整个图像的直方图特性来实现全局阈值T的自动选取，其算法步骤为：

1) 先计算图像的直方图，即将图像所有的像素点按照0~255共256个bin，统计落在每个bin的像素点数量

2) 归一化直方图，也即将每个bin中像素点数量除以总的像素点

3) i表示分类的阈值，也即一个灰度级，从0开始迭代

4) 通过归一化的直方图，统计0~i 灰度级的像素(假设像素值在此范围的像素叫做前景像素) 所占整幅图像的比例w0，并统计前景像素的平均灰度u0；统计i~255灰度级的像素(假设像素值在此范围的像素叫做背景像素) 所占整幅图像的比例w1，并统计背景像素的平均灰度u1；

5) 计算前景像素和背景像素的方差 g = w0*w1*(u0-u1) (u0-u1)

6) i++；转到4)，直到i为256时结束迭代

7）将最大g相应的i值作为图像的全局阈值

参考博客:

https://blog.csdn.net/bearmomo/article/details/77944860

　　3、效果：

　　该算法对于那些具有平坦的直方图的图像具有一定的适应能力。、

七、一维最大熵

1、描述：

该算法把信息论中熵的概念引入到图像中，通过计算阈值分割后两部分熵的和来判断阈值是否为最佳阈值。

2、算法原理

（1）什么是熵？

熵是用来衡量一个分布的均匀程度，熵越大，说明分布越均匀。在信息论中，信息熵可以说明消息的混沌程度，熵越大说明消息越不明了，难以从消息中得到有效信息。举一个超级简单的例子，比如说我假设一辆车开到了一个T字型的路口，限定它必须要么左转，要么右转，设左转的概率是P1，右转的概率是P2，除此之外没有任何信息了，问如何估计P1和P2？你现在有的信息仅仅是P1+P2=1而已，按最大熵的思想，既然你没有其他任何信息来说明向左转的可能性比向右转的可能性大（或小），那就应该把它们两一视同仁，同等对待，不能偏袒其一，于是就应该是P1=P2=1/2，这就是最大熵的思想。仔细想想还是挺有道理的，假设你觉得这样不是最合适的解，你给出了另一个解P1=3/4，P2=1/4那就要问了，凭什么往左转的概率比往右转的大呢？已经没有任何信息再支持你的判断了呀。因此，只能把它们两同行对待了。事实上，P1=P2=1/2这个分布的熵比这个P1=3/4，P2=1/4分布的熵要大，因为前者比后者均匀，越均匀熵越大，就越是同等对待（均匀的意思就是大家都一样）。

（2）熵的定义