第71卷第3期韦色金属(矿山部分)2019年5月doi:10.3969力.issn.1671-4172.2019.03.021
基于二项分布的双窗OTSU的矿石分割模型
英语国际音标发音视频许文祥,张国英,蒋炭,陈路豪
($国矿业大学(北京)机电与信息工程学院,北京100083)-
摘要:表面不均匀的矿石视频图像目标受光照、周围环境的影响,噪声严重,传统的阈值法不能准确有效的分割。而双窗OTSU方法计算代价过高,且双窗阈值取极值作为目标像素的最佳阈值,导致部分像素误分类。提出了基于二项分布优化的双窗OTSU算法,双窗模板大小取决于最大和最小目标尺寸。通过实验与数学理论证明方法的可行性与准确性,时间成本降低50%〜80%。对于目标易分类的图像,分类精度提升6%左右;对于目标难以分类的图像,分类精度提升13%左右。算法自主确定窗口尺寸,增加其智能性,抗噪声干扰性强,降低了误分类率,时间成本大幅度降低。
关键词:OTSU阈值;类间方差;双窗;二值化;二项分布
中图分类号:TP391.4文献标识码:A 文章编号:1671-4172(2019)03-0096-07
Ore gmentation model by Bi-window OTSU bad on binomial distribution XU Wenxiang,ZHANG Guoying,JIANG Yan,CHEN Luhao
(China Univers让y of Mining&Technology,Beijing100083,China)内部培训师
Abstract:Noi of uneven ore objects in images is riously influenced by illumination and textures,causing it cannot be accurately and effectively gmented by traditional threshold method.The calculation cost of the doubleWindow OTSU method is too high,and the extreme value of the double-Window threshold is taken as the optimal threshold value of the target pixel,resulting in partial pixel misclassification.In this paper,a double-window OTSU algorithm bad on binomial distribution optimization was prented»the size of the double window template depended on the maximum and minimum target sizes.The feasibility and accuracy o£the propod method were proved by experiment and mathematical theory,and the time cost was reduced by50%〜80%greatly.The classification accuracy was improved by about6%for the image of object easy classification,about13%for the image of object uneasy classification.The algorithm determined the size of the window independently,incread its intelligence and strong anti-noi,reduced the misclassification rate and greatly reduced the time cost.
Key words:OTSU threshold;variance between clusters;double window;binarization;binomial distribution
图像分割ms提取出图像中有意义的部分,作为图像识别和分析的基础⑷。阈值分割是图像分割中一类最早被研究和使用的方法,其具有物理意义明确、效果明显、易于实现、实时性良好的特点阪。在诸多的分割方法中,门限法⑷通过选择一个或几个最佳灰度阈值,将原图像中的目标和背景分开,最大爛法和最大类间方差法(OTSU)⑴塚等是优化的阈值方法。破碎矿石图像具有个体粘连堆积、表面光照不匀、对比度差、形态杂乱无章,特别是
基金项目:国家自然科学基金资助项目(U1704242)
作者简介:许文祥(1993-),男,硕士研究生,计算机科学与技术专业,研究方向为计算机视觉与人工智能。
通信作者:张国英(1968-),女,教授,博士生导师,博士,计算机应用专业,主要研究领域为人工智能、计算机视觉-边缘模糊不清等特点,使得分割变得更加困难「则O 针对此类问题,张国英等人提出的双窗OTSU 阈值法呦是一种将双窗何与最大类间方差法⑷结合起来的自适应阈值〔旳改进方法,适用于复杂、凌乱的矿石图像。所提算法克服了单独用一维最大爛或者双窗自适应的缺点和不足。针对多尺度、光照不均、堆积粘连的复杂矿石图像,效果显著,能去除较多的噪声,更多的边被保留了下来。其中存在两个问题:其一,类间方差判别准则仅仅将此类问题作为简单的离散型随机事件的方差求解问题,认为最佳阈值求解是一个多峰问题,该方法进行多次冗余迭代计算,算法的时间性能大大
降低;其二,得到的两个阈值取极值作为中心像素二值化的最佳门限,针对大小相似的矿石图像时等同于损失了一个窗口
第3期许文祥等:基于二项分布的双窗OTSU的矿石分割模型97
的阈值信息。
本文验证窗口内像素分布满足二项分布〔知规
律,提出了一种二项分布优化的双窗OTSU算法。
通过二项分布的方差函数的性质证明双窗OTSU
阈值分布是单峰分布,可以表达为类似二次函数,均
值求解过程通过爬坡方法优化。以窗体尺寸加权的
方式从双窗求取像素阈值,充分保留了两个窗口的
阈值信息,提高了二值分类精度。
1双窗OTSU二值化方法
双窗OTSU算法将双邻域与OTSU的方法伺
相结合进行图像像素分类,OTSU方法根据邻域内
像素二分类的最大类间方差确定窗口阈值。每个中
心像素根据图像目标特征选择了像素的两个邻域窗
口〔旳。每个局部窗口应用OTSU方法计算最优阈
值"勺,得到的两个阈值取最值作为中心像素二值化
的最佳门限。该方法能有效地从背景中提取出目标
区域,算法如下:
1)图像的每个像素P选取2个邻域窗
口,尺寸分别为” X"和mXm,n和zn是奇数整数.
N;和N;为像素点p对应两个窗口中的像素分布
总值。图像灰度范围0(其中/为窗口灰
度最大值)。灰度阈值将图像分成两组,像素值小于
或等于t为A组,像素值大于t为B组。
2)计算窗口最佳阈值:(5(i),Mi(t))、
(s(t),M2(t))表示组A和组B的像素数量和平均
灰度值,图像*)中的平均灰度值为:
■/W丁(Y)(t)+a>2(f)M2(Y)
a>i(0+o>2(t)
,o w t w i—1
(1)
两组类间方差表示M为:
(7b(i)=S](r)(Ml(f)—M t)2+o>2(t)(M2(t)—M\2—si(t)ct>2(t)((r)—M?(t))$(2)T仙(f)+初(t)
对于0(其中2为窗口灰度最大值),公式(2)计算两个窗口的每个灰度分类庞0),方差最大值对应的灰度值"作为中心像素的分类阈值T qtsu(N;或T(J TSU(N;,t);
3)计算像素的最佳阈值:选择Tgu(N;,t)与Tgsu(N;,t)之间的最小值,然后每一个像素P都通过双窗的最小值进行二值化,得到所有指标z和y的二进制图像几(z,y),见式(3):九=
(15f^x,y)>min{T(”su(N;,Z),Torsu(N;,i)}
〔0,其他心
(3)其中1是对象像素的值,0是背景像素。
2基于二项分布的双窗OTSU分类模型
类间方差将二分类问题视为简单的离散型随机事件的方差求解问题,判别准则是从灰度分布t€[0,255]依次求取方差,方差的最大值对应的r值作为最佳阈值。该方法计算复杂度高,算法的时间性能大大降低。像素的阈值由两个窗口的极值计算,没有考虑邻域窗口的像素分布,导致阈值分类
误差。本文提岀了基于二项分布的双窗OTSU分类模型,只需在窗口中寻找方差峰值,并且后续像素阈值在前序像素的优化阈值附近查找。
2.1图像窗口像素的二项分布规律
定义1:二项分布即为”次独立的伯努利试验,每次试验只有两种结果,两种结果发生与否互相对立且相互独立,各次试验结果无关。事件发生的概率在每次独立试验中保持不变,则这一系列试验总称为”重伯努利试验。从而能够以概率论的二项分布的角度分析此类问题。
结论:邻域窗口中的像素灰度值满足二项分布,窗口内每个分类阈值t的方差允(¢)满足二次函数形式,方差峰值只有一个且为最值,最优阈值为方差峰值处对应的t值。
证明:将窗口内所有像素的灰度值分为大于t 与小于t两类事件,其结果必然是互相对立的。事件的独立性是指:一个事件的发生不影响另一个事件的发生。因为像素值的分布是随机的,所以前一个像素的分类结果不能影响下一个像素的分类结果。各次试验结果无关,事件发生的概率在每次独立试验中保持不变,则像素的分布规律满足二项分布。又根据图1的方差分布可以再次证明该理论的准确性。
其中N(t)为窗口内灰度值大于t的像素点个数,灰度值小于t的像素点个数为N—N(t)(其中N为窗口内像素点总个数),即方差可以表示为:
英语速成法N(t)(N—N(t))
=(4)因为N(t)是关于t的连续非减函数,即N(z )
98韦色僉离(矿山部分)第71卷
随着t的增大而增大或者不变。方差是一个符合3,=_严+心(其中c为常数)的二次函数,所以方差存在峰值。N(t)的分布导致方差峰值处的t值可能是多个连续的值。在最小的t值左侧,方差是关于t 的非减函数;在最大的t值右侧,方差是关于t的非增函数,即方差随着t的增大而减小或者不变。
图1任意窗口的方差分布图
Fig.1Variance distribution map of any window
如图1所示,任意窗口中庞(t)的几何分布图像,从图像形态上证实庞(t)是一个符合3-=-x2+ CK(其中C为常数)的二次函数的准确性,证明方差函数虽然不是严格意义的二次函数.但是具有部分二次函数的分布特征,如:最大值只有一个(但是M最大值可能会同时对应几个相邻的/值),在最大值右侧为非减函数,在最大值左侧为非增函数。
根据岛Q)的函数性质,可以简化求取最佳阈值t,即当t值逐渐增加时,庞(C值一旦减小即可停止计
算,1-1即为最佳阈值右边值。获得Torsu(N;")和Tarsu(N;,t)表示两个邻域窗口的最优阈值,并以二项分布方差原理计算。
2.2基于二项分布的单窗口OTSU阈值模型
该二项分布函数的窗口OTSU阈值模型用于计算窗口的最优阈值,通过窗口灰度区间的中值t,通过计算壮Q)函数是非增函数还是非减函数,判断r值处于非减区间还是非增区间.避免进行全区间的迭代运算,快速计算最优阈值。
1)窗口增减区间判断
对于图像左上角像素P(z。,%),计算灰度中值及其右侧的方差op(如竺;垢")与切(心严;"+
1)(其中九”和垢"为窗口内最大和最小灰度值)。
若a B(-,n)>g B(—+1)则令t=血丁如,执行步骤2);
反之,则令t=如宁匣+1,执行步骤3)。
2)单窗口减区间迭代阈值
判断当"(t)V“(t+1)时,停止迭代,得到最佳阈值的左边界/=t+l,然后比较是否= c(/+l)成立,直到等式不成立时得到最佳阈值的右边界L=/+",然后执行步骤4)。
英语专业出国留学3)单窗口增区间迭代阈值
当>a B(Z-l)时,停止迭代,得到最佳阈值的右边界l=t,然后比较是否皿(/)=皿(/一1)成立,直到等式不成立时得到最佳阈值的左边界L=l—n,然后执行步骤4)。
4)单窗口阈值确定
最终阈值Torsu(N;m“)为最大方差对应的阈值的平均值,即:Tgu(N;m,t)=[传勻,
执行步骤5)。
5)对于后续像素p(z”,y”),取其相邻像素点的最佳阈值作为寻找方差峰值的起点,计算方差<7b(Torsu,注]>,t))与<7b(Torsu>,t)+l)。
若<7b(Torsu(,—>,t))> 0b(Torsu(,t)+1)贝9令t= Torsu(N;<,执行步骤2);反之,则令t= TorsuW%—>,t)+l,执行步骤3)。
基于二项分布的单个窗口阈值模型的算法流程图如图2所示。
2.3基于二项分布的双窗口OTSU图像分类模型
双窗口最优阈值求解,通过上述二项分布函数的窗口OTSU阈值模型求取两个窗口各自的最优阈值,通过窗口像素数量加权求和获得双窗口最优阈值。
根据双窗口分布概率计算像素分类阈值,对于像素P选取2个尺寸为n、m的邻域窗口N;和N;,”和加的选取取决于整个图像的最大目标和最小目标的尺寸决定,具体方法为:
1)使用canny算子求取彩色图像的边缘信息;
2)求取最大目标和最小目标的粒径作为邻域窗口的尺寸加和n
。
第3期许文祥等:基于二项分布的双窗OTSU的矿石分割模型99
图2算法流程图single girls
Fig.2Algorithm flow chart
使用基于二项分布函数的单窗口OTSU阈值模型得到N;的阈值为:TguZ,"=诗5,
N;的阈值为:丁沁⑴“=/”尹。像素p的
阈值为基于窗口像素分布的累加值,表达为:丁尸心&MNZ+
dzh
忒耳TEN"⑸
本文中以窗体尺寸加权求取像素阈值,其权值由各自窗口内像素点个数占两个窗口像素点个数总和的比例所决定。充分保留了两个窗口的阈值信息,提高了二值效果,减少误分类,增强边界信息。最后,我们可以得到所有指标乂和y的二进制图几(z,y):
z,m>几
]0,其他
(6)
其中1是对象像素的值,0是背景像素。faq是什么意思
3试验及结果分析
3.1试验指标及结果
对于目标图像的分类,算法所选取的窗口尺寸及输入图像尺寸的详情见表1。双窗OTSU和本文改进算法的处理时间及像素分类正确率两个指标对比及两种算法优化百分比的结果见表1。其中像素分类正确率是通过对矿石样本图像进行手工分割得到的准确二值图像,然后得到算法生成的二值图像的像素分类准确比
。
100韦色金属(矿山部分)第71卷
表1图像阈值化的处理时间及准确率对比表
Table1Comparison table of processing time and accuracy rate of image thresholding
图像尺寸/像素-
时间/s时间优化restrict
百分比/%
像素分类正确率/%精度提升
百分比/%双窗OTSU本文算法双窗OTSU本文算法
256X263 5.389 1.30975.7163.6277.4013.78 198X27110.865 3.14071.1075.658&3212.67 500X37561.81628.06854.5984.2690.52 6.26二本师范大学排名
300X30528.49814.6464&6186.6592.48 5.83
图3中原图从左到右是混合土石料、粒级混配用双窗OTSU和本文模型分类出上述图像中的石石料、光照不匀石料和粒径均匀石料图像。分别使料与背景,结果见图3(b、c、d)。
(a)原图
(b)双窗0TSI;二值图
(c)基于二项分布时间优化二值图
(d)最终阈值优化二值图claims
图3二值化结果对比图
Fig.3Comparison diagram of binarization results
3.2试验分析进的算法时间对比。通过表中双窗OTSU方法与3.2.1时间分析本文方法的试验结果比较.可以看出本文算法大大
表1为原双窗OTSU阈值求解算法和本文改提升了时间效率。由表中时间优化百分比的数据得