第24卷第2期
2013年4月
中原工学院学报
JOURNAL OF ZHONGYUAN UNIVERSITY OF TECHN0L0GY
Vo1.24 No.2
Apr.,2013
文章编号:1671—6906(2013)02—0049—05
一
种基于感兴趣区域的质量可分级编码传输方案研究
宋晓炜,刘 忠,杨 蕾,吴源昭
(中原工学院,郑州450007)
摘要:采用SVC中的MGS质量可分级编码技术,提出了一种基于感兴趣区域的质量可分级编码传输方案.首先,将图
像区域划分为感兴趣区域与背景区域两部分,然后,采用MGS质量可分级编码技术对感兴趣区域的图像进行逐级增强,
对残差(增强层减去基本层)的16个DCT变换系数进行分层传输得到不同质量的增强层,对于背景区域,抑制增强层的
传输,只传输基本层视频图像.结果表明,斯大林怎么死的 此方法可以在网络带宽受限或者传输码率下降的情况下,通过抑制背景区域增
强层的传输来进一步降低码率,同时保证了感兴趣区域图像的可分级编码质量.
关 键 词: MGS;感兴趣区域;质量可分级编码;区域分级传输;选择性增强
中图分类号:TP391.4 文献标志码:A DOI:10.3965I/i.issn.1671—6906.2013.02.012
由于网络的异构性、网络带宽的波动性以及网络 输,以致在接收端ROI区域(感兴趣区域)的视频质量
传输的不可靠性,在复杂的网络环境中,如何提供具有
良好的压缩比、容错性和伸缩性的视频码流来适应有
限的终端处理能力和不断变化的用户需求,成为视频
研究中的核心问题和经典问题之一l_】],可伸缩视频编
码SVC(Scalable Video Coding)_2 的出现较好地解决
较低,从而无法满足终端设备的要求.基于H.264的
SVC中的MGS(Media Grain Scalability)较好地解决
了这个问题,其将增强层与基本层的残差系数进行分
层传输,可编码产生多个增强层,增强层的码率逐层递
增.在网络带宽受限或者码率下降的情况下,MGS对
整个区域的图像质量进行了较低等级的增强,但依然没 了这一问题.SVC作为H.264/AVC的扩展标准被提
有从根本上解决ROI区域的优先传输问题.文献[3]采
用边缘检测技术提取ROI区域,对ROI区域信息进行
优先传输,从而增强了R0I区域图像质量的鲁棒性,但 大,通过传输与解码增强层的码流来提高视频的解码
是这种方法复杂度较高,码流开销比较大.文献E1]基于
运动估计对ROI区域进行划分与提取,并结合灵活宏
块次序(FMO)特性实现了对增强层ROI区域的优先传
输. ty)可以编码重建一个基本层与一个增强层,其中基本
本文在SVC中的MGS编码方案的基础上,提出了
一
出,把视频信号编码成分层的形式,当带宽不足时只对
低质量的基本层码流进行传输和解码;随着带宽的增
质量.可伸缩视频编码能够动态地适应网络带宽的变
化,具有很好的鲁棒性.
MPEG一4中的FGS(Fine Granularity Scalabili—
层包含了最重要、但质量最低的视频信息.同时,FGS
选择高质量的增强层作为运动估计的参考,扩展了传 种基于感兴趣区域的质量可分级编码传输方法.首先
统的可伸缩编码,具有较好的可伸缩效果.采用
MPEG一4中的FGS只能在基本层的基础上预测重
对视频中的ROI区域进行划分,对位于ROI区域内的
宏块进行标记.在增强层,对这些标记宏块的残差信息
进行逐层恢复,同时抑制恢复背景区域(非ROI愚公移山打一成语 区域)的
增强层残差信息,以减少码率.这种区域分级传输的方
建一个增强层,在网络带宽受限或者码率下降的情况
下,只传输基本层将导致整个增强层数据基本无法传
收稿日期:2013—03—13
基金项目:国家科技重大专项项目(2009ZX03004—006);国家自然科学基金项目(60902063);中国博士后科学基金资助项目
(20090460696);河南省高等学校青年骨干教师资助计划项目(2010GGJS--098);河南省科技创新人才支持计划项目
(124100510015)
作者简介:宋晓炜(1978一),男,山西大同人,副教授,博士.
中原工学院学报 2013年第24卷
法可以在网络带宽受限或者码率下降的情况下,通过抑
制背景区域增强层的传输来进一步降低码率,同时保证
ROI区域的编码质量.在网络带宽一定的情况下,也可
以采用该方法实现ROI区域的选择性增强.
1 ROI区域的划分
在视频传输过程中,感兴趣区域是观看者最关心
的区域,这部分区域在传输过程中如果出现错误或者
大范围的丢包现象,会严重影响视频的观看质量.感兴
趣区域的检测方法很多4 ],这些方法都是基于运动
对象本身的检测,在整个场景中进行感兴趣区域检测
时,计算量较大.而且这些算法均以运动信息来进行感
兴趣区域的划分,这就导致了一些重要的静止区域(如
视频监控中的禁停区、斑马线等区域)被遗漏,在后续
阶段无法实现这些区域的选择性增强.文献E73针对这
些方法的不足,提出了一种利用带状算子提取有意义
的运动区域,对不同区域采取不同检测策略的方法.本
研究是在感兴趣区女娲补天故事 域先验知识已知(例如视频监控、视
频会议等)的情况下开展的.因此,我们无需进行感兴
趣区域的划分.
本文充分利用了典型场景中ROI区域的先验知
识,通过相对简单的人为方法对该区域进行划分.具体
步骤为:
(1)根据视频的分辨率将整个视频图像划分为若
干个1616的宏块;
(2)采用公式(1)对这些划分的宏块(mb)进行
RoI区域的标识:
fl,mb∈ROI
Mp一{0,mb ̄ROI
如果划分的宏块位于ROI区域,我们将该宏块的
标识参数置1;反之,将其标识参数置0.最终将视频图
像区域划分为ROI区域与背景区域两部分.
该方法可以根据需要对视频图像中的任意宏块
进行ROI区域的判断与划分,相对以往人工指定检测
区域时用矩形或者椭圆大致表示的方法更加灵活,同
时,由于人为参与,可以避免一些重要的静止区域被遗
漏的现象.
2 基于感兴趣区域的质量可分级编码
SVC可以实现空间可分级、时间可分级与质量可
分级,其结构如图1所示.
图1 SVC编码结构图
由图1可以看出,较低空间层的视频输入序列是
由较高空间层进行下采样生成,每个空间层都包含时间
可分级(Temporal从容淡定 scalable coding)与质量可分级(SNR
scalable coding)两部分.较高空间层的运动与纹理信息
通过较低空间层预测得到.SVC中的SNR增强层通过
粗粒度可分级编码(CGS)或中粒度可分级编码(MGS)
来实现可分级.其中,CGS编码可以提供一个基本层与草船借箭缩写 水瓶座性格
一
个SNR增强层;与CGS相比,MGS可以提供更多的
增强层,MGS对CGS增强层中经44DCT变换后的
16个残差系数进行了逐层传输,且MGS的每个增强层
可以恢复一个或者几个残差系数,直到最高层将残差系
数全部恢复,所以其能够实现性能更佳的质量可分级编
码.MGS最多可以编码产生16个增强层,即每个增强
层只恢复一个残差系数.
为了更好地研究质量可分级,我们将图1中的
MGS质量可分级部分提取出来进行单独研究.MGS
质量可分级编码方案如图2所示.
图2 MGS质量可分级编码方案
由图2可知,对视频输入序列进行帧内与帧问预
测,将原始图像与预测图像的残差值进行量化、编码得
到基本层,将原始图像与从基本层重建得到的图像作
差来预测SNR增强层.每帧的增强层由该帧对应的基
本层预测得到,对于增强层可根据网络带宽进行不同
-眦薹
__l
——
kr.。
、
●__
中原工学院学报 2013年第24卷
感兴趣区域(黑色方框外部区域).相对于图4c,图4b
中背景区域的图像质量下降,而ROI区域的图像质量
基本保持不变.由图4d可知,基于Roadcross序列的
视频图像的交叉路口部分被划分为ROI区域.对比图
4e与图4f可以看出,图4e在保持ROI区域图像质量
基本不变的情况下,背景区域的重建图像质量出现了
一
定程度的下降.实际上,在感兴趣区域可分级传输
方案中,对于背景区域,我们只是传输了视频序列的
基本层信息;而对于ROI区域,我们采用MGS技术
对其进行了可分级传输.在网络带宽受限的情况下,
这种感兴趣区域可分级传输方案能够对ROI区域的
增强层信息进行优先传输,从而确保ROI区域的图像
质量.
3.2客观质量分析
为了更加准确地体现整帧的传输效果与ROI区
域的分层传输效果,我们从客观方面对其进行详细分千层饼的做法
析.基于各序列四个质量层各层的码率与相应的亮度
峰值信噪比(Y PSNR)关系如图5所示.
由图5a可知,intFrm对应在整帧区域采用MGS
O 1∞ 200 300 柏0 ∞0 6∞ 70D
Bitrate/(Kb・s一 )
(b)
(d)
(a)基于Vassar序列整个区域均采用MGS质量可
分级编码;(b)基于Vassar序列区域分级传输方法;
(c)基于Crossroad序列整个区域均采用MGS质量可
分级编码;(d)基于Crossroad序列区域分级传输方法
图5各序列每层的码率与相应的亮度峰值
信噪比关系图
技术进行质量可分级编码时,整帧区域编码质量;lint—
FrmNew对应基于ROI区域进行质量可分级编码时,
整帧区域的编码质量(与图5c相同).图5a中单独就
intFrm或者intFrmNew来看,从左向右分别对应由
低到高的四个质量层,随着质量层码率的增多,相应的
编码质量逐层增强,这体现了整个图像区域的可分级
质量编码.对图5a中intFrm与intFrrnNew进行对比
可以看出,较整体传输的方法,采用区域分级传输时整
个图像区域的码率大幅度的削减,且整体的编码质量
也有所下降.
由图5b可知,locFrm对应在整帧区域均采用
MGS技术进行质量可分级编码时,ROI区域的编码质
量;ocFrmNeW对应基于RoI区域进行可分级编码
时,ROI区域的编码质量(与图5d相同),较整帧传输
的方法,采用区域分级传输时,在码率大幅度削减的同
时,ROI区域的编码质量基本保持不变.
由图5c和图5d可以看出,二者所示情况基本一致.
第2期 宋晓炜,等:一种基于感兴趣区域的质量可分级编码传输方案研究 ・ 53 ・
综合分析可知,与整体传输方法相比,采用区域分
级传输方法只需较低的码率便能够实现ROI区域同
等质量的编码.另外,当网络带宽一定的时候,也可以
采用这种区域分级传输的方法对ROI区域的编码质
量进行选择性增强.
带宽一定的情况下,能够降低背景区域的传输码率,同
时对ROI区域的残差系数进行可分级传输,从而实现
了ROI区域的选择性增强.本研究成果为可分级压缩
算法的研究提供一定的基础,有助于推动视频监控、视
频会议等领域可分级视频传输方案的发展.在ROI区
域内,根据运动矢量信息进一步增强运动相对剧烈的
图像内容,将成为下一步的研究重点.
4 结 语
基于感兴趣区域的质量可分级传输方法,在网络
参
考文献:
[1] 朱金秀,郝文瑞.基于感兴趣区域的可伸缩性容错编码[J].计算机工程与设计,2009,30(21):4901~4903.
E2]
ISO/IEC 14496—10:2005,Amendment 3 to ITu—肝囊肿是怎么回事 T Rec H 264(2005),Scalable Video Coding[S].
2008,35(4):79—82. 江浩.一种室内视频监控序列编码方法EJ].光电工程,
[3]
[4]
Hee Y R,Kiwon L,Byung D K.2004 IEEE International Geoscience and Remote Sensing Symposium Proceedings[C].An~
chorage:Conference Publications,2004.
or Area Morphology for Motion Field Smoothing and Interpretation[J].Vision Image and Signal Processing, EvansA N.Vect
[5]
2003,150(4):219—226.
auffer C,Grimson W E L.Adaptive Background Mixture Models for Real—time Tracking[J/OL].[2013—03一o5].http:// St
[63
www.ai.mit.edu/projects/vsam/Publieations/stauffer—cvpr98一track.pdf.
[7]
郑锦,李波.面向室外视频监视的感兴趣区域提取[J].中国图像图形学报,2010,15(9):1363—1369.
JTc1/sc29/wG11.Multiview Video Test Sequences from MERL,M12077[R].Korea:Busan,2005. ISO/IEC
[8]
nt Video Team of ITu—T VCEG and ISO/IEC MPEG.Joint Scalable Video Model Software 9.19.14[EB/OL].[2Ol1—06 Joi
[9]
141.ftp://garcon.ient.rwth—aachen.de.
A Transmitting Method for Quality Scalability Coding Based
on Region of Interest
SONG Xiao—wei,LIU Zhong,YANG Lei,WU Yuan—zhao
(Zhongyuan University of Technology,Zhengzhou 450007,China)
Abstract: In this paper,a transmitting method based on region of interest has been proposed for quality scalability
video coding by using MGS technology in SVC.Firstly,video images are artificially segmented into two partitions,ROI
and background.Subsequently,for ROI,the 16 DCT coefficients of the residual,which are acquired by subtracting
base layer from enhance layer,are transmitted hierarchically to the enhance layer.By employing the quality scalability
coding technology of MGS,the quality of ROI is gradually enhanced.For the background,the 1 6 DCT coefficients are
controlled not t立足本职 o transmit to the enhance layer,resulting that only base layer is assigned to the region.Experimental re—
sults show that coding bitrate can be further reduced without affecting the quality of ROI,for which the adaptability of
the network to the limitation of its bandwidth is improved.
Key words: MGS;region of interest;quality scalability coding;region scalability transmitting;selective
anhancament.
本文发布于:2023-04-27 04:43:35,感谢您对本站的认可!
本文链接:https://www.wtabcd.cn/fanwen/fan/89/850241.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |