河北工业大学待你长发及腰
硕士学位论文
针对排球场景的图像检索
姓名:郭鹏
申请学位级别:硕士专业:控制科学与工程指导教师:于明
20091101
河北工业大学硕士学位论文
针对排球场景的图像检索
摘要
图像检索作为多媒体信息检索技术的一个主要组成部分,在信息检索领域占有举足轻重的地位。因此图像检索得到了快速的发展,并产生了许多关于图像检索的算法。根据不同的实际问题和应用领域,采取相应的检索算法。鉴于现阶段大量体育方面的图像,论文针对排球场景的检索进行了相关的研究。
针对排球场景的图像检索是基于内容的图像检索的具体应用,可以结合图像的颜色和形状等信息检索其内容。论文检索了排球场景中其摄像头拍摄的图像,包括检索摄像头拍摄到的相似图像、有较大的排球图像以及摄像机的机位这三方面的内容。在实现过程中,要去除图像中光照、噪声和背景等信息,所以首先应对图像进行了相关的预处理。在检测摄像机机位过程中,通过Hough直线检测排球场景中的网带信息来判断机位。论文根据网带的形状和方向特征对Hough直线进行了改进,提高了算法的效率。在检测排球方面,主要运用了Canny边缘提取和Hough圆来检测排球信息。论文采用了随机Hough圆来检测排球,但是随机Hough圆的三个采样点之间是毫无关联的,所以提出了一种改进的随机Hough圆算法即把三个采样点关联起来,并且结合了排球的颜色信息,提高了算法的效率和准确率。在查询相似图像方面,采用单元格熵和位平面相结合的方法对图像进行相似性比较。信息熵相比颜色直方图对存储空间要求较低,单元格熵则包含了图像的空间信息,位平面分解可以提取图像中有意义的高位平面从而了提高算法的准确性。
最后,论文运用VC++6.0实现了上述的算法。通过对大量排球图像的检索,实验结果表明,改进的Hough直线和Hough圆在检测排球场景中的网带和排球具有很高的准确性,并且利用基于位平面的单元格信息熵的方法相比传统的直方图方法有了很大的提高。其中,算法在查找摄像机机位,其准确率高达95%;查找有较大的排球图片,其准确率也达到93.1%。基于位平面的单元格信息熵识别相似图片其查准率和查全率分别为87.2%和92.3%。由此说明,此算法能够满足检索的基本要求。
关键词:排球场景,边缘提取,Hough变换,图像检索,信息熵
i最大的海洋
针对排球场景的图像检索
ii
The Image Retrieval of Volleyball Scene
ABSTRACT
Image retrieval as a import part of multimedia information retrieval technology plays a
pivotal role in information retrieval field.Therefore,image retrieval has rapid developed and generated many image retrieval algorithms.According to the practical problems and applications,we u corresponding algorithm.In consideration of a large number of sports images,this paper rearches on volleyball scene retrieval.
The volleyball scene-bad image retrieval is the specific application of content-bad image retriev
qq关闭空间
al.It can combine the color information and shape information to arch the relevant content.This paper introduces in arch of the content by camera filming in the volleyball scene,including similar image captured by camera,the image that has big volleyball and position of camera. In the implementation process, due to the image affected by light, noi and other effects, this paper firstly operates the image by pre-processing.The Hough line find the position of camera by detecting the belt in the volleyball scene.According to the shape and direction of the belt, this paper improve algorithm of the Hough line.For the aspect of detecting volleyball,it us Canny edge detection and Hough circle to arch the volleyball information.It us the random Hough circle to detect the volleyball,but the three sampling points of random Hough circle have no correlation.Therefore,this paper propos an improved algorithm for the random Hough circle,of which three sampling points have clo correlation.The efficiency and precision are signigicantly incread by using the improved Hough circle.In the aspect of arching the similar images,this paper overcome the disadvantage of color histogram which doesn't have spatial information,and the improved method combined the bit-plane and information entropy obtains the better result.The cell of entropy contains the image spatial information, bit-plane decomposition can extract meaningful image plane and rai the accuracy of the algorithm.
招摇撞骗
Finally, VC++6.0 is ud to carry out the above-mentioned algorithms in this paper. According to a large number of volleyball images retrieval,the experimental results show that the improved Hough line and Hough circle have the high accuracy to detect the belt and volleyball,and the image retrieval algorithm bad on bit-plane and cell of entropy comparing with the traditional histogram method has been greatly improved.When arching the position of camera, the accuracy rate is 95%;When arching a larger volleyball in the pictures,the accuracy rate is 93.1%. The precision rate and recall rates of image retrieval algorithm bad on bit-plane
河北工业大学硕士学位论文
and cell of entropy are parately 87.2% and 92.3%.It shows that the algorithm is able to meet the basic requirements of retrieval.
KEY WORDS:volleyball scene, edge abstract ,Hough transform, image retrieval,entropy
成公
iii
照片像素
河北工业大学硕士学位论文
第一章 绪 论
§1-1 课题背景
当前,由于计算机和互联网的不断发展,出现了越来越多的关于体育图像和视频的文件,因此,能够快速提取有用的信息越来越受到人们的重视。传统的图像检索系统中,以往大多数采用基于文本的检索,但是基于文本的检索存在着很多的不足之处[1]:
(1) 传统的方法中,由人工输入图像的关键字等内容信息,存在工作量过于庞大的问题。
(2) 由于不同人对同一幅图像有不同理解。
(3) 人工添加注释的方法是非常耗时、耗力,并且有很大的开销。
计算机检索图像可以去除以上这些弊端,通过计算机处理可以为图像库中的图像建立相应的索引,当检索时计算待查找图像的索引,再与库中图像的索引对比即可。
基于内容的图像检索(CBIR, Content Bad Image Retrieval)就是根据图像的某些特征信息进行检索如:形状、颜色和纹理等信息,并且运用到了模式识别、数字图像处理等学科的内容。
写景的文章该检索区别于传统的基于关键字的图像检索,它具有如下特点:
(1)从图像内容中直接提取信息线索。
(2) 由计算机自动判定图像的相似度,避免了人工判断的主观性。
(3) 能够实现快速检索。
总之,基于内容的图像检索技术具有客观、节省人力与成本、应用前景广阔等许多优点,正受到越来越广泛的重视。如今观看体育比赛作为大众娱乐的一种主要方式,已经成为现代人生活方式的组成部分。然而每天播放的体育赛事不计其数,也同时产生了大量的关于体育方面的图片信息。其图像资料也广泛地散落在网络和多媒体设备上,即使对用户来说,要想从大量的图像信息中查找所要想看的图像也是极其困难的。同时,面对海量的体育图像,想要采用人工标注关键字的方式来完成对它们的分类,也是一件极其烦琐和枯燥的事情。因此,基于内容的图像检索成为目前的一个研究热点。
§1-2 基于排球场景的图像检索现状
基于排球场景的图像检索其实就是对基于内容(CBIR–Content Bad Image Retrieval)的图像检索的一种实际应用。利用颜色、纹理和形状特征为索引进行检索,具有计算速度快、准确率高与稳定等特点,因此得到广泛的使用。
基于内容的图像检索目前主要包括三种方法:基于颜色特征的图像检索、基于形状特征的图像检索、基于纹理特征的图像检索。
1-2-1 基于颜色特征的图像检索
基于颜色特征的图像检索[1]是目前使用最广泛的基于内容的图像检索,主要依据图像的颜色信息,因为不同物体的颜色是不同的,例如:提到树叶,一般会联想到绿色信息,并且颜色分布也与其他的绿色的物体有一定的差距。所以可以根据图像的颜色信息与颜色分布信息来查找图像。一般最常用的方式是利用颜色直方图来描绘图像的颜色信息,直方图的x轴表示图像的颜色,y轴表示某颜色占总图像颜色的比例。
颜色直方图图像索引[2]是Swain 和Ballard 1991年提出的,其主要思想是利用颜色直方图描绘图像的颜色信息,两幅图像的相似度主要对两幅图像的颜色直方图进行比较。颜色直方图具有旋转、尺度不
生活作风自我评价1