VOC数据集格式介绍
深度学习很多框架都在使⽤VOC数据集,所以先来研究⼀下voc数据集的具体内容。
以为例,它包含如下5个⽂件夹:
JPEGImages
提高的英语Annotations
ImageSets
SegmentationClass
天蝎和天秤SegmentationObject
1、JPEGImages
PASCAL VOC提供的所有的图⽚,其中包括训练图⽚,测试图⽚。
庆云洞
2、Annotations
存放xml格式的标签⽂件,每个xml对应JPEGImage中的⼀张图⽚。可使⽤labelImg进⾏标注和查看。
<annotation>
<folder>VOC2012</folder>
<filename>2007_000392.jpg</filename> //⽂件名
路人甲是什么意思啊
<source> //图像来源(不重要)
<databa>The VOC2007 Databa</databa>
<annotation>PASCAL VOC2007</annotation>
<image>flickr</image>
</source>
<size> //图像尺⼨(长宽以及通道数)
<width>500</width>
<height>332</height>
<depth>3</depth>
</size>
<gmented>1</gmented> //是否⽤于分割(在图像物体识别中01⽆所谓)
<object> //检测到的物体
<name>hor</name> //物体类别
<po>Right</po> //拍摄⾓度
<truncated>0</truncated> //是否被截断(0表⽰完整)
人体消化系统<difficult>0</difficult> //⽬标是否难以识别(0表⽰容易识别)
<bndbox> //bounding-box(包含左下⾓和右上⾓xy坐标)
<xmin>100</xmin>微波炉专用饭盒
<ymin>96</ymin>
<xmax>355</xmax>
<ymax>324</ymax>
</bndbox>
</object>
<object> //检测到多个物体
<name>person</name>
<po>Unspecified</po>
<truncated>0</truncated>
<difficult>0</difficult>
<bndbox>
油炸黄花鱼的做法<xmin>198</xmin>
<ymin>58</ymin>
<xmax>286</xmax>
<ymax>197</ymax>
</bndbox>
文质彬彬的近义词</object>
</annotation>
3、ImageSets
Action:⼈的动作
Layout:⼈体的具体部位
Main: 图像物体识别的数据,总共20类, 需要保证train val没有交集:训练集
<:验证集
<:训练和验证集
Segmentation:⽤于分割的数据
验证集(val)与测试集(test)是有区别的。
验证集:val是validation的简称,验证是否过拟合、以及⽤来调节训练参数等。测试集:当模型训练完成后,⽤于检测模型的准确性。
4、SegmentationObject & SegmentationClass
保存的是物体分割后的数据,在物体识别中没有⽤到。