行人重识别数据集之CUHK03数据集

更新时间:2023-06-10 05:55:59 阅读: 评论:0

⾏⼈重识别数据集之CUHK03数据集
CUHK03 数据集
CUHK03 数据集是⾏⼈重识别领域⼴泛使⽤的⼀个数据集,它的⾏⼈图⽚采集⾃⾹港中⽂⼤学(CUHK)校园的 5 对不同视⾓的摄像头。CUHK03 数据集有很多版本:有 Matlab ⽂件格式的,也有图⽚格式的。有包含 1360 个⾏⼈的,也有 1467 个⾏⼈的。不同代码⽤到的 CUHK03 数据集版本可能不同,刚刚了解 CUHK03 数据集的⼩伙伴可能对此感到困惑。那本⽂就来聊⼀聊各种版本的 CUHK03 数据集。
⼀、CUHK03 数据集的两种划分
CUHK03 数据集到底包含多少个⾏⼈呢? 到底是 1360 个⾏⼈,还是 1467 个⾏⼈呢?为啥同⼀个数据集能包含不同数量的⾏⼈呢?
经典划分
2014年,论⽂ 提出了 CUHK03 数据集。⽂中说数据集共包含 1360 个⾏⼈,训练集 1160 个⾏⼈,验证集 100 个⾏⼈,测试集 100个⾏⼈。实验⼀共重复执⾏了 20 次上述随机划分。数据集划分在论⽂中被称作训练/测试协议,这种测试协议是 single-shot tting,即每个⾏⼈在 gallery ⾥只有⼀张图⽚。
新的划分
2017年,论⽂ 针对 CUHK03 数据集提出了新的训练/测试协议(数据集划分⽅法)。在新的测试协议下,数据集中共包含 1467 个⾏⼈。其中,训练集中有 767 个⾏⼈,测试集中有 700 个⾏⼈。
从所有摄像头中,为测试集中的每个⾏⼈随机选取⼀张图⽚,构成 query 集。测试集剩下的⾏⼈图⽚构成 gallery 集。因此,这是⼀个multi-shot 的测试协议,每个⾏⼈在 gallery 集中有多张图⽚。不同于旧的测试协议,新的测试协议只执⾏⼀次训练集/测试集划分。
新的训练/测试协议被写在下⾯两个 .mat ⽂件中。
cuhk03_new_protocol_config_detected.mat
cuhk03_new_protocol_config_labeled.mat
⼆、CUHK03 数据集的两种格式
⼩伙伴们下载到的 CUHK03 数据集可能是 Matlab 格式的,也可能是图⽚格式的。不同代码对于数据集的格式要求不同,不同格式的数据集搭配合适的数据处理脚本⾷⽤更佳呀。
Matlab ⽂件格式
论⽂ 提出的 CUHK03 数据集,是最原始版本的 CUHK03 数据集,它就是 Matlab 版本的数据集。它的下载链接如下:
百度云下载链接:
提取码:rhjq
1. cuhk03_relea.zip 简介
解压 cuhk03_relea.zip 后,你会发现⾥⾯只有⼀个 Matlab 格式的⽂件 cuhk-03.mat 和⼀个 README.md ⽂件。README.md ⽂件对 cuhk-03.mat 做了简要的介绍, cuhk-03.mat 主要包含三个字段:
detected 包含由⾏⼈检测器⾃动检测⽣成的边界框(⾏⼈图⽚)
labeled 包含⼈为⼿动标注的边界框(⾏⼈图⽚)
车保险怎么买testts 表⽰测试协议即数据集划分,测试集包括 100 个⾏⼈,重复 20 次
2. cuhk03_relea.zip 的使⽤
cuhk-03.mat 可以使⽤新的训练集/测试集协议,将两个 .mat ⽂件和 cuhk03_relea 放在⼀起,如下所⽰:
发过cuhk03/
cuhk03_relea/
cuhk03_new_protocol_config_detected.mat
cuhk03_new_protocol_config_labeled.mat
...
将 CUHK03 数据集划分训练集、测试集(gallery)和 query 集,划分结果如下:
征服歌词
其中 new_labeled 的划分结果如 json ⽂件所⽰:
也可以使⽤原始划分⽅式,⽆需加⼊ cuhk03_new_protocol_config_detected.mat 和 cuhk03_new_protocol_config_labeled.mat ,将 CUHK03 数据集划分训练集、测试集(gallery)和 query 集,其中 classic_labeled 的划分结果如 json ⽂件所⽰:
图⽚格式
其实,图⽚格式的 CUHK03 数据集是数据处理脚本 cuhk03.py 处理得到的⼀个结果。 cuhk-03.mat ⽂件被转换成图⽚保存到 detected ⽂件夹和 labeled ⽂件夹下。detected 就是 DPM 检测器检测⽣成的⾏⼈图⽚,labeled 就是⼿动标注出的⾏⼈图⽚。
1. 数据集
就是图⽚格式的 CUHK03 数据集,⾥⾯包括 detected ⽂件夹和 labeled ⽂件夹。 的下载链接如下:⾕歌云下载链接:
数据集中只有⾏⼈图⽚,并没有包含数据集划分信息。因此,它⼀般结合 cuhk03.py ⽣成的 json ⽂件⼀起使⽤。
classic_detected 是 detected ⽂件夹的原始训练集/测试集划分信息
classic_labeled 是 labeled ⽂件夹的原始训练集/测试集划分信息
new_detected 是 detected ⽂件夹的新的训练集/测试集划分信息
new_labeled 是 labeled ⽂件夹的新的训练集/测试集划分信息地羊肉
下⾯以 detected ⽂件夹下的图⽚介绍下数据集的命名规则,下图是摄像头采集到的⾏⼈ 023 的图⽚
以图⽚ 1_023_1_01.png 为例解析数据集 的命名规则:
1 代表摄像头的组别,共有 5 组摄像头
023 代表⾏⼈ ID 编号
1 代表同组摄像头的 1 号摄像头,⼀组摄像头共有麦芽糖醇是什么
2 个摄像头湖南中医药大学是几本
01 代表⾏⼈的第⼀张图⽚,⼀个⾏⼈⾄多有 10 张图⽚,前 5 张来⾃⼀个摄像头,后 5 张来⾃另⼀个摄像头
2. CUHK03-NP 数据集
CUHK03-NP 数据集是⼀个处理好的图⽚集,它采⽤新的训练/测试协议进⾏划分。它的存储格式类似于 Market 1501 数据集。
cuhk03-np
|——detected
|——bounding_box_train
|——bounding_box_test
|——query
|——labeled
|——bounding_box_train
|——bounding_box_test
|——query
CUHK03-NP 数据集的下载链接如下:
⾕歌云下载链接:
百度云下载链接: 提取码:38ff
以图⽚ 0274_c1_2655.png 为例解析 CUHK03-NP 数据集的命名规则:
0274 代表⾏⼈ ID 编号
c1 代表来⾃第1组摄像头(共有2组,⼀组5个)
2655 表⽰来⾃第⼀个摄像头的第 2655 帧。
参考⽂献
1.
亲子阅读故事2.
3.
4.
5.
音乐教案大班
6.

本文发布于:2023-06-10 05:55:59,感谢您对本站的认可!

本文链接:https://www.wtabcd.cn/fanwen/fan/89/1031761.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:数据   测试   划分   训练   协议   摄像头   包含   链接
相关文章
留言与评论(共有 0 条评论)
   
验证码:
推荐文章
排行榜
Copyright ©2019-2022 Comsenz Inc.Powered by © 专利检索| 网站地图