⼈体解析任务和LookintoPerson数据集(附源码分享)
星期二英语怎么说
⼈体解析任务
⼈体解析(human parsing),属于语义分割任务的⼦任务,旨在对⼈类图像进⾏像素级的是细粒度分割(例如,划分出⾝体部位和服装)。根据不同的场景,⼜可以分为单⼈⼈体解析(single-person human parsing)和多⼈⼈体解析(multi-person human parsing,或者 instance-level human parsing)。除此之外,按照处理媒介分类,还可以分为基于图像的⼈体解析和基于视频的⼈体解析。
对于⼈体解析任务,常⽤的度量指标包括 Pixel accuracy(%) , Mean accuracy(%), Mean IoU(%) 和Frequency weighted IoU(%).
cornwall
多⼈⼈体解析
Look into Person数据集
maintain用法Look into Person (LIP) 是⼀个⼤规模的⼈体语义解析数据集,它包括了带有像素级⼈体部位标注(19种⼈体部位类别)和2D姿势标注(16个关键点)的50000张图像。这50000张图像裁剪⾃COCO数据集中的⼈物实例,图像尺⼨均⼤于50 * 50. 它们覆盖了真实世界的各种场景,包括姿势和视⾓的改变、严重的遮挡、变化的外观以及低分辨率。
实际上,该数据集可以分为四个部分,分别为:单⼈⼈体解析,多⼈⼈体解析,基于视频的多⼈⼈体解析,基于图像的虚拟试⾐。可以从该中得到下载链接(包括百度云盘和⾕歌云盘链接)。
在这⾥我们主要讨论第⼀个部分,即单⼈⼈体解析数据集。它包括了19种类别标签加上背景标签,所以⼀共是20种类别:
1. Background
2. Hat
3. Hair
simsim
4. Glove
5. Sunglass
sdfg
6. Upper-clothes
7. Dress
tell me why 中文歌词8. Coat
9. Socks
10. Pants
voice of china吝啬鬼什么意思11. Jumpsuits
葫芦丝培训12. Scarf
13. Skirt
14. Face
oh santa15. Left-arm
16. Right-arm
17. Left-leg
18. Right-leg
19. Left-shoe
20. Right-shoe
LIP数据集样本实例
baline代码分享
该baline模型基于PSPNet,其中的特征提取主⼲可以选择resNet50、denNet121、squeezeNet或者其它模型。源码链接如下:
如果觉得有帮助,欢迎star和fork,如果需要已经训练好的⽹络模型可以通过下⾯链接下载。
(提取码:43cu)
实验结果和可视化如下:(可视化代码也包含在源码⾥了)