图像分类、⽬标检测、语义分割和实例分割等任务是什么?
cplm
⼈⼯智能中图像分类、⽬标检测、语义分割和实例分割等任务是什么?
近年来,计算机视觉及其相关领域发展⼗分迅速,相关技术已经被应⽤到⼈类⽣产和⽣活的各个领域。
我们⽿熟能详的任务有⼈脸识别、步态识别、虹膜识别、车辆检测以及医学图像处理等。 实际上,计算机视觉本⾝包含众多的研究⽅向,本⽂仅仅介绍下⾯⼏个互相关联的任务:
图像分类:Image Classification
强使语义分割:Semantic Segmentation
⽬标检测:Object Detection
walkman怎么读实例分割:Instance Segmentation
需要注意的是,本⽂的⽬的并不是针对上述四种任务的发展与原理进⾏综述,⽽仅仅是指出⼏种任务的关联和区别,借以明确各⾃的研究⽬标。
概念与定义
三立教育
下图展⽰了图像分类、语义分割、⽬标检测、实例分割四种任务:
grl
上图展⽰了四种任务的研究⽬标,具体如下:
图像分类:判别图中物体是什么,⽐如是猫还是狗;
语义分割:对图像进⾏像素级分类,预测每个像素属于的类别,不区分个体;
⽬标检测:寻找图像中的物体并进⾏定位;
实例分割:定位图中每个物体,并进⾏像素级标注,区分不同个体;jcf
⼀、图像分类
图像分类任务⽬的是判断图像中包含物体的类别,如果期望判别多种物体则称为多⽬标分类。需要注意的是,基本的图像分类任务并不要求给出物体所在位置,也不需要判断含有物体的数量。下图中含有多种物体,分类任务的⽬标可以是判断图⽚中是否含有“狗”(图来⾃BigGAN):
⼆、语义分割
语义分割任务需要对图像中所有像素点进⾏分类,将相同类别的像素归为相同的标签(常常采⽤相同
的像素点表⽰)。需要特别注意的是,语义分割是在像素级别进⾏的。下图(来⾃FefineNet)中展⽰了街景分割,图中的街道、车辆、树⽊和⾏⼈等分别采⽤不同的颜⾊进⾏标注,即进⾏了语义级别的分割。
pray justin bieber
三、⽬标检测
如果项⽬的需求是精确的定位出图像中某⼀物体类别信息和所在位置,则应该选择⽬标检测算法。基于深度学习的⽬标检测算法主要分为单阶段(one-stage)和两阶段(two-stage)两种,单阶段算法
的速度较快,两阶段算法的精度较⾼(总体上)。下图(来⾃YOLOv1)展⽰了各种⽬标检测任务,⽐如左边检测的⽬标是鹰,右边检测的⽬标是飞机,均精确的预测出了⽬标所在的位置:
商务时间
四、实例分割
雪花秘扇 豆瓣相⽐于语义分割,实例分割不仅需要将图像中所有像素进⾏分类,还需要区分相同类别中不同个体。⽐如,语义分割只需要将下图中的所有猫的像素进⾏归类,⽽实例分割需要将猫这⼀类中单独的个体进⾏像素分类。
抱歉英语
五、总结
上述的四种任务每⼀个都是⾮常值得研究的领域,均包含众多优秀的论⽂。其中图像分类任务最为基础,在ImageNet上训练得到的ResNet、Vgg、DenNet和MobileNet等⽹络均在其它任务上被⼴泛应⽤,作为很多论⽂的Backbone⽹络。