Matlab多⽬标跟踪⽰例(⼆):
TrackingPedestriansfromaMovi。。。
本⽂与上⼀篇的:
相同之处在于结构相同,都是先检测出⽬标,再⽤卡尔曼滤波预测下⼀帧的位置,最后关联tracking 和detection。
不同之处在于:
佛手果怎么吃①⾮感兴趣⽬标(车辆、树叶等)被检测到
强壮的英语怎么读
冻疮怎么治疗②连续静⽌的⽬标不会被检测到小学生老舍读本
③并排⾛的多个⽬标被当做⼀个⽬标检测
骆驼祥子故事概括此外,还采⽤了“⾮最⼤化抑制策略”,作⽤是当对同⼀个⾏⼈⽬标产⽣多个跟踪框时(可能因为背景噪声或⾏⼈重叠等原因),只选⽤框与框之间重叠率最⼤的那⼀个作为检测⽬标跟踪框。
b)增加了⼀个辅助数据⽂件pedScaleTable,它记录了在视频帧中⾏⼈所在的像素点位置与他对应的跟
踪框⼤⼩的关系,具体的保存形式是:nx1的向量,第i⾏的数代表的是该⾏⼈的脚的位置(要获取跟踪框⼤⼩就在脚的坐标基础上加预测的⾼度),⽽i等于min(length(pedScaleTable), round(y + height)),其中length(pedScaleTable)表⽰这个⽂件的长度即为n,y和height分别表⽰由检测⼦得来的当前候选跟踪框的bottom值和⾼度。这样,通过这个公式得到了i,再代回pedScaleTabel向量中就得到了预测的⾼度,然后再通过式⼦abs(estHeight - height) > estHeight * scThresh,可以得到不满⾜期望的尺度⼤⼩的候选框,其中estHeight是刚才得到的预测⾼度,scThresh是预设的尺度阈值,通过这个式⼦,我们可以剔除不符合预测⾼度的检测⽬标候选跟踪框,提⾼跟踪的精确性。现在已经知道了这个辅助数据⽂件的作⽤了,但是它⼜是怎么得到的呢?事实上,这个辅助数据⽂件是通过在同⼀个⾓度、相似的场景下,拍摄含有不同距离的⾏⼈图像,将所有图像组成⼀个训练集并通过imageLabeler app对⾏⼈的bounding box进⾏标定,然后将得到的⾏⼈位置和bounding box的⾼度通过回归的⽅法训练⽣成产⽣的。⽽原⽂中并没有提到使⽤的训练数据集是哪⾥来的,所以我个⼈认为这个数据⽂件只适⽤于部分特定的场合(如在移动摄像头下拍摄中远距离的⾏⼈),当对其他类型视频进⾏跟踪时应重新训练数据⽂件,否则跟踪提升效果不⼤。具体参考实验截图。
想要更深了解该⽂件的读者可在matlab上⾃⾏调⽤查看,如下:
scaleDataFile = 'pedScaleTable.mat';
ld = load(scaleDataFile, 'pedScaleTable');
ld.pedScaleTable
c)更新tracking 和 detection前使⽤的损失函数不同,从预测跟踪框与检测跟踪框的“欧⼏⾥得距离”换成了“重叠率”,具体指的是tracking与detection两个跟踪框之间交叉重叠的⾯积越⼤,就越有可能成为匹配。
d)在将unassigned tracking删除时,增加了⼀个判断条件:当置信度没有达到阈值时,也会删除该跟踪框。所谓置信度是在检测⽬标阶段得到的分数,置信度越⾼代表该检测⽬标与感兴趣⽬标(⾏⼈)相似度越⾼。为什么要提出置信度?打个⽐⽅,在检测阶段,使⽤motion-bad时我们是将所有看起来像是⼈的⽬标都当做⼈了,这其中可能包括车⼦,或者风吹动的招牌、树叶等等,⽽现在这个acf算法,是不仅要得到像⼈的⽬标,还要给他们评分,只有达到要求了才算做是⼈。这样就能很⼤程度地筛除⾮感兴趣⽬标,提⾼准确率。
使⽤pedScaleTable辅助数据⽂件的部分实验截图:
图1
图2
图3
哪种大米好吃不使⽤pedScaleTable辅助数据⽂件的部分实验截图:
图5
图6
图7
图8企业减资办理流程
实验截图中,红⾊框内表⽰的是需要检测的区域,这个区域越⼩速度也就越快,但能检测到的⽬标也就越少,可以视视频类型和内容⾃⾏修正,不同颜⾊框代表检测到的不同⾏⼈,框上的数字表⽰的置信度。
合同原则
通过上述实验截图可以看到,有⽆pedScaleTable数据⽂件对跟踪效果的影响其实并不⼤,漏检和错检并没有因此发⽣显著的变化,原因可能是摄像头位置较⾼⽽且⾯向车辆⾏进的⽅向,正前⽅较⼩⾏⼈,两侧的⾏⼈较远,因此⾏⼈尺度普遍较⼩,所以作⽤不明显。但是不管有没有使⽤pedScaleTable,基于ACF和卡尔曼滤波的多⽬标跟踪还是⽐基于混合⾼斯模型和卡尔曼滤波的多⽬标跟踪更加鲁棒的,成功地解决了后者的⼀些问题。但是它的跟踪速度、精准性还有待提⾼。