目标定位(Objectlocalization)

更新时间:2023-06-07 10:54:53 阅读: 评论:0

posss
⽬标定位(Objectlocalization)august是什么意思
lily英语⽬标定位(Object localization)
tokenize图⽚分类任务我们已经熟悉了,就是算法遍历图⽚,判断其中的对象是不是汽车,这就是图⽚分类。定位分类问题,这意味着,我们不仅要⽤算法判断图⽚中是不是⼀辆汽车,还要在图⽚中标记出它的位置,⽤边框或红⾊⽅框把汽车圈起来,这就是定位分类问题。其中“定位”的意思是判断汽车在图⽚中的具体位置。手雷英文
图⽚分类问题我们已经并不陌⽣了,例如,输⼊⼀张图⽚到多层卷积神经⽹络。这就是卷积神经⽹络,它会输出⼀个特征向量,并反馈给softmax 单元来预测图⽚类型。
网络公开课
如果你正在构建汽车⾃动驾驶系统,那么对象可能包括以下⼏类:⾏⼈、汽车、摩托车和背景,这四个分类就是 softmax 函数可能输出的结果,这就是标准的分类过程。如果你还想定位图⽚中汽车的位置,该怎么做呢?我们可以让神经⽹络多输出⼏个单元,输出⼀个边界框。具体说就是让神经⽹络再多输出 4 个数字,标记为b x,b y,b h和b w,这四个数字是被检测对象的边界框的参数化表⽰。要确定边界框的具体位置,需要指定红⾊⽅框的中⼼点,这个点表⽰为(b x,b y),边界框的⾼度为b h,宽度为b w。因此训练集不仅包含神经⽹络要预测的对象分类标签,还要包含表⽰边界框的这四个数字,接着采⽤监督学习算法,输出⼀个分类标签,还有四个参数值,从⽽给出检测对象的边框位置,图⽚左上⾓的坐标
academician为(0,0),右下⾓标记为(1,1)。此例中,b x的理想值是 0.5,因为它表⽰汽车位于图⽚⽔平⽅向的中间位置;b y⼤约是 0.7,表⽰汽车位于距离图⽚底部 3/10的位置;b h约为 0.3,因为红⾊⽅框的⾼度是图⽚⾼度的 0.3 倍;b w约为0.4,红⾊⽅框的宽度是图⽚宽度的 0.4 倍。⽬标标签y的定义如下:
healer是什么意思它是⼀个向量,第⼀个组件p c表⽰是否含有对象,如果对象属于前三类(⾏⼈、汽车、摩托车),则p c= 1,如果是背景,则图⽚中没有要检测的对象,则p c= 0。我们可以这样理解p c,它表⽰被检测对象属于某⼀分类的概率,背景分类除外。如果检测到对象,就输出被检测对象的边界框参数b x,b y,b h和b w。最后,如果存在某个对象,那么p c = 1,同时输出c1、c2和c3,表⽰该对象属于 1-3 类中的哪⼀类,是⾏⼈,汽车还是摩托车。鉴于我们所要处理的问题,我们假设图⽚中只含有⼀个对象,所以针对这个分类定位问题,图⽚最多只会出现其中⼀个对象。
英语演讲技巧
神经⽹络的损失函数,其参数为类别y和⽹络输出y^,如果采⽤平⽅误差策略,则:,损失值等于每个元素相应差值的平⽅和。如果图⽚中存在定位对象,那么y1 = 1,所以y1 = p c,同样地,如果图⽚中存在定位对象,p c = 1,损失值就是不同元素的平⽅和。另⼀种情况是,y1 = 0,也就是p c = 0,损失值是(y1^ − y1)2,因为对于这种情况,我们不⽤考虑其它元素,只需要关注神经⽹络输出p c的准确度。
>p r c

本文发布于:2023-06-07 10:54:53,感谢您对本站的认可!

本文链接:https://www.wtabcd.cn/fanwen/fan/90/136923.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:对象   分类   输出   检测   汽车   边界   定位   神经
相关文章
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2022 Comsenz Inc.Powered by © 专利检索| 网站地图