多⽰例学习multipleinstancelearning(MIL)
多⽰例学习:包(bags)和⽰例(instance).
包是由多个⽰例炒作 组成的,举个例⼦,在图像分类中,⼀张图⽚就是⼀个包,图⽚分割出的patches就是⽰例。在多⽰例学习中,包带有类别标签⽽⽰例不带类别标签,最终谢贤为什么叫四哥 的⽬的是给出对新的包的类别预测。
多⽰例学习是弱监督学习中的⼀个popular的⽅法。⽤于训练分类器的instance是没有类别标记的,但是bags却是有类别标记的,这⼀点与以往所有框架均不甚相同。
多⽰例学习中的规则:如果⼀个bag⾥⾯存在⾄少⼀个instance被分类器判定标签为+(或者1)的⽰例,则该包为正包;如果⼀个bag⾥⾯
所有的instance都被分类器判定标签为-,则该包为负包。
问题的实际应⽤:做检测问题,标记训练图⽚样本的时候需要给出⼀个矩形框指明⽬标的位置,有可能标的不够准确,导致不同的样本之间
对不齐,这时候可以将标记的矩形框做⼀些局部扰动得到⼀些新的矩形框,将它们⼀起看成⼀个bag,其中总有⼀个是最佳的正样本,也就
是标记为正。⽽取⼀张没有⽬标的图⽚,作为负样本包,⽆论在⾥分享的意义 ⾯怎么截取图⽚,都是负样本。
解决这个问题的⽅法:迭代优化(alternativeoptimization)。分为两步:监督学习,标记更新
⾸先假设已知所有样本的标记,使⽤⼀个监督学习的⽅法得到⼀个分我们的立国之本 类模型;⽤这个模型对每个训练样本进⾏预测,更新它们的标记。------以上是⼀个过程
之后再根据新得到的标记样本重新训练分类器,再对每个训练样本进⾏预测;再训泰式spa 练分类器,再预测标记;再训练,再预测。。。番泻叶可以减肥吗 。思想小结 。。需要注意的地⽅:
1)训练监督学习模型的时候,只从正样本包⾥挑选被预测的“最像正确”(也就是分类得到最⾼)的那⼀个,正样本包⾥⾯其他的样本,不管
预测出来的是正还是负的都不要了。这是因为,其中多⽰例的问踏青节 题也可以描述为,正样本包⾥⾯“最正确”的⼀个样本标记是正的,跟其他样本⽆关。所以,这种选择策略恰恰是符合问题定义的。
2)如果负样本⾜够多的话,可以只挑选每个负样本包⾥⾯被预测“最像正确”的⼀个样本作为负样本进⾏训练,这样的负样本也叫做hard
sample或者mostviolatedsample。实践中,它们对于模型快速收敛是最有效的。
流程图:输⼊:数据矩阵
MILL(MILLibrary)isanopen-sole-instancelearning(MIL)isaformof
mi-supervidlearningically,instancesinMILaregroupedintoa
elsofthebagsareprovided,r,abagislabeledpositiveifatleastone
instanceinthebagispositive,orithmsattempttolearnaclassific疯子用英语怎么说 ationfunctionthat
canpredictthelabelsofbagsand/licationsofMILincludemoleculeactivityprediction(分⼦活动预测),text
categorization(⽂本分类),imageclassificationandretrieval(图像分类和检索),etc.
本文发布于:2023-04-14 05:36:07,感谢您对本站的认可!
本文链接:https://www.wtabcd.cn/fanwen/fan/90/93320.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |