朴素贝叶斯原理推导
贝叶斯原理
贝叶斯原理其实是⽤来求“逆向概率”的。所谓“逆向概率”是相对“正向概率”⽽⾔。就是从结果推出条件。贝叶斯原理建⽴在主观判断
的基础上:在我们不了解所有客观事实的情况下,同样可以先估计⼀个值,然后根据实际结果不断进⾏修正。
贝叶斯公式
实际上,贝叶斯公式就是求阶后验概率的。
朴素贝叶斯
它是⼀种简单但极为强⼤的预测建模算法。之所以称为朴素贝叶斯,是因为它假设每个输⼊变量是独⽴的。这是⼀个强硬的假设,实
际情况并不⼀定,但是这项技术对于绝⼤部分的复杂问题仍然⾮常有效。
输⼊变量就是特征,朴素贝叶斯假设这些特征之间是没有关系的,是独⽴事件。因此算特征概率的时候可以分开算然后相乘。
朴素贝叶斯模型由两种类型的概率组成:
每个类别的概率P(Cj);
每个属性的条件概率P(Ai|Cj)。
类别概率和条件概率的区别:
类别概率是输出变量之间的概率,与特征没有关系。但条件概率是基于特征的变量的概率。
为了训练朴素贝叶斯模型,我们需要先给出训练数据,以及这些数据对应的分类。那么上⾯这两个概率,也就是类别概率和条件概率。他们
都可以从给出的训练数据中计算出来。⼀旦计算出来,概率模型就可以使⽤贝叶斯原理对新数据进⾏预测。
贝叶斯原理、贝叶斯分类器、朴素贝叶斯的区别
贝叶斯原理是最⼤的概念,它解决了概率论中“逆向概率”的问题,在这个理论基础上,⼈们设计出了贝叶斯分类器,朴素贝叶斯分类是贝
叶斯分类器中的⼀种,也是最简单,最常⽤的分类器。朴素贝叶斯之所以朴素是因为它假设属性是相互独⽴的,因此对实际情况有所约束,
如果属性之间存在关联,分类准确率会降低。不过好在对于⼤部分情况下,朴素贝叶斯的分类效果都不错。
实际上,贝叶斯原理是数学基础,贝叶斯分类是⼀种模型,⽽朴素贝叶斯则是具体⽅法。
朴素贝叶斯分类的⼯作流程
1. 输⼊和输出,输⼊训练的数据集,第i个样本的第j个特征,第j个特征可能取得第l个值:输出x的分类
2. 计算出先验概率和条件概率,对于给定的实例,基于独⽴假设条件下计算联合概率P(X=x,Y=ck),根据最⼤化后验概率法则,确定x的
类别。
先验概率:通过经验来判断事情发⽣的概率,⽐如说“贝叶死”的发病率是万分之⼀,就是先验概率。再⽐如南⽅的梅⾬季是 6-7
⽉,就是通过往年的⽓候总结出来的经验,这个时候下⾬的概率就⽐其他时间⾼出很多。
后验概率:后验概率就是发⽣结果之后,推测原因的概率。⽐如说某⼈查出来了患有“贝叶死”,那么患病的原因可能是 A、B 或
C。患有“贝叶死”是因为原因 A 的概率就是后验概率。它是属于条件概率的⼀种。
条件概率:事件 A 在另外⼀个事件 B 已经发⽣条件下的发⽣概率,表⽰为 P(A|B),读作“在 B 发⽣的条件下 A
发⽣的概率”。⽐如原因 A 的条件下,患有“贝叶死”的概率,就是条件概率。
那么我们通过输⼊的特征和⽬标变量就可以求出先验概率和条件概率。通过条件独⽴性假设和最⼤似然估计(后验概率最⼤化)来得出最后
的分类。
后验概率最⼤化的含义
我们这⾥假设为0-1损失函数,为了使损失函数最⼩相当于后验概率最⼤化。
本文发布于:2023-05-24 14:55:23,感谢您对本站的认可!
本文链接:https://www.wtabcd.cn/zhishi/a/1684911325177499.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文word下载地址:朴素贝叶斯原理推导.doc
本文 PDF 下载地址:朴素贝叶斯原理推导.pdf
留言与评论(共有 0 条评论) |