维普资讯
第8卷第13期2008年7月
科学技术与工程
Vo1.8 No.13 July 2008
1671-1819(2008)13-3504-05
Science Technology and Engineering
@2008 Sci.Tech.Engng.
基于贝叶斯网络的邮件过滤系统的设计
黄诠 杨盛 陈治平¨
(1湖南大学计通院,长沙410082;2湖南人文科技学院计算机科学与技术系,娄底417000)
摘要电子邮件作为网络应用的一个重要方面已成为现代通信中不可缺少的一部分,但是垃圾邮件的蔓延给用户带来了
严重的损失,如何防范垃圾邮件具有重要的实用意义。在分析了垃圾邮件特点的基础上,构建贝叶斯分类模型,利用贝叶斯
分类模型设计了一种邮件过滤系统。实验结果表明,设计的邮件过滤系统对垃圾邮件的过滤具有比较明显的效果。
关键词垃圾邮件 贝叶斯 文本分类
文献标志码A 中图法分类号TP309.5;
随着互联网的迅猛发展,网络应用已经深入到
成和发送的垃圾邮件对于发件人、收件人、邮件主
人们日常生活的方方面面,电子邮件作为网络应用
的一个重要方面,给人们带来了极大的便利。但 前应用范围日趋狭窄。
题甚至邮件内容都是随机生成的,使得该种技术目
是,各种垃圾邮件的日益泛滥,也给人们带来了极
大的不便和危害。一些非法组织和个人,利用网络
邮件服务存在的漏洞,大量发送垃圾邮件,造成正
常的邮件业务无法提供服务,尤其是国外的一些组
3)基于统计分析的贝叶斯算法技术。基于统
计的原则,采用标记权重的方式,根据对用户认为
的垃圾邮件和非垃圾邮件进行统计计算,生成过滤
规则,具有学习渐进的功能,可以逐渐取得好的
效果。
织和个人利用我国部分拥有邮件服务器的单位对
邮件服务器的管理不严,借道转发他们的垃圾邮
件,在国际上造成了不良影响。如何准确地从大量
邮件中寻找到所需的有用邮件,已成为和网络服务
供应商和电子邮件用户关心的一大问题,这就是所
4)基于连接频率的动态规则方式。由于一个
正常用户发送邮件的数量和频率远远低于垃圾邮
件发送者,因此可以根据垃圾邮件发送具有一定时
间内邮件数量和邮件连接频率都非常大的情况,从
谓的邮件过滤问题。
针对垃圾邮件泛滥的情况,到现在为止,国际
上主要反垃圾邮件技术有如下6种:
频率和数量对垃圾发送者的连接行为进行控制。
5)电子邮票方案。因为垃圾邮件发送具有大
规模发送成本很小的行为特征,微软公司提出了对
发送邮件进行收费的解决方案。不过这种方式对
广大的正常邮件发送者而言带来了新的负担,还需
考虑。
1)IP地址、域名、邮件地址黑白名单方式。这
种技术手段是最传统的方式,它通过黑名单技术对
垃圾邮件屏蔽,通过白名单技术对允许的邮件放行。
2)基于信头、信体、附件的内容过滤方式。该
项技术目前尚不成熟,因为现在的群发程序自动生
2008年3月l8 Et收到
第一作者简介:黄诠(1977一),男,湖南涟源人,湖南人文科技学
院计算机系助理讲师,湖南大学硕士生,研究方向:机器学习。
6)Challenge.Response方式。挑战.应答模式是
从增加垃圾邮件发送者时间成本上入手,要求每发
送一封邮件,就要求发件人回答一些问题,利用这
种方式来增加发送时间。
现在的电子邮件过滤系统一般采用基于文本
分类的过滤方法。文本分类(Automatic Text Catego-
通信作者简介:陈治平(197l一),男,湖南大学计算机与通信学院
副教授。博士。硕士生导生,研究方向:机器学习。
rization)就是利用计算机对文本集(或其它实体或
本文发布于:2023-11-18 17:26:18,感谢您对本站的认可!
本文链接:https://www.wtabcd.cn/zhishi/a/170029957832372.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文word下载地址:基于贝叶斯网络的邮件过滤系统的设计.doc
本文 PDF 下载地址:基于贝叶斯网络的邮件过滤系统的设计.pdf
留言与评论(共有 0 条评论) |