第10卷第2O期2010年7月
科学技术与工程
Vo1.10 No.20 July 2010
1671—1815(2OLO)2O-5082—04
Science Technology and Engineering
⑥2010 Sci.Tech.Engng.
基于多层过滤技术的邮件客户端的研究
奚建荣
(渭南师范学院计算机科学系,渭南714000)
摘要分析了E.mail邮件协议和邮件格式特征,设计与实现了一种客户端垃圾邮件过滤系统。系统采用黑白名单过滤、邮
件特征过滤和贝叶斯分类相结合的三层过滤技术,并通过用户反馈机制降低误报率。实验结果显示,系统可满足用户对邮件
的个性需求,提高了对垃圾邮件过滤的准确性。
关键词垃圾邮件 贝叶斯算法 多层过滤 用户反馈
中图法分类号TP309; 文献标志码A
随着互联网的普及,E—mail已成为日常生活中
RFC822定义了一种标准的邮件报文格式,但
SMTP协议只能传输ASCII码文本信息 J。对图
片、程序以及中文文档等非ASCII文本信息的传输,
根据多用途互联网邮件扩展协议(Multipurpose In—
方便的通信手段。然而,垃圾邮件的泛滥给互联网
用户带来很多烦恼和侵害。到目前为止,主要的反
垃圾邮件技术有黑白名单方式、基于规则的过滤方
式、基于统计的过滤方式。众多的反垃圾邮件方法
中,基于Bayesian的垃圾邮件过滤器效果突出,实验
数据显示,准确率97%以上…。
由于垃圾邮件是相对的概念,垃圾邮件过滤过
程中普遍存在判定标准不确定的问题。某类邮件
对于A来说是垃圾邮件,而B却对其甚感兴趣。另
外,服务端过滤虽然可以将垃圾邮件挡在网络之
外,节省网络带宽,但却占用了大量的服务器资源、
temet Mail Extensions,MIME)进行编码,以使二进制
数据可以添加到RFC822邮件中进行传送 .4 J。使
用了MIME协议的邮件结构如图1所示。
降低了服务器性能。基于以上两点,我们设计了一
种基于客户端的邮件过滤系统,该系统体现用户的
个性化需求,可以较好解决邮件判定标准问题。
1邮件预处理
图1 MIME协议邮件格
1.1邮件结构分析
1.2邮件编码与解码
中文不是标准的ASCII码格式,所以在传输过
从电子邮件的结构出发,寻找垃圾邮件的特
征,展开邮件过滤工作,是垃圾邮件过滤常采用的
基本方法。
2010年4月26日收到 渭南师范学院科研基金项目(10YKS006)资助
程中必须经过编码才可顺利传送。同时,收件方必
须有相应的解码程序,将经过编码的邮件经过解
码,才能看到发件人发送的邮件原文。
邮件解码实际上就是编码的逆过程。由MIME
作者简介:奚建荣(1970一),陕西大荔人,讲师,硕士,研究方向:网
络安全。
邮件格式可知,MIME信头使用Content-Transfer・En—
coding字段定义了编码方案,Content-Type字段定义
本文发布于:2023-11-18 17:02:23,感谢您对本站的认可!
本文链接:https://www.wtabcd.cn/zhishi/a/1700298143219084.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文word下载地址:基于多层过滤技术的邮件客户端的研究.doc
本文 PDF 下载地址:基于多层过滤技术的邮件客户端的研究.pdf
留言与评论(共有 0 条评论) |