首页 > 专栏

智能过滤垃圾邮件

更新时间:2023-11-18 17:35:58 阅读：评论：0

英语周记带翻译-人虫大战

2023年11月18日发(作者：天线宝宝画图)

维普资讯

■

酗网络安全

智能过滤垃圾邮件

■ ／王鑫孙东红（５）用户反馈信息收集模块，该模块负责收集邮件用户对判

交互式中文垃圾邮件过滤系统是基于“统计”规则的过滤方定正确性的反馈信息，并将反馈信息保存在用户反馈信息数据库

法设计并实现的，它兼具基于规则过滤方法与机器学习，以及概中，供用户反馈信息学习模块使用。

率统计过滤方法的垃圾邮件过滤系统的优点，同时还增加了邮件（６）用户反馈信息学习模块。该模块根据用户反馈信息动态

用户与垃圾邮件过滤器之间的交互，利用用户对邮件判定是否正调整规则集中引起错判的过滤规则的权重，从而提高垃圾邮件过

确的反馈信息动态调整过滤器，从而提高过滤准确度。滤器的准确度，同时还能提高规则更新的速度。

系统框架系统实现

整个交互式中文垃圾邮件过滤系统的结构如图ｌ所示。现对交互式中文垃圾邮件过滤系统几个重要模块的具体实现

（１）ＣＣＥＲＴ垃圾邮件样本数据库。我们将来自ＣＣＥＲＴ垃圾描述如下。

邮件蜜罐网、用户举报以及ＣＣＥＲＴ应急响应系统接收和处理的（１）规则生成模块。ＣＣＥＲＴ垃圾邮件过滤规则主要针对中

垃圾邮件，经过分析整理后创建了ＣＣＥＲＴ垃圾邮件样本集合。文垃圾邮件的标题和内容部分。以２０万封中文垃圾邮件样本作为

（２）规则生成模块。该模块主要通过分析垃圾邮件样本数据样本集，生成中文关键字过滤规则。采取的主要手段是用分词工

创建垃圾邮件过滤规则，所有过滤规则保存在规则集中并应用到具对邮件样本的Ｓｕｂｊｅｃｔ部分ｌＩ］Ｂｏｄｙ部分分别进行分词，然后各

邮件服务器的垃圾邮件过滤引擎中。自统计词频，将词频最高的一组关键字提取出来，分别生成针对

（３）规则权重训练模块。该模块负责用机器学习的方法给规Ｓｕｂｊｅｃｔ部分和Ｂｏｄｙ部分的关键字过滤规则。这里将Ｂｏｄｙ部分

则集中的所有规则找到最佳的规则权重分布。规则集中的每一条和Ｓｕｂｊｅｃｔ部分分开分析，主要是为了在邮件服务器负载较大时

规则都有一个权重，权重越大，说明符合这条规则的邮件是垃圾可以只启用Ｓｕｂｊｅｃｔ部分的过滤规则，避免扫描邮件内容来提高

邮件的可能性越大。处理速度。

（４）垃圾邮件过滤引擎。该过滤器包含了所有过滤规则以及（２）规则权重训练模块。用改进遗传算法对规则生成模块生

规则的权重，当邮件服务器收到邮件时，它就会对邮件应用所有成的中文过滤规则进行权重训练，寻找ＣＣＥＲＴ垃圾邮件过滤规

规则，给邮件“打分”，根据所有规则来判定是否为垃圾邮件。被则集中过滤规则的最优权重分布。用改进遗传算法寻找规则权重

判定为Ｓｐａｍ的邮件并不会被邮件服务器丢弃，而是在邮件标题的最优分布时，种群中的每个染色体向量代表一组可能的规则权

前打上Ｓｐａｍ标签，这样邮件用户就可以利用客户端软件将其直重分布，向量的维数等于ＣＣＥＲＴ垃圾邮件过滤规则集中的规则

接“扫除”到垃圾邮件夹。总数，每一维代表一条规则，每一维的值表示相应规则的权重。算

ｉ垃圾邮件拳报ＣｃＥＲＴ垃始化时采用小群体竞争法，交叉

圾邮件样邮件服务嚣ＩＩＩｌｌ￣－Ｗ尸一

．

ＯｃＥ盯垃圾邮件本数据库算子采用优选父代自适应交叉

童■系统操作

，

变异算子采取非一致自适

】Ｅ则生成模块盘圾邮件过滤５Ｉ曲

５基应变异操作，在产生子代群体

时，允许父代群体一起参与竞

争，同时采用最优保留策略和两

ＣＣＥＲＴ垃埘，口ｒ’Ⅸ●＾１■月两竞争选择策略。在选择适应度

邮件过滤规则权重训练模块数据库息收囊奠块

规则簟函数时，按照可能的规则权重分

广＿：Ｌ＋括．】级， — ＾ｈ丁，坚＾

５４中国教育同络２ｏｏ６４

凡人小事作文-600字周记

本文发布于:2023-11-18 17:35:58，感谢您对本站的认可！

本文链接：https://www.wtabcd.cn/zhishi/a/1700300158219111.html

本文word下载地址：智能过滤垃圾邮件.doc

本文 PDF 下载地址：智能过滤垃圾邮件.pdf

上一篇：基于多层架构的邮件过滤系统

下一篇：返回列表

标签：反垃圾邮件

留言与评论（共有 0 条评论）