维普资讯
第26卷第6期
兰州交通大学学报(自然科学版)
Vo1.26 No.6
2007年1 2月
Journal of Lanzhou Jiaotong University(Natural Sciences)
Dee.2007
文章编号:1001—4373(2007)06—0103—04
改进动态克隆选择算法在邮件过滤中的应用研究
麻小强, 伍忠东, 王静, 王轶群
(兰州交通大学FU子 信息工程学院,¨‘肃兰州730070)
摘要:提出了可控变异和随机变异方法,改进了动态克隆选择算法,建立并实现一种改进的基于人工免疫系统的
邮件过滤算法.并采用SpamAssassin垃圾邮件样本对算法性能进行测试.实验结果表明,引入改进的动态克隆选
择算法后,该算法对具有变异特性的垃圾邮件能保持较高的正确识别率,具有较好的自适应性和多样性.
关键词:动态克隆选择算法;垃圾邮件;人工免疫;抗原/抗体
中图分类号:TP393.08 文献标识码:A
电子邮件是人们在网上进行信息交流的一种必
示,抗体与抗原具有相同的数据结构,都是等长的符
不可少的工具.但是一些垃圾、非法邮件甚至携带病 号串,它有产生、成长、进化等生理过程,相应阶段分
毒的邮件日益猖獗,困扰着人们正常使用E—mail进
别称为未成熟检测器(Non—Maturation Detector)、
行通信交流.如何有效地自动过滤、删除这些有害邮
成熟检测器(Maturation Detector)和记忆检测器
件成为一个热点问题.现有的反垃圾邮件系统大多 (Memory Detector),抗体具有属性ab.age,表示抗
是基于概率统计的原理对邮件进行过滤,这种方法 体年龄.成熟检测器识别抗原(即检测到垃圾邮件),
需要较多的人工干预,在对垃圾邮件的多样性、变异 在计算机免疫学上叫做初次免疫应答(Primary
性上反应较慢,缺乏自适应性和自动学习的功能.因 Immune Response),记忆检测器识别抗原,叫做二
此,对于隐蔽性、变异能力日益增强的新型垃圾邮
次免疫应答(Secondary Immune Response).检测器
件,必须采用具有自适应、自学习和记忆能力的分类
识别抗原可以通过计算二者的亲和力f(x, )来实
系统,而生物免疫系统[1]良好的多样性,免疫记忆、
现,亲和力的计算公式为f(x, )一,./N,其中,z为
自学习、自适应和鲁棒性等特点则恰好为反垃圾邮 抗体; 为抗原;,.为二者字符串之间相同位置上相
件技术提供了一个非常重要且有意义的研究方向. 同字符的个数;N为二者字符串的字符个数.识别函
本文提出了一种全新的方法——基于改进的动态克 数dect(ag)值可由下式计算.
隆选择免疫算法[2]来构建反垃圾邮件系统,并在实
df1,f(x, )≥A—match
一 、
际环境中验证了它的优良特性.
ect(ag 一10'othe se
1基本概念定义
其中,A_match为激活阈值,即当f(x, )≥
A
—
match时,系统认为抗体识别了抗原.A—match是
借用生物免疫系统(Biological Immune
一
个经验值.
System,BIS)中的概念,邮件样本中提取的特征向
量被定义为抗原(Ag),特征向量片断被定义为基因
2 改进动态克隆选择免疫算法
(Gene).在人工免疫系统(Artificial Immune 2.1 动态克隆选择算法
System,AIS)中,设问题空间记为P,垃圾邮件特征
动态克隆选择算法有如下几个步骤:
向量集合被定义为非自体N,正常邮件特征向量集
1)初始化:随机生成一个属性串(免疫细胞)的
合被定义为自体S,则有S n N—O,S U N—P.
群体.2)群体循环:对每一个抗原,(1)y选择那些
S和N具有相同的结构,都是符号串.在计算机免疫 与抗原具有更高亲和力的细胞进行检测;(2)变异
系统中,抗体(Ab),通常用检测器(Detector)来表
产生的新免疫细胞,遗传上代免疫细胞的特性,同时
收稿日期:2007—04—29
作者简介:麻小强(1981一),男,甘肃定西人,硕士研究生
本文发布于:2023-11-18 17:42:37,感谢您对本站的认可!
本文链接:https://www.wtabcd.cn/zhishi/a/1700300557219114.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文word下载地址:改进动态克隆选择算法在邮件过滤中的应用研究.doc
本文 PDF 下载地址:改进动态克隆选择算法在邮件过滤中的应用研究.pdf
留言与评论(共有 0 条评论) |