垃圾邮件的防范与过滤
1垃圾邮件
1.1垃圾邮件的历史垃圾邮件并不是在电子邮件技术出现后就马上出现的。 从其产生的历史过程中 可以看到互联网是如何从一个学术和交流的平台逐步变为商业工具的。
1978年 DEC公司的一位营销人员突发奇想 认为直接通过ARPANE邮件的方式来推销他们的计算机是一种很好的方法。于是他和公司里的其他人收集了ARPANE用户的地址并将广告信向所有这些用户发送 这就是历史上第一封真正意义上的垃圾邮件。
In ternet取代ARPANE后在20世纪80年代和90年代早期网络上一些人则开始收集和贩卖邮箱地址。 1995年8月第一次有人公开贩卖20万个邮箱地址 ……到2001年8月 已经有内含2.1亿个邮箱地址的列表在出售了。 各种垃圾邮件网站和组织也开始出现。
1.2垃圾邮件的种类
中国反垃圾邮件中心2005年公布用户收到的垃圾邮件中 “网上购物”、 “IT产品推销”、 “情趣用品”、 “政治种族”四种邮件 占到用户收到垃圾邮件的前四位。
垃圾邮件的语言种类统计 中英文垃圾邮件比例占到
97.45%其他语言所占比例可以忽略不计。
垃圾邮件的文件格式排名中用户收到最多的是“HTML网页”格式的垃圾邮件其次是“纯文本”邮件和“图片”邮件 占到用户收到垃圾邮件比例的83.4%。
1.3垃圾邮件的危害垃圾邮件是因特网带给人类最具争议性的副产品 它的危害主要表现
1 占用网络带宽降低网络运行效率。
2侵占信箱空间侵犯收件人的隐私权损害了他人的信誉。
3劳动生产率下降。每年浪费在处理垃圾邮件上的时间高达15亿小时。
4传播病毒被黑客利用。
5严重影响ISP的服务形象。
6宣传邪教蛊惑人心传播谣言及色情等内容 。
7窃取密码骗人钱财对和谐社会造成了危害。
2垃圾邮件的防范
防范垃圾邮件的传播 主要从以下6各方面 其效果是立竿见影。
1 设定好记但难以猜测的电子邮件账号
2不要随便公开你的电子邮件地址
3尽量采用转发的方式转发到你的ISP的本地信箱
4尽量使用免费邮箱且分类使用
5不要回复垃圾邮件
6不要订阅非正式及不健康的电子杂志
3过滤技术
对抗垃圾邮件最重要的技术是过滤技术过滤技术在过滤垃圾邮件主要基于以下三种方法
3.1基于IP层的垃圾邮件过滤方法基于IP层的垃圾邮件过滤方法其中有黑名单、 白名单、 实时黑名单和实时白名单等。
黑白名单过滤黑白名单是一个简单有效而最为常用的过滤方法黑名单原理是把已知垃圾邮件制造者的域名或IP地址整理成列表 以此为依据拒绝任何来自列表的邮件 白名单是黑名单的反义词 规定邮件接收者只接受自己信赖的邮件发送者所发送的邮件。 其优点是对垃圾邮件处理能力的要求较低 它能够节省大量的带宽、存储容量和处理时间。 缺点黑名单是基于用户的投诉和采样的积累而建立的当垃圾邮件制造者快速改变邮件地址时 处理效果将大幅下降 忽略垃圾邮件和过滤掉正常邮件的错误将相对增加。而对白名单来说 如果以前获得批准的用户改变了邮件地址 用户必须再次将新地址列入白名单 否则将收不到该用户的电子邮件。
3.2基于规则的垃圾邮件过滤方法
其中最著名的规则过滤方法之一是决策树方法该方法通过按照某种属性的顺序自顶向下地生成一棵树 树的每个节点是属性名 而每条边是属性值 从树根到树叶的一条路径便对应一条规则 使用决策树来过滤垃圾邮件 得到垃圾邮件过滤的正确率和召回率在88%左右.
3.3基于统计过滤方法是对邮件内容统计分类的过滤方法正确
率高速度快是垃圾邮件处理技术中很受欢迎的一种方法有广泛的应用前景。 如贝叶斯 SVM KNN等。
3.3.1贝叶斯分类
KNN基于类比学习针对现有垃圾邮件过滤算法所存在的训练样本与测试样本分布不一致而导致实际应用效果比较差的现象提出了一种基于自学习K近邻方法的垃圾邮件过滤算法。
3.3.3 支持向量机S VM针对中英文混合垃圾邮件过滤问题提出一种基于支持向量机SVM的过滤方法.通过改进SVM中线性核的表示方式解决存储空间和计算最问题.通过领域术语自动抽取技术增强垃圾邮件过滤的语义单元识别能力提高垃圾邮件分类性能.
4前沿技术由于垃圾邮件的不断翻新这就要求反垃圾邮件技术要不断发展和创新下面就目前反垃圾邮前沿技术简要的阐述。
4.1 SPF技术
SPF的全称是Sender Policy Framework是一种可以保障
域名所有人免受垃圾邮件发送者冒充发信的机制 其做法是在域名的DN S中加入S P F记录指出该域名只通过某些主机发送邮件。
4.2行为判别技术行为判别技术是当前反垃圾邮件一个新的领域和方向。清华大学联合研究发现 垃圾邮件在发送阶段处于活跃的状态 恶意的行为特征远比内容特征要明显 经过对几千万封垃圾邮件的收集和分类对各种垃圾邮件的行为、方式、邮件特征进行统计学研究首创垃圾邮件“行为识别模型”。
行为识别模型包含邮件发送过程中的各类行为要素如时间、频度、发送IP、协议声明特征、发送指纹等。在统计分析中发现在行为特征上 垃圾邮件和正常邮件具有极高的区分度 特别是对大量采用动态IP发送的邮件更是如此。采用垃圾邮件行为模式识别模型不仅大大提高了垃圾邮件辨别的准确率 而且不需要对邮件的全部内容进行扫描所以大大提高计算处理能力。
4.3空中拦截技术空中拦截的技术 原理是网关通过监测接受邮件流量大小来识别和屏蔽垃圾邮件。例如一封“***”的信通过监测差不多每一封在160K到180K左右如果把这些信都收下来的话流量就产生了。网关只是接收4K到8K就要缓冲只要达到8K的数据 就认为是“***”邮件或垃圾邮件。 因为很多垃圾邮件跟正常邮件不一样很多流量屏蔽在网关之外。
结论
垃圾邮件与反垃圾邮件的斗争是一个长期的过程 人们不断地改进和完善反垃圾邮件技术来抵抗其危害。 从而减少互联网中
流通的垃圾邮件的数量让网络更好的为企业和个人服务 帮助人们远离垃圾邮件的骚扰营造一个健康、和谐、有序的互联网社会环境。
最近发现一个比较怪异的事情,在访问和登录大部分国外主机商和域名商的时候都需要二次验证。常见的就是需要我们勾选判断是不是真人。以及比如在刚才要访问Namecheap检查前几天送给网友域名的账户域名是否转出的,再次登录网站的时候又需要人机验证。这里有看到"Attention Required"的提示。我们只能手工选择按钮,然后根据验证码进行选择合适的标记。这次我要选择的是船的标识,每次需要选择三个,一...
TmhHost是一家国内正规公司,具备ISP\ICP等资质,主营国内外云服务器及独立服务器租用业务,目前,商家新上香港三网CN2 GIA线路VPS及国内镇江BGP高防云主机,其中香港三网CN2 GIA线路最低每月45元起;同时对美国洛杉矶CN2 GIA线路高防及普通VPS进行优惠促销,优惠后美国洛杉矶Cera机房CN2 GIA线路高防VPS季付99元起。香港CN2 GIA安畅机房,三网回程CN2 ...
CloudCone 商家在以前的篇幅中也有多次介绍到,这个商家也蛮有意思的。以前一直只有洛杉矶MC机房,而且在功能上和Linode、DO、Vultr一样可以随时删除采用按时计费模式。但是,他们没有学到人家的精华部分,要这样的小时计费,一定要机房多才有优势,否则压根没有多大用途。这不最近CloudCone商家有点小变化,有新人洛杉矶优化线路,具体是什么优化的等会我测试看看线路。内存CPU硬盘流量价格...