垃圾邮件的防范与过滤
1垃圾邮件
1.1垃圾邮件的历史垃圾邮件并不是在电子邮件技术出现后就马上出现的。 从其产生的历史过程中 可以看到互联网是如何从一个学术和交流的平台逐步变为商业工具的。
1978年 DEC公司的一位营销人员突发奇想 认为直接通过ARPANE邮件的方式来推销他们的计算机是一种很好的方法。于是他和公司里的其他人收集了ARPANE用户的地址并将广告信向所有这些用户发送 这就是历史上第一封真正意义上的垃圾邮件。
In ternet取代ARPANE后在20世纪80年代和90年代早期网络上一些人则开始收集和贩卖邮箱地址。 1995年8月第一次有人公开贩卖20万个邮箱地址 ……到2001年8月 已经有内含2.1亿个邮箱地址的列表在出售了。 各种垃圾邮件网站和组织也开始出现。
1.2垃圾邮件的种类
中国反垃圾邮件中心2005年公布用户收到的垃圾邮件中 “网上购物”、 “IT产品推销”、 “情趣用品”、 “政治种族”四种邮件 占到用户收到垃圾邮件的前四位。
垃圾邮件的语言种类统计 中英文垃圾邮件比例占到
97.45%其他语言所占比例可以忽略不计。
垃圾邮件的文件格式排名中用户收到最多的是“HTML网页”格式的垃圾邮件其次是“纯文本”邮件和“图片”邮件 占到用户收到垃圾邮件比例的83.4%。
1.3垃圾邮件的危害垃圾邮件是因特网带给人类最具争议性的副产品 它的危害主要表现
1 占用网络带宽降低网络运行效率。
2侵占信箱空间侵犯收件人的隐私权损害了他人的信誉。
3劳动生产率下降。每年浪费在处理垃圾邮件上的时间高达15亿小时。
4传播病毒被黑客利用。
5严重影响ISP的服务形象。
6宣传邪教蛊惑人心传播谣言及色情等内容 。
7窃取密码骗人钱财对和谐社会造成了危害。
2垃圾邮件的防范
防范垃圾邮件的传播 主要从以下6各方面 其效果是立竿见影。
1 设定好记但难以猜测的电子邮件账号
2不要随便公开你的电子邮件地址
3尽量采用转发的方式转发到你的ISP的本地信箱
4尽量使用免费邮箱且分类使用
5不要回复垃圾邮件
6不要订阅非正式及不健康的电子杂志
3过滤技术
对抗垃圾邮件最重要的技术是过滤技术过滤技术在过滤垃圾邮件主要基于以下三种方法
3.1基于IP层的垃圾邮件过滤方法基于IP层的垃圾邮件过滤方法其中有黑名单、 白名单、 实时黑名单和实时白名单等。
黑白名单过滤黑白名单是一个简单有效而最为常用的过滤方法黑名单原理是把已知垃圾邮件制造者的域名或IP地址整理成列表 以此为依据拒绝任何来自列表的邮件 白名单是黑名单的反义词 规定邮件接收者只接受自己信赖的邮件发送者所发送的邮件。 其优点是对垃圾邮件处理能力的要求较低 它能够节省大量的带宽、存储容量和处理时间。 缺点黑名单是基于用户的投诉和采样的积累而建立的当垃圾邮件制造者快速改变邮件地址时 处理效果将大幅下降 忽略垃圾邮件和过滤掉正常邮件的错误将相对增加。而对白名单来说 如果以前获得批准的用户改变了邮件地址 用户必须再次将新地址列入白名单 否则将收不到该用户的电子邮件。
3.2基于规则的垃圾邮件过滤方法
其中最著名的规则过滤方法之一是决策树方法该方法通过按照某种属性的顺序自顶向下地生成一棵树 树的每个节点是属性名 而每条边是属性值 从树根到树叶的一条路径便对应一条规则 使用决策树来过滤垃圾邮件 得到垃圾邮件过滤的正确率和召回率在88%左右.
3.3基于统计过滤方法是对邮件内容统计分类的过滤方法正确
率高速度快是垃圾邮件处理技术中很受欢迎的一种方法有广泛的应用前景。 如贝叶斯 SVM KNN等。
3.3.1贝叶斯分类
KNN基于类比学习针对现有垃圾邮件过滤算法所存在的训练样本与测试样本分布不一致而导致实际应用效果比较差的现象提出了一种基于自学习K近邻方法的垃圾邮件过滤算法。
3.3.3 支持向量机S VM针对中英文混合垃圾邮件过滤问题提出一种基于支持向量机SVM的过滤方法.通过改进SVM中线性核的表示方式解决存储空间和计算最问题.通过领域术语自动抽取技术增强垃圾邮件过滤的语义单元识别能力提高垃圾邮件分类性能.
4前沿技术由于垃圾邮件的不断翻新这就要求反垃圾邮件技术要不断发展和创新下面就目前反垃圾邮前沿技术简要的阐述。
4.1 SPF技术
SPF的全称是Sender Policy Framework是一种可以保障
域名所有人免受垃圾邮件发送者冒充发信的机制 其做法是在域名的DN S中加入S P F记录指出该域名只通过某些主机发送邮件。
4.2行为判别技术行为判别技术是当前反垃圾邮件一个新的领域和方向。清华大学联合研究发现 垃圾邮件在发送阶段处于活跃的状态 恶意的行为特征远比内容特征要明显 经过对几千万封垃圾邮件的收集和分类对各种垃圾邮件的行为、方式、邮件特征进行统计学研究首创垃圾邮件“行为识别模型”。
行为识别模型包含邮件发送过程中的各类行为要素如时间、频度、发送IP、协议声明特征、发送指纹等。在统计分析中发现在行为特征上 垃圾邮件和正常邮件具有极高的区分度 特别是对大量采用动态IP发送的邮件更是如此。采用垃圾邮件行为模式识别模型不仅大大提高了垃圾邮件辨别的准确率 而且不需要对邮件的全部内容进行扫描所以大大提高计算处理能力。
4.3空中拦截技术空中拦截的技术 原理是网关通过监测接受邮件流量大小来识别和屏蔽垃圾邮件。例如一封“***”的信通过监测差不多每一封在160K到180K左右如果把这些信都收下来的话流量就产生了。网关只是接收4K到8K就要缓冲只要达到8K的数据 就认为是“***”邮件或垃圾邮件。 因为很多垃圾邮件跟正常邮件不一样很多流量屏蔽在网关之外。
结论
垃圾邮件与反垃圾邮件的斗争是一个长期的过程 人们不断地改进和完善反垃圾邮件技术来抵抗其危害。 从而减少互联网中
流通的垃圾邮件的数量让网络更好的为企业和个人服务 帮助人们远离垃圾邮件的骚扰营造一个健康、和谐、有序的互联网社会环境。
今年1月的时候Hosteons开始提供1Gbps端口KVM架构VPS,目前商家在LET发布消息,到本月30日之前,用户下单洛杉矶/纽约/达拉斯三个地区机房KVM主机可以从1Gbps免费升级到10Gbps端口,最低年付仅21美元起。Hosteons是一家成立于2018年的国外VPS主机商,主要提供VPS、Hybrid Dedicated Servers及独立服务器租用等,提供IPv4+IPv6,支持...
Dynadot 是一家非常靠谱的域名注册商家,老唐也从来不会掩饰对其的喜爱,目前我个人大部分域名都在 Dynadot,还有一小部分在 NameCheap 和腾讯云。本文分享一下 Dynadot 最新域名优惠码,包括 .COM,.NET 等主流后缀的优惠码,以及一些新顶级后缀的优惠。对于域名优惠,NameCheap 的新后缀促销比较多,而 Dynadot 则是对于主流后缀的促销比较多,所以可以各取所...
继阿里云服务商推出轻量服务器后,腾讯云这两年对于轻量服务器的推广力度还是比较大的。实际上对于我们大部分网友用户来说,轻量服务器对于我们网站和一般的业务来说是绝对够用的。反而有些时候轻量服务器的带宽比CVM云服务器够大,配置也够好,更有是价格也便宜,所以对于初期的网站业务来说轻量服务器是够用的。这几天UCLOUD优刻得香港服务器稳定性不佳,于是有网友也在考虑搬迁到腾讯云服务器商家,对于轻量服务器官方...