收录小议搜刮引擎优化的数据剖析:若何改良网站收录[感悟]

引擎收录  时间:2021-03-20  阅读:()

小议SEO的数据分析如何改善网站收录

距离上一篇SEO的数据分析已经过了好久了最近觉得应该写一些实际点的内容看看SEO到底怎么做。 先明确一些基本点一个网页被收录与否有两个因素

是否被爬虫爬过

页面质量是否过关

上一篇文章已经提过了收录率这么一个指标很多网站都懒得去做这个指标 “我看看site的数据不就行了!” 事实上没有这个指标很多工作就无从下手。从数据中找出问题利用数据指导解决方案分析数据验证工作成果。 最近看了《深入浅出数据分析》这个本觉得不错把数据分析的方法讲得很生动建议有兴趣的从事数据分析的同学可以买本看看。 任何数据分析由 目标->分析->评估->决策 四个环节组成。

目标我们想看一下网站的收录情况如何在SEO方面是否还有提高的机会。

分析收录情况什么算好什么算坏是不是用一些指标来衡量?网站的收录情况是不是过于笼统是不是应该细分下各个页面的收录情况?

评估于是我们需要下面一些数据

网站的页面层级关系

各个层级页面带来的SEO流量

各个层级页面的收录情况如何

SEO流量的占比可以从Google Analytics中过滤出来。

页面数量可以从数据库获得或者通过火车头or自制小脚本抓取统计。

收录率可以将获取的页面通过工具进行搜索火车头也可以。

这边广告下zero的工

具:http://www.gnbase.com/forum.php?mod=viewthread&tid=11468&highlight=%CA%D5%C2%BC%B2%E9%D1%AF

问题立马凸显!

1+2级目录页带来了大量的流量收录率不是很好优化收录的流量提升突破口在此!

产品页面数量很多收录也不是很理想但是带来的流量有限除了收录问题还有页面内容的问题本文中先不管它了。

决策我们的结论是立刻展开行动对目录页面进行收录的优化。看到这边似乎刚开始的目标 “通过优化收录提升流量”演变成了新的目标 “如何提高目录页面的收录量”

这边能不能再次通过数据分析的方法进行SEO呢?

答案是肯定的!

我们再来重新走一遍目标->分析->评估->决策的过程目标提高目录页面的收录量

分析通过本文开始的有关收录的两个因素我们需要检查一下网页是否被爬虫爬行过 网页的质量是不是过关。

1.关于爬虫的情况我们需要分析日志才能确定。于是我们从日志中拆分一系列数据看看页面是否真的被爬行过。

2. 由于页面质量似乎是一个很难衡量的值于是我们可以用相同模板下的

已被爬行的页面数量/已被爬行并且被收录页面数量

来评估该模板页面质量对收录的影响大小。如果被爬的页面都被收录了那至少说明这套页面的内容搜索引擎还算认可。 (实际情况远比这个复杂而且收录后也有可能因为质量问题被删除但总比什么参照都没有要好对吧!)

评估 (敏感信息用编号代替均为真实数据)

先看一下爬虫日志的情况通过Shell脚本我们可以分析出。

目录总计被爬行的次数为13000次左右

不重复的目录爬行次数为5500次左右

频道A下的目录几乎被100%抓取过至少1次频道B的目录抓取也不错有70%被至少抓过一次。

其余频道下的目录被抓取的覆盖率不到30%

不要觉得这个结果很神奇其实很多网站都会面对这样的糟糕问题只要你把数据不断的细分细分再细分总会观察出一些端倪的。

关于日志分析不要迷信任何的日志分析软件那都是给懒人用的 自制脚本+Excel才是王道可以拆分显示出任何你想要的数据当然甚至可以连Excel都不要。

然后我们统计了一下被抓得最频繁的频道A和频道B 目录页的收录率

频道A和B是很让人放心的说明页面质量没问题但是余下的收录情况就让人比较担心了。

决策通过上面的数据评估我们已经得到了如下结论。

页面质量并不是影响收录的原因。

频道A B的抓取量异常的高通过调查了解原来是首页上的

目录页显示的全是频道A下的目录页首页又拥有全站最高的权重。频道B拥有比其他频道强大的外链资源权重也非常高。

除了A, B频道其他频道的抓取情况不容乐观抓取入口太少太深进而影响了收录情况。

很明显现在频道A从站内的角度来说太强大了必须进行一些

“劫富济贫”的运动来降低频道A的抓取量转移到其他频道中去。同时需要给爬虫提供更多的入口抓取频道页。

现在问题变得清晰起来我们开始把工作分成两部分 1.提供更多的入口2.将资源平分给各频道而不是集中在少数几个频道上。

提供入口工作

1.把目录页的URL制作成sitemap。提交给搜索引擎并且将其设置为比较高的抓取权重。

2.完善面包屑导航将面包屑导航划分得更加细致以提供更多入口

3.在其他产品中推荐目录页

资源平分工作 (一些概念任意页面都有可能成为爬虫入口百度爬虫抓取深度有限页面相对入口越浅被抓取的概率越高。 )

1.原先首页指向的都是频道A的目录页+产品页将其全部nofollow确保从首页进入的爬虫全部抓取到频道页通过频道页

再进入目录页(其实这个不算太重要)

2.原先频道页指向自身的产品页将其全部nofollow(确保从频道页入口的爬虫最大程度的抓取目录页)

3.从目录页返回到首页的链接将其全部nofollow。

4.减少一些页面上无关链接。 (什么情况下这么做都是非常有效的。 )

现在可以开始动手了。 。

成果

这么做到底有什么效果呢我们来看看修改后1个月后的数据。

目录页的收录率提高了100%!

产品页的收录率也有一定程度的提高这是归功于目录页对于产品的良好展现。

目录页的SEO表现

SEO流量占比上升了15%

增长10%的到访关键词数量(新页面的收录)

SEO流量增长了50%以上。 (包含一些季节因素)

备注

1.除了收录排名也是问题可以同步关注。

2.对于频道A这样特殊情况甚至可以对其进行全屏蔽但是技术上实现起来会略微麻烦。

3.百度对nofol low的支持据说很混乱有认识百度内部人士可以帮忙问一下。

4.有问题可以留言~

作者夜息http://www. imyexi.com/?p=575欢迎转载请保留出处

ftlcloud(超云)9元/月,1G内存/1核/20g硬盘/10M带宽不限/10G防御,美国云服务器

ftlcloud怎么样?ftlcloud(超云)目前正在搞暑假促销,美国圣何塞数据中心的云服务器低至9元/月,系统盘与数据盘分离,支持Windows和Linux,免费防御CC攻击,自带10Gbps的DDoS防御。FTL-超云服务器的主要特色:稳定、安全、弹性、高性能的云端计算服务,快速部署,并且可根据业务需要扩展计算能力,按需付费,节约成本,提高资源的有效利用率。点击进入:ftlcloud官方网站...

ManSora:英国CN2 VPS,1核/1GB内存/10GB SSD/1TB流量/100Mbps/KVM,$18.2/月

mansora怎么样?mansora是一家国人商家,主要提供沪韩IEPL、沪日IEPL、深港IEPL等专线VPS。现在新推出了英国CN2 KVM VPS,线路为AS4809 AS9929,可解锁 Netflix,并有永久8折优惠。英国CN2 VPS,$18.2/月/1GB内存/10GB SSD空间/1TB流量/100Mbps端口/KVM,有需要的可以关注一下。点击进入:mansora官方网站地址m...

丽萨主机:美国CN2 GIA精品网/KVM/9折,美国原生IP,最低27元/月

丽萨主机怎么样?丽萨主机,团队于2017年成立。成立之初主要做的是 CDN 和域名等相关业务。最近开辟新领域,新增了独立服务器出租、VPS 等业务,为了保证业务质量从一开始就选择了中美之间的 CN2 GIA 国际精品网络,三网回程 CN2 GIA,电信去程 CN2 GIA + BGP 直连智能路由,联通移动去程直连,原生IP。适合对网络要求较高的用户,同时价格也比较亲民。点击进入:丽萨主机官方网站...

引擎收录为你推荐
莲都区招投标中心办公场所地址变更公告重庆电信断网这几天为什么重庆电信的网络总是这么不稳定cuteftp什么是 CuteFtp Flashfxp Leapftp FlashGet重庆400年老树穿楼生长重庆适宜驴生长internetexplorer无法打开电脑的Internet Explorer打不开?ipad代理在哪买ipad更便宜大飞资讯单仁资讯的黄功夫是何许人?刚刚网刚刚网上刷单被骗了5万多怎么办啊 报警有用吗刚刚网新员工入职自我介绍怎么写?正大天地网二三线城市适合做生鲜b2b电商吗
虚拟空间租用 什么是虚拟主机 江西服务器租用 最便宜的vps 个人域名备案 域名备案号查询 美国主机论坛 60g硬盘 免空 免费防火墙 速度云 共享主机 世界测速 isp服务商 免费美国空间 微软服务器操作系统 申请免费空间和域名 移动服务器托管 备案空间 网站加速软件 更多