页面提高网站在Google中的排名(二)网络毕业论

google排名  时间:2021-01-31  阅读:()

提高网站在Google中的排名二)网络毕业论

目录

一篇新闻页面中

一个页面中关键词命中权重链入文字>HTML标题文字>HTML页面主体内容>>出链文字

正文

提高网站在Google中的排名二)

如何突出关键词面向主题(Theme)的关键词匹配

ThemeEngine正在逐步超过PR成为结果排序中更主要的因素可以比较一下以下现象

为什么查“新闻”  “汽车”之类的文字各种门户网站的首页不在第一位要知道他们的页面中都有相应频道的链接文字的

一篇新闻页面中搜索引擎如何不通过模板匹配 自动将新闻的主体和页面中的页头栏目导航条页尾等部分的内容区分开的

其实以上问题都可以归结为网页内容摘要的提取策略和关键词在其中的命中

首先将能够描述一个页面内容的分成以下几种类型

链入文字描述 inboundl inktexthttp:terms-inbound-link. shtml

HTML页面标题 t i t l e好标题一般会将页面中最重要的关键词放在最前面 比如 AB C-10型吸尘器-XX家电城

HTML内容主体 contenttext

链出文字 outboundl inktext

如果按照以下规则

一个页面中关键词命中权重链入文字>H TML标题文字>H TML页面主体内容>>出链文字 以上现象就比较好解释了。

链入文字是页面上看不见的但链入文字对被链接页面有巨大的作用在现代搜索引擎在关键词匹配的过程中匹配的过程不只看当前页面的内容摘要很大程度上不只看这个网页自己说自己有什么内

容还要看别人如何链接时如何描述你的网站别人怎么称呼你 比你自己说自己更重要。

比如查 “世界卫生组织” 返回结果中有http:而这个页面中是没有中文的之所以能匹配上是因为很多链接它的中文网站使用了世界卫生组织所以这个页面中不存在的中文关键词也成为了页面摘要的一部分。这样一想就可以知道链出链接的文字其实是为被链接的子频道首页或者内容详情页服务的。对自身页面的关键词密度只有负面的影响这也是Google建议一个页面中链接不要超过100个的原因他根本不索引100个链接以后的内容。按照以上规则搜索引擎将一篇新闻详情页中的新闻内容提取出来就是把页面上所有带HTTP链接的文字都去掉就是新闻的内容部分了更精确一些可以通过取最长文本段落等策略实现而很多网站首页或频道首页中几乎全部都是链接经过搜索引擎分析的结果就是什么内容也没有能够被命中的关键词仅仅是别人链接你用的“网站首页”和频道标题Title中的站点名称等的几个关键词而页面中其他的文字则远远不如相应子频道和具体内容页面的匹配度高而搜索引擎能够通过以上规则让用户更快的直接定位到有具体内容的内容详情页面。因此希望通过一个首页尽可能多的命中所有希望推广的关键词是不可能的。让网页尽可能多的进入搜索引擎的索引然后把握好整个网站的主题风格是非常重要的让网站的主题关键词能够比较均匀的按照金字塔模式分布到网站中可以参考 网站的主题金字塔设计网站名称用户通过12个抽象关键词

子频道1子频道2 用户通过23个关键词命中

产品1产品2文章1文章2(用户通过34个关键词命中这种用户最有价值)

不要空着标题空着无异于浪费了最有价值的一块阵地

传统的页面中 HTML页面中会有类似以下的隐含信息用于说明当前网页的主要内容关键字

后来由于这种人工添加关键词的方式被滥用大量网页中为了提高被搜索引擎命中的概率经常添加一些和实际网页内容无关的热门关键比如 “mus icmp3download”等所以新一代的搜索引擎已经不再关心页面头文件中的人工metakeyword声明而页面标题在搜索引擎的关键词的命中命中过程中往往有着更高的比重如果一个关键词在标题中命中会比在页面中命中有更高的得分从而在相应的搜索结果排名中更靠前。

标题长度和内容不要过长一般在40个字符以内并充分突出关键词的比重

如果更长的标题搜索引擎一般会忽略掉所以要尽可能将主要关键词放在标题靠前的位置。省略掉不必要的形容词吧毕竟用户主要通

过名词来找到需要的内容。标题内容尽量用一些别人可以通过关键词找到的字眼也别太过头如果标题中的字眼超过1半内容中都没有有可能被搜索引擎排除出索引  因此基于web日志中来自其他搜索引擎的关键词查询统计非常必要。

如果网页很多的话尽量使用不同的网页标题争取让自己网站的内容更多的进入搜索引擎索引范围

因为搜索引擎会根据页面内容的相似度把一些内容当成重复页面排除出索引范围http:phpMan.php是我的网站上的一个小应用一个web界面的unix命令手册manpage 在以前的设计中所有动态页面使用的都是同样的标题 "phpMan:manpage/perldoc/infopagewebinterface"Google索引了大约3000多个页面后来我将页面标题改成了

"phpMan: [命令名]"这样的格式 比如 "phpMan:l s"这样大部分动态页面的标题就都不一样了一个月后Google从这个页面入口索引了大约6000个页面。因此如果网站中很多网页都使用相同的标题 比如 “新闻频道”  “论坛” 这些页面中很大一部分就会被排重机制忽略掉。

除了外还可以用标题行突出内容主题加强标题的效果

在我的网站设计中我会把用[标题]这样的模板把标题突出显示而不是通过改变字体的方式突出标题。

其他网站设计提示

静态链接 Blog网站另外一个优势在于其网页是静态链接动态网页占到整个互联网内容的90以上。各个搜索引擎其实能够表现的都只不过是互联网的冰山一角(3-5%) 不同的只是谁让优质网页排名靠前的策略更优秀而已大部分搜索引擎都认为静态链接的网页是优质网页 Google在优先抓取索引的网页中70%以上是不带参数链接的静态网页。而且即使同样的内容静态网页也会比动态网页权重高很容易理解 query?a=1&b=2这样的链接由于参数顺序颠倒的query?b=2&a=1完全相同。尽量使用静态网页 目前能够动态网页进行全面的索引还比较难而即使是Google也更不会索引所有的内容 因此很少会对参数超过2个的动态网页进行进一步的抓取和分析。 以下是一个phpBB论坛页面返回的HTTP头信息 科教范文网

HTTP/1. 1200OKDate:Wed

28Jan200412:58:54GMTServer:Apache/(Unix)mod_gzip/. 1aPHP/-Powered-By:PHP/-

Cookie:phpBB_data=a%3A0%3A%7B%7D;expires=Thu 27-Jan-

200512:58:54GMT;path=/;Set-

Cookie:phpBB_sid=09f67a83ee108ecbf 11e35bb6f36fcec;path=/;Content-Encoding:gzipCache-Control:private pre-check=0 post-check=0 max-age=0Expires:0Pragma:no-cacheConnection:closeContent-Type:text/html

为了避免隐私问题 Googlebot可以通过对页面httpheader中的sessionid和sessioncookie进行一些甄别这样很多需要认证信息的论坛内容就无法进入索引了。

总体上说Google喜欢新的静态的内容。因此无论从效率上讲还是方便搜索引擎收录使用内容发布系统将网站内容发布成静态网页都是非常必要的从某种程度上说googlefriendly=anonymouscachefriendly。

比如http:phpMan.php/maintro/3http:phpMan.php?mode=man&;parameter=intro&section=3这样的链接更容易进入搜索引擎的索引。而且在URL中的命中也能突出关键词。

能够进入Google索引的页面数量越多越好。用类似以下的脚本可以统计自己的网站被搜索引擎索引的情况。

#!/b ihYESTERDAY=`date-dyesterday+%Y%m%d`#forFreeBSD:YESTERDAY=`date-v-

1 d+%Y%m%d`LOG_FILE='/home/apache/logs/access_log'grep-iGooglebot$LOG_FILE. $YESTERDAY|awk' {print$7} ' |sort|uni q-c|sort-rn>spide$-ibai duspider$LOG_FILE. $YESTERDAY|awk' {print$7} ' | sort|uniq-c|sort-rn>spide$-imsnbot$LOG_FILE. $YESTERDAY|awk' {print$7} ' |sort|uni q-c|sort-

rn>spide$-i inktomi$LOG_FILE. $YESTERDAY|awk' {pr int$7} ' |sort|un iq-c|sort-rn>spide$-i openbot$LOG_FILE. $YESTERDAY|awk' {pr int$7} ' |sort|uniq-c|sort-rn>spide$

轻云互联,香港云服务器折后22元/月 美国云服务器 1核 512M内存 15M带宽 折后19.36元/月

轻云互联成立于2018年的国人商家,广州轻云互联网络科技有限公司旗下品牌,主要从事VPS、虚拟主机等云计算产品业务,适合建站、新手上车的值得选择,香港三网直连(电信CN2GIA联通移动CN2直连);美国圣何塞(回程三网CN2GIA)线路,所有产品均采用KVM虚拟技术架构,高效售后保障,稳定多年,高性能可用,网络优质,为您的业务保驾护航。官方网站:点击进入广州轻云网络科技有限公司活动规则:1.用户购...

Spinservers:美国圣何塞机房少量补货/双E5/64GB DDR4/2TB SSD/10Gbps端口月流量10TB/$111/月

Chia矿机,Spinservers怎么样?Spinservers好不好,Spinservers大硬盘服务器。Spinservers刚刚在美国圣何塞机房补货120台独立服务器,CPU都是双E5系列,64-512GB DDR4内存,超大SSD或NVMe存储,数量有限,机器都是预部署好的,下单即可上架,无需人工干预,有需要的朋友抓紧下单哦。Spinservers是Majestic Hosting So...

美国G口/香港CTG/美国T级超防云/湖北高防云服务器物理机促销活动 六一云

六一云 成立于2018年,归属于西安六一网络科技有限公司,是一家国内正规持有IDC ISP CDN IRCS电信经营许可证书的老牌商家。大陆持证公司受大陆各部门监管不好用支持退款退现,再也不怕被割韭菜了!主要业务有:国内高防云,美国高防云,美国cera大带宽,香港CTG,香港沙田CN2,海外站群服务,物理机,宿母鸡等,另外也诚招代理欢迎咨询。官网www.61cloud.net最新直销劲爆...

google排名为你推荐
电脑内存的作用增加内存条对电脑有什么好处海贼王644集海贼王巴托洛米奥是路飞的忠实粉丝,638集他和贝拉米打的时候路飞给贝拉米加油他知道嘛?最后他说烧烧滴滴软银合资哪款车比较适合跑滴滴cf蜗牛外挂我想让cf用什么外挂可以让号被封了要最快那种。最好永久封了最好qq空间首页QQ空间主页怎么弄?核芯显卡与独立显卡哪个好核芯显卡和独立显卡有什么区别?最好的是哪个?行车记录仪哪个好最好的行车记录仪是什么牌子牡丹江教育云空间登录云端学习如何登录?q空间登录怎样从空间登录QQ号dns服务器故障dns服务器异常怎么办
域名网 重庆服务器托管 电影服务器 站群服务器 10t等于多少g php主机 老左博客 realvnc 中国特价网 华为4核 元旦促销 搜索引擎提交入口 云营销系统 阿里云免费邮箱 数据库空间 湖南idc 中国linux 万网空间 镇江高防服务器 湖南铁通 更多