页面提高网站在Google中的排名(二)网络毕业论

google排名  时间:2021-01-31  阅读:()

提高网站在Google中的排名二)网络毕业论

目录

一篇新闻页面中

一个页面中关键词命中权重链入文字>HTML标题文字>HTML页面主体内容>>出链文字

正文

提高网站在Google中的排名二)

如何突出关键词面向主题(Theme)的关键词匹配

ThemeEngine正在逐步超过PR成为结果排序中更主要的因素可以比较一下以下现象

为什么查“新闻”  “汽车”之类的文字各种门户网站的首页不在第一位要知道他们的页面中都有相应频道的链接文字的

一篇新闻页面中搜索引擎如何不通过模板匹配 自动将新闻的主体和页面中的页头栏目导航条页尾等部分的内容区分开的

其实以上问题都可以归结为网页内容摘要的提取策略和关键词在其中的命中

首先将能够描述一个页面内容的分成以下几种类型

链入文字描述 inboundl inktexthttp:terms-inbound-link. shtml

HTML页面标题 t i t l e好标题一般会将页面中最重要的关键词放在最前面 比如 AB C-10型吸尘器-XX家电城

HTML内容主体 contenttext

链出文字 outboundl inktext

如果按照以下规则

一个页面中关键词命中权重链入文字>H TML标题文字>H TML页面主体内容>>出链文字 以上现象就比较好解释了。

链入文字是页面上看不见的但链入文字对被链接页面有巨大的作用在现代搜索引擎在关键词匹配的过程中匹配的过程不只看当前页面的内容摘要很大程度上不只看这个网页自己说自己有什么内

容还要看别人如何链接时如何描述你的网站别人怎么称呼你 比你自己说自己更重要。

比如查 “世界卫生组织” 返回结果中有http:而这个页面中是没有中文的之所以能匹配上是因为很多链接它的中文网站使用了世界卫生组织所以这个页面中不存在的中文关键词也成为了页面摘要的一部分。这样一想就可以知道链出链接的文字其实是为被链接的子频道首页或者内容详情页服务的。对自身页面的关键词密度只有负面的影响这也是Google建议一个页面中链接不要超过100个的原因他根本不索引100个链接以后的内容。按照以上规则搜索引擎将一篇新闻详情页中的新闻内容提取出来就是把页面上所有带HTTP链接的文字都去掉就是新闻的内容部分了更精确一些可以通过取最长文本段落等策略实现而很多网站首页或频道首页中几乎全部都是链接经过搜索引擎分析的结果就是什么内容也没有能够被命中的关键词仅仅是别人链接你用的“网站首页”和频道标题Title中的站点名称等的几个关键词而页面中其他的文字则远远不如相应子频道和具体内容页面的匹配度高而搜索引擎能够通过以上规则让用户更快的直接定位到有具体内容的内容详情页面。因此希望通过一个首页尽可能多的命中所有希望推广的关键词是不可能的。让网页尽可能多的进入搜索引擎的索引然后把握好整个网站的主题风格是非常重要的让网站的主题关键词能够比较均匀的按照金字塔模式分布到网站中可以参考 网站的主题金字塔设计网站名称用户通过12个抽象关键词

子频道1子频道2 用户通过23个关键词命中

产品1产品2文章1文章2(用户通过34个关键词命中这种用户最有价值)

不要空着标题空着无异于浪费了最有价值的一块阵地

传统的页面中 HTML页面中会有类似以下的隐含信息用于说明当前网页的主要内容关键字

后来由于这种人工添加关键词的方式被滥用大量网页中为了提高被搜索引擎命中的概率经常添加一些和实际网页内容无关的热门关键比如 “mus icmp3download”等所以新一代的搜索引擎已经不再关心页面头文件中的人工metakeyword声明而页面标题在搜索引擎的关键词的命中命中过程中往往有着更高的比重如果一个关键词在标题中命中会比在页面中命中有更高的得分从而在相应的搜索结果排名中更靠前。

标题长度和内容不要过长一般在40个字符以内并充分突出关键词的比重

如果更长的标题搜索引擎一般会忽略掉所以要尽可能将主要关键词放在标题靠前的位置。省略掉不必要的形容词吧毕竟用户主要通

过名词来找到需要的内容。标题内容尽量用一些别人可以通过关键词找到的字眼也别太过头如果标题中的字眼超过1半内容中都没有有可能被搜索引擎排除出索引  因此基于web日志中来自其他搜索引擎的关键词查询统计非常必要。

如果网页很多的话尽量使用不同的网页标题争取让自己网站的内容更多的进入搜索引擎索引范围

因为搜索引擎会根据页面内容的相似度把一些内容当成重复页面排除出索引范围http:phpMan.php是我的网站上的一个小应用一个web界面的unix命令手册manpage 在以前的设计中所有动态页面使用的都是同样的标题 "phpMan:manpage/perldoc/infopagewebinterface"Google索引了大约3000多个页面后来我将页面标题改成了

"phpMan: [命令名]"这样的格式 比如 "phpMan:l s"这样大部分动态页面的标题就都不一样了一个月后Google从这个页面入口索引了大约6000个页面。因此如果网站中很多网页都使用相同的标题 比如 “新闻频道”  “论坛” 这些页面中很大一部分就会被排重机制忽略掉。

除了外还可以用标题行突出内容主题加强标题的效果

在我的网站设计中我会把用[标题]这样的模板把标题突出显示而不是通过改变字体的方式突出标题。

其他网站设计提示

静态链接 Blog网站另外一个优势在于其网页是静态链接动态网页占到整个互联网内容的90以上。各个搜索引擎其实能够表现的都只不过是互联网的冰山一角(3-5%) 不同的只是谁让优质网页排名靠前的策略更优秀而已大部分搜索引擎都认为静态链接的网页是优质网页 Google在优先抓取索引的网页中70%以上是不带参数链接的静态网页。而且即使同样的内容静态网页也会比动态网页权重高很容易理解 query?a=1&b=2这样的链接由于参数顺序颠倒的query?b=2&a=1完全相同。尽量使用静态网页 目前能够动态网页进行全面的索引还比较难而即使是Google也更不会索引所有的内容 因此很少会对参数超过2个的动态网页进行进一步的抓取和分析。 以下是一个phpBB论坛页面返回的HTTP头信息 科教范文网

HTTP/1. 1200OKDate:Wed

28Jan200412:58:54GMTServer:Apache/(Unix)mod_gzip/. 1aPHP/-Powered-By:PHP/-

Cookie:phpBB_data=a%3A0%3A%7B%7D;expires=Thu 27-Jan-

200512:58:54GMT;path=/;Set-

Cookie:phpBB_sid=09f67a83ee108ecbf 11e35bb6f36fcec;path=/;Content-Encoding:gzipCache-Control:private pre-check=0 post-check=0 max-age=0Expires:0Pragma:no-cacheConnection:closeContent-Type:text/html

为了避免隐私问题 Googlebot可以通过对页面httpheader中的sessionid和sessioncookie进行一些甄别这样很多需要认证信息的论坛内容就无法进入索引了。

总体上说Google喜欢新的静态的内容。因此无论从效率上讲还是方便搜索引擎收录使用内容发布系统将网站内容发布成静态网页都是非常必要的从某种程度上说googlefriendly=anonymouscachefriendly。

比如http:phpMan.php/maintro/3http:phpMan.php?mode=man&;parameter=intro&section=3这样的链接更容易进入搜索引擎的索引。而且在URL中的命中也能突出关键词。

能够进入Google索引的页面数量越多越好。用类似以下的脚本可以统计自己的网站被搜索引擎索引的情况。

#!/b ihYESTERDAY=`date-dyesterday+%Y%m%d`#forFreeBSD:YESTERDAY=`date-v-

1 d+%Y%m%d`LOG_FILE='/home/apache/logs/access_log'grep-iGooglebot$LOG_FILE. $YESTERDAY|awk' {print$7} ' |sort|uni q-c|sort-rn>spide$-ibai duspider$LOG_FILE. $YESTERDAY|awk' {print$7} ' | sort|uniq-c|sort-rn>spide$-imsnbot$LOG_FILE. $YESTERDAY|awk' {print$7} ' |sort|uni q-c|sort-

rn>spide$-i inktomi$LOG_FILE. $YESTERDAY|awk' {pr int$7} ' |sort|un iq-c|sort-rn>spide$-i openbot$LOG_FILE. $YESTERDAY|awk' {pr int$7} ' |sort|uniq-c|sort-rn>spide$

老用户专享福利 腾讯云 免费领取轻量云2核4G服务器一年

感恩一年有你!免费领取2核4G套餐!2核4G轻量应用服务器2核 CPU 4GB内存 60G SSD云硬盘 6Mbps带宽领取地址:https://cloud.tencent.com/act/pro/lighthousethankyou活动规则活动时间2021年9月23日 ~ 2021年10月23日活动对象腾讯云官网已注册且完成实名认证的国内站用户(协作者与子用户账号除外),且符合以下活动条件:账号...

VPS云服务器GT线路,KVM虚vps消息CloudCone美国洛杉矶便宜年付VPS云服务器补货14美元/年

近日CloudCone发布了最新的补货消息,针对此前新年闪购年付便宜VPS云服务器计划方案进行了少量补货,KVM虚拟架构,美国洛杉矶CN2 GT线路,1Gbps带宽,最低3TB流量,仅需14美元/年,有需要国外便宜美国洛杉矶VPS云服务器的朋友可以尝试一下。CloudCone怎么样?CloudCone服务器好不好?CloudCone值不值得购买?CloudCone是一家成立于2017年的美国服务器...

ucloud国内云服务器2元/月起;香港云服务器4元/首月;台湾云服务器3元/首月

ucloud云服务器怎么样?ucloud为了扩大云服务器市场份额,给出了超低价云服务器的促销活动,活动仍然是此前的Ucloud全球大促活动页面。目前,ucloud国内云服务器2元/月起;香港云服务器4元/首月;台湾云服务器3元/首月。相当于2-4元就可以试用国内、中国香港、中国台湾这三个地域的云服务器1个月了。ucloud全球大促仅限新用户,国内云服务器个人用户低至56元/年起,香港云服务器也仅8...

google排名为你推荐
机械表和石英表哪个好手表石英和机械哪个好手机杀毒软件哪个好安卓手机杀毒软件哪个最好二手车网站哪个好想买台二手车,哪个二手车网站靠谱网络机顶盒哪个好现在网络机顶盒哪个牌子好?空间登录qq手机QQ能不能直接登录空间而不用上QQ东莞电信宽带东莞电信宽带资费怎样?dns服务器设置DNS服务器建立的详细步骤?dns服务器故障DNS服务解析故障 怎么办dns服务器什么意思DNS服务器是什么意思啊?是指路由器吗?360云盘官网360云盘手机下载官网下载安装到手
台湾虚拟主机 上海服务器租用 vps租用 浙江vps 域名备案中心 联通c套餐 韩国加速器 iisphpmysql 免费网站监控 湖南服务器托管 免费吧 永久免费空间 深圳域名 美国迈阿密 广州服务器托管 贵州电信 九零网络 日本小学生 香港云主机 主机托管 更多