对比传统网页分析新浪博客开启网页搜索的优势
近日笔者在访问新浪微博搜索的时候发现新浪微博已经在“微博搜索”结果中加入了网页搜索。而这种搜索结果只有对指定的部分用户开放而并非所有用户都可以在微博搜索结果中看到对应关键词的网页搜索结果也就是说新浪微博在小范围内进行“灰度测试”网页搜索结果。
如下图在新浪微博的搜索网站中输入搜索关键词“互联网” 搜索结果页面乍一看依旧是早期的布局——由关键词对应的微博和相关用户构成。搜索框下方是搜索条件筛选工具栏可以指定筛选原创、认证用户、我关注的、图片、地区等条件的搜索结果。
而继续向下拉在微博的搜索结果之后就可以看到对应的网页搜索结果而且其中也是对搜索的关键词进行了标红显示。每一条网页搜索结果后方都标有“网页”字样对应的搜索结果呈现信息和要素有以下几点
1.网页title标题
2.原网页地址
3.网页内容摘要
4.分享次数
5.分享时间
6.分享人
在以上六点元素中可以进行点击的分别为1、 4、 5、 6四个元素 点击其中的1.(网页title标题)和5.(分享时间)的反馈结果均是跳转到了原网站的网页 点击6.(分享人)则直接URL链接到了指定微博用户的微博页面。点击要素4.(分享次数)链接则弹出如下对话框提示发布一条微博微博内容为“网页title”加“网页地址
”——非常简单的交互。
笔者对于网址搜索的结果来源以及搜索结果中展示的要素4“分享次数”的统计和来源还是比较感兴趣的。首先在新浪微博的所有访问页面中暂未发现可以提供网址列表供用户主动挑选分享的 因此猜测此处的网址搜索来源应是用户主动通过站外分享发布到新浪微博的。 JJ斗地主官网下载 youxi.gdwj.gov.cn其次新浪微博的开放平台网站open.weibo.c om早些时候已经公开了一系列的“短链接”相关接口——其中包含一系列短链接点击次数、分享次数、评论次数、点击用户地区分布等数据统计。因此笔者推测此处所谓的“分享次数”应为原网页对应的短链接的相关统计结果。如此实现在技术上也是比较简单和完善的思路。
下面再简要分析一下新浪微博推出网页搜索的初衷、优势和影响。
众所周知新浪微博是最近几年互联网圈内最火热的产品之一 曾经有一位业内的朋友谈起过新浪微博刚好赶上了互联网X年一个周期的高潮发展好时候。确实从诞生
到成为一款流行产品新浪微博只用了一年。 由于笔者自身关注社交网络多一些之前也有好几篇文章中谈及新浪微博和互联网以及其他相关行业产业的关系在此不再赘述。
微博本身作为社交媒体social media概念的产物从诞生之初就更偏“媒体”一些 圈内的各大互联网也包括新浪自身都有将微博称为“自媒体”的叫法而媒体则强调的是内容和传播性以及影响力等要素。新浪多年以来具有国内互联网企业中最强势的运营能力 因此在微博的内容运营中也是如鱼得水。经常穿梭于各大社区的朋友可能也会发现从社区的内容质量上来看新浪微博具有非常高的优势。而在新浪微博开放平台发布之后各种应用可以轻易和新浪微博进行接入合作陆续有源源不断的互联网内容被用户分享到新浪微博中。
笔者认为这就构成了很重要的第一点微博中具有来自互联网的高质量内容。
与传统的搜索引擎相比这是极其明显的优势。 曾记得N年前百度的创始人李彦宏先生有一项构成了近日互联网搜索引擎基石的专利——“超链分析技术”(hypertext document retrieval system and method)甚至传言后来google的搜索技术也与此有紧密关系。我们暂且不去分析此项专利的详细内容但是可以想象其实现的目的是在互联网的海量内容中进行搜索并对搜索结果相关性进行调整、排序、显示——而如此的海量工作并定通过计算机实现。相比之下新浪微博在网页搜索方面的基础数据和高度应该要更有优势除去spam用户和内容的影响用户分享的内容必定是其有兴趣的内容因此必定要比传统引擎的搜索机器人spider爬虫的搜索结果的平均价值要更高——此所谓高质量!
第二点微博更容易得到网页结果排序。
笔者简单分析过百度等传统搜索引擎的前端页面用户在页面中的每一个链接的点击搜索引擎都会有记录程序向后端报告供后端分析和统计 以便对搜索结果进行算法调整和排序校正等。可以看出传统的搜索引擎除了自身的排序算法之外会根据用户行为进行搜索结果排序。
而从目前新浪微博公布的短链接统计接口可以看出新浪微博已经对来自互联网的所有网址URL在新浪微博上的点击、分享等行为进行了统计。而新浪微博能将此部分数据通过openapi公布出来笔者认为是新浪微博迈了具有跨越性的一步。百度和google等传统的互联网搜索引擎完全可以通过新浪微博的接口获取互联网上的某个网址URL在新浪微博中的“受欢迎度”等数据这将对搜索引擎调整自身搜索结果排序具有一定帮助。因此笔者大胆猜测 baidu和google、 sogou等传统搜索引擎已经在进行相关尝试或合作。
因此可以说新浪微博自身做网页搜索的话在搜索结果排序上也是具有很大优势的。
第三点更高质量的用户行为——基于网址相关。
其实这一点和上面的第二点有些交集的地方依然是从网页搜索结果排序的质量来说。在传统的搜索引擎中用户一般都要通过大于一次的点击得到需要的内容而在用户获得精确内容的时候却没有向搜索引擎进行“反馈” 。我们在各大搜索引擎中都看到过“赞”、“顶”、“打分”等类似的功能这也表明了搜索引擎想更精确的了解用户对搜索结果的满意度的愿望。
在微博中微博作为用户内容社区用户关系是相对弱化的这也更加强化了用户的行为是基于内容的兴趣。如果我们认为用户对网址的点击行为和传统搜索引擎的点击行为是对等关系的话那么用户对包含网址的微博的分享行为不就是对网址的“顶”的反馈吗?这些传统搜索引擎“梦寐以求”的数据微博上几乎可以轻易拿到。
第四点新浪微博网页搜索的劣势
这一点说来应该还是蛮多的。最直接的两点 1.网页索引量太少相比百度、google的传统搜索引擎依靠爬虫主动获取网页内容的方式来说依靠网友分享贡献网址的新浪微博索引的网页数量必定太少短时间内难以与传统搜索公司抗衡;2.用户搜索习惯微博毕竟还是微博的环境用户搜索习惯不是很容易养成的。此外搜索引擎是一项复杂的工程也非一日两日之功就可以建立和完善的。
第五点新浪微博的搜索的未来?
谈及互联网的未来甚至某些产品的未来的时候总是有很多人能够夸夸其谈的说一大堆。笔者则不是很愿意对一些未来大局类的事物做太多预测和谈论还是之前那个观点——务实做好能做的之后多为用户着想着做实事儿。
从去年开始就陆续有文章说新浪微博可能要做独立搜索但一年过去了貌似没看到多大变化。搜索只是s.weibo.com独立域名而已搜索结果和搜索相关的体验貌似变化也不大——当然此次加入了网页搜索应该还算比较大的变化。截止目前不能说新浪微博搜索给大家的感觉不温不火也差不多吧(笔者暂且自大一把如此认为)。新推出的网页搜索则简单的在原有的搜索结果展示用户搜索结果、微博搜索结果之后加上了网页的搜索结果笔者理解为这是在尝试所以用户体验与之前的展示结果差异不大。
涉及到网页搜索必然涉及到流量输出此处是指搜索结果的流量输出。盈利模式是否又会和传统的搜索引擎类似提供搜索相关性广告和竞价排名等服务呢?笔者认为从求稳的角度来说这种方式可以作为前期最主要的方式。也相信“美丽说”和“蘑菇街”等社区的消费分成的盈利模式在新浪微博上一样可以顺风顺水的实现在微博搜索上则更可以借此东风。
简单分析到此肯定也不尽全面也欢迎有兴趣的朋友一起讨论。
写到这儿笔者还是想感叹新浪微博手中握着好多宝库而新浪微博眼前却一直处于亏损严重状态。未来在其产品线铺全面开和壮大之后新浪微博能否将这些宝库都发掘出来并实现对应价值?这是个极具诱惑的话题!而更多的人除了站一边拭目以待以外还真没啥其他办法和动作了。最后希望新浪能让大家看得过瘾。
SugarHosts糖果主机商我们较早的站长们肯定是熟悉的,早年是提供虚拟主机起家的,如今一直还在提供虚拟主机,后来也有增加云服务器、独立服务器等。数据中心涵盖美国、德国、香港等。我们要知道大部分的海外主机商都只提供Linux系统云服务器。今天,糖果主机有新增SugarHosts夏季六折的优惠,以及新品Windows云服务器/云VPS上线。SugarHosts Windows系统云服务器有区分限制...
ftech怎么样?ftech是一家越南本土的主机商,成立于2011年,比较低调,国内知道的人比较少。FTECH.VN以极低的成本提供高质量服务的领先提供商之一。主营虚拟主机、VPS、独立服务器、域名等传统的IDC业务,数据中心分布在河内和胡志明市。其中,VPS提供1G的共享带宽,且不限流量,还可以安装Windows server2003/2008的系统。Ftech支持信用卡、Paypal等付款,但...
今天CloudCone发布了最新的消息,推送了几款特价独立服务器/杜甫产品,美国洛杉矶MC机房,分配100Mbps带宽不限流量,可以选择G口限制流量计划方案,存储分配的比较大,选择HDD硬盘的话2TB起,MC机房到大陆地区线路还不错,有需要美国特价独立服务器的朋友可以关注一下。CloudCone怎么样?CloudCone服务器好不好?CloudCone值不值得购买?CloudCone是一家成立于2...