基于网站流量统计的网站可用性指标及计算方法研究
柯青/王秀峰/郑彦宁/潘云涛
0 2-9-25 18:39 来源 《图书情报工作》 (京 01 年20期
【英文标题】 Website s i ity Indica s ad Calcu atin Mthods Base nebsit Trffic Stti tics
【作者简介】柯青,女, 979年生,南京大学信息管理系副教授,发表论文2篇;王秀峰男 1974年生,南京大学信息管理系博士生,发表论文6篇南京21009) 郑彦宁,男, 6年生,中国科学技术信息研究所研究员,发表论文4篇;潘云涛,女, 1967年生,中国科学技术信息研究所研究员,发表论文65篇(北京100 38 。
【内容提要】分析影响网站可用性分析的因素,根据网站流量统计信息从网站规模、网站质量、网站推广、网站辅助功能、用户情感5个方面构建一套网站可用性分析指标体系,并系统探讨如何从网站流量信息中采集网站可用性分析指标的数据和计算方法,为网站可用性分析提出一种新思维。
The paer na yzes he factors ht afect eb ite sab ity, based on s te traff c s at ic infoma in, nd then constructs s t f indicator systewhich iclude ebsite scale, w i equality, web ite o ion, websi as is a function a us r emot on F thr he papr d
sc ses th data c lec ion and calculatin mthod fr w site usability from site trff c statist c nfoma io, terefre an el wes te u i it analysis tho is provi . 【关键词】流量统计可用性/网站/指标Traff i ati t c /Usabi i yWes t /Indict
1、引言 可用性 ai ty)是人机交互中的一个重要概念,它从最终用户的角度出发来评价产品质量的重要性。对网站来说可用性反映网站是否符合用户的需求和期望,体现用户在使用网站过程中感受的网站价值,是网站成功的核心要素之一。可用性是通过用户的态度来反映的而根据行为学原理,能够反映态度的正是行为变量因而分析网站可用性要通过用户使用网站的行为和结果来评价。从此意义上讲,网站可用性分析是一个从用户出发系统化收集用户的行为特征等可用性信息,运用一定的分析方法发现网站可用性问题并提出改进策略的过程。
在以往学者的研究中对用户行为特征的分析往往借助于现场观察、调查问卷等手段,前者由于条件所限,只能选择有代表性的用户来分析,后者虽然可以开展大规模的调查但属于一种事后自主报告的方式用户出于心理顾虑,不愿意真实地披露内心想法。如何探求一种客观、科学、经济、高效的可用性分析方法成为可用性专家追求的目标。基于此,本文尝试根据用户和网站交互过程中记录在服务器或客户端上的访问数据来构建一套基于网站流量统计的网站可用性指标体系并进一步探讨各指标的数据计算方法,从而为研究网站可用性提供一个新的思路和方案。
、 网站可用性分析研究现状
很多学者都认为可用性是度量一个系统或者网站成功与否的重要尺度之一1] ,并从理论和实践两方面形成了诸多可借鉴的成果。从文献调研来看,国内外学者对网站可用性的研究都经历了从理论到实证,从通用网站到专业网站的发展历程,在继承和发展传统可用性研究成果的基础上,针对网站开展了大量的实证研究[2] 。
著名可用性专家Ni lse根据多年对网站的研究总结了针对网络应用的特殊情况的个新的可用性参数导航、响应时间、可信度和内容[3 。 Turner评估网站可用性的指标为导航、 网页设计、 内容、可存取性、多媒体使用、互动性和一致性[4 。 Paler的网站可用性指标为:下载延迟、导航、 内容、互动性、响应性[5] 。 Trafdar等人从信息内容、导航系统的易用性、下载速度、 网站可访问性角度评估网站的可用性[6] 。 osen等人从一致性(友好的环境、易用的导航和清晰的设计) 、复杂性包含供用户探索的各种信息和图像和易读性(一致和清楚的网站设计)三个维度定义可用性实际上也是评估网站可用性的三个指标7 。波多黎各大学计算机研究与发展中心的Jsé A. Bor s, Isra Morales和é tr J. odriguez认为N e sen提出的一些可用性测试方法需要用户参与,费时费力,在网页设计师的实际工作中是不切实可行的,因此采用启发式评估方法提出了适用于所有类型网站设计的10条简单的可用性设计指南以及针对主页的6条可用性设计指南,并且用实验证明了其有效性[8] 。 Venatesh和Ag w l提出了MU可用性准则为:内容、易用性、个性化及情感[9 。 国内学者也研究了网站可用性分析指标。如魏芳芳提出政府门户网站可用性用内容质量、易用性、网站推广、定制服务、情感因素来测度[ ] 。詹向阳提出的网络资源库的可用性指标包括内容、
形式、个性化以及稳定性类,每类下分别列举了若干细化的评价指标[1 。 山东大学1篇硕士论文从网站设计的易用性、正确性、兼容性、 网站性能4个方面分析了专业女性网站的可用性[1 ] 。此外,针对电子商务网站、数字博物馆、高校图书馆网站、医学健康网站以及儿童网站的研究也分别提出了许多具体的可用性分析指标。
3、影响网站可用性分析的因素
网站作为一种新型的信息媒体,用户对它的使用不同于对普通工业产品的使用情形,大多数工业产品具有有限的任务集和可预测的用户,这些假设在面对网络系统时变得不成立,用户的个体差异、任务的具体特征以及所处的社会环境和物理环境都将直接影响用户的可用性感受。
3. 1用户 首先,网站用户数量是难以预估和控制的,网站对全球网民开放但是有些网站只被小范围内用户访问,有的能得到全球瞩目;其次网站用户在地域、文化背景、语言、受教育程度、计算机经验、年龄、性别等方面是异质的。因而,在获取用户行为信息时,传统可用性研究中的用户分析方法往往对样本选择要求高,直接关系到可用性分析结果。 .2任务
用户使用网站的目的也不同,这归因于网站本身功能多样。面对用户任务的不同,用户对网站的需求也不一样因而在网站可用性研究中除了遵循一些通用的可用性原则外还应针对不同类型的网站开展针对性的分析。
3 3环境
网站资源结构、网站技术平台以及客户端设备共同导致了用户使用网站时环境的复杂,实验室环境难以模拟真实的用户使用网络的
情形单靠传统的人工可用性分析方法难以胜任数据的采集、分析工作。此外,用户对网站的使用体验还受到周围社会环境如关键人群、价值观、文化习俗等方面的影响。
在笔者看来,这三者的影响导致网站可用性分析的复杂性和特殊性而学界对网站可用性研究普遍存在一些惯性思维和弊端,因而并没有解决当前网站可用性的一些根本问题。最主要的根源在于学者在获取用户行为信息时采取的是传统的社会科学研究方法,如问卷调查和访谈、现场观察以及可用性测试等。用这类方法研究用户有一定的优势,其实施过程简单、灵活,获取的信息有针对性,但是这类源自社会科学实证研究的用户信息收集方法也都承袭了其原有的不足,特别是在样本来源广度和信息采集过程中研究者的介入程度两方面;其次,许多研究者为了比较用户使用网站的差异,通常会模拟任务情境但毕竟不能代表用户的真实情况;第三,这些方法都是由人工实施的,很少有工具辅助自动完成,因而从时间效率、成本经济性来看不甚理想。
、基于网站流量统计的网站可用性信息采集
4. 网站流量统计采集可用性信息的优势
为了改进上述网站可用性研究的缺陷,适应网站可用性分析的要求真实地反映用户与网站的交互过程,笔者提出应用网站流量统计方法来采集可用性信息。网站流量是网络营销研究中常提到的一个概念,泛指网站的访问量,可用一个网站一段时间内访问者的数量、访问者所浏览的网页的点击率和平均停留时间等指标来描述 ] 。网站流量分析能获取用户与网站交互过程中自动保存在各服务器或
客户端上的反映用户的访问来源、访问时间、访问内容、访问路径等数据,再由可用性分析人员将其转化为评估网站可用性的指标,从而能发现网站存在的可用性问题。
利用网站流量统计采集可用性信息具有以下优势:①用户分析样本得到改观。与传统可用性分析中用户测试方法相比,基于网站流量统计的可用性分析的数据来源是用户在与网站交互过程中自动记录在服务器或客户端上的数以万计的数据在被测对象的数量、随机性、数据的准确性和充分性方面得到大大的改良,避免了实验中受空间、经费、技术等条件的限制,只能选择较容易获取的样本来分析的弊端,代之以时间为统计周期,随机获得网络上各种背景的用户信息。②在用户的真实任务环境中开展可用性分析。传统的现场测试、专家评估、认知走查等方法要求分析专家首先根据要测试的目的设计用户任务并且设想用户执行正确的步骤是怎样的,然而这并非用户实际要完成的任务。而网络环境下用户任务是多样化的,难以被分析专家事先全面考虑到。③网站流量统计获得的信息具有数量特征,有利于进一步运用数理统计及数据挖掘方法发现用户行为的规律、模式和趋势。④不干扰用户。其他可用性信息采集方法是用户自主汇报或者由专家观察,专家的个人经验、用户的心理、关键人群的影响都会干扰用户表达自己的真实想法。网站流量统计分析是网站自动记录用户信息,对用户是透明的。
4.2网站流量分析采集的可用性信息
基于网站流量分析的网站可用性研究就是在获得网站访问量基本数据的情况下,对其中影响网站可用性有关的数据进行统计、分析发现用户的行为规律,并用以改进网站可用性的一种分析方法。网站流量分析从用户行为角度来评价网站的利用效率揭示了网站
与网站之间的量化关系、用户使用网站的方式以及用户的环境对分析网站可用性具有重要的意义。从网站流量数据中反映网站可用性的信息主要分为以下几类:
第一类反映网站基本使用信息,如网站的独立用户数量、重复用户数量、 网页浏览数量、每个用户的页面浏览数量、某个具体页面显示次数、文件下载次数、 网站页面数量、 网站内容更新情况等统计指标。
第二类反映网站的排名及口碑信息如搜索引擎收录页面数量、外部链接数量、合作网站数量、媒体报导数量、 Pgean值,A e 排名、主要关键词自然排名等统计指标。
第三类反映网站的互动性信息,如注册用户数、在线反馈数量、在线人数等统计指标。
第四类反映用户使用网站的行为信息如用户在网站停留时间、用户到达网站的入口方式和出口方式、用户所使用的搜索引擎及其关键词、用户在网站内的访问路径、用户出错情况等统计指标。
第五类反映用户的背景信息,如用户上网设备类型、用户浏览器的名称和版本、用户电脑分辨率显示模式、用户所使用的操作系统名称和版本、用户所在的地理区域分布状况等统计指标。
5、基于网站流量统计的网站可用性指标体系
5 1网站可用性一级指标
5 1. 1网站规模反映出网站自身的建设实力。通常用户对规模大、实力强的网站特别青睐,认为该网站能够满足其信息需求愿意成为其忠实用户。
5. 1. 网站质量又可分为内容质量和界面质量两个维度。 网站的生存之道在于内容质量,内容高度重复和雷同乏味是一大隐患,网站之间的竞争迫使其纷纷采取措施 以内容战略为契机提高用户对其网站价值的认同。此外,用户体验与网站界面的交互过程相关,一个友好美观的界面会给用户来带来良好的使用享受,增进人机交互的情感。如果说内容是一个网站的灵魂,那么网站界面则是网站灵魂的外在表现。界面质量也不单纯从美观角度来衡量,它更要考虑用户的使用环境、使用方式以及使用感受等。
5 1 3网站推广反映的是网站被外界的认同程度,从一个侧面表征了网站的可用性。常有的网站推广形式有被著名搜索引擎收录情况以及关键词排名、被其他网站链接情况、在某些网站流量统计和排名网站如ALx)中的排名情况以及PgeRnk值等。
5 .4网站辅助功能指网站为帮助用户与网站进行更高效率的交互而采取的一些努力措施。例如网站的导航功能能减少用户迷航问题,快速找到目标;网站的个性化推荐功能能增进用户对网站的认同感和满意感,网站的帮助功能能及时解答在交互过程中出现的突发问题等。 网站的这些辅助措施越到位,越能提高网站的可用性。
5. 1.5用户情感指用户在与网站交互过程中建立起来的主观感受,如用户对网站的忠诚度、满意度、黏性等都是用户对网站的重要反应。用户来自不同的社会阶层,有着不同的文化和背景,将用户的情感作为评价网站可用性的核心指标并以此来改善网站建设情况提高用户对网站的使用效率是可用性专家主要的研究方向。美国可用性专家oald Norma曾经出版著作《情感化设计》 ,强调如何
将情感效果融入网站设计和评估中13] 。
5. 网站可用性指标体系的操作化定义
用来分析网站可用性的个指标只是较为抽象地反映出网站可用性的不同方面,需要将其转化为可观察的具体指标,这称为指标的操作化定义过程。操作化主要包括变量的定义及测量指标的开发两个方面。对变量进行定义就是对主要变量进行某种澄清和界定,以明确其表达的含义。测量指标是表示某一变量含义的一组可观察和辨认的事物,实际研究工作中,人们正是借助这些可观察和辨认的具体指标,来实现对抽象变量的定量化测量[14] 。本文提出的网站可用性指标的操作化定义如表1所示。
百驰云成立于2017年,是一家新国人IDC商家,且正规持证IDC/ISP/CDN,商家主要提供数据中心基础服务、互联网业务解决方案,及专属服务器租用、云服务器、云虚拟主机、专属服务器托管、带宽租用等产品和服务。百驰云提供源自大陆、香港、韩国和美国等地骨干级机房优质资源,包括BGP国际多线网络,CN2点对点直连带宽以及国际顶尖品牌硬件。专注为个人开发者用户,中小型,大型企业用户提供一站式核心网络云端...
妮妮云的来历妮妮云是 789 陈总 张总 三方共同投资建立的网站 本着“良心 便宜 稳定”的初衷 为小白用户避免被坑妮妮云的市场定位妮妮云主要代理市场稳定速度的云服务器产品,避免新手购买云服务器的时候众多商家不知道如何选择,妮妮云就帮你选择好了产品,无需承担购买风险,不用担心出现被跑路 被诈骗的情况。妮妮云的售后保证妮妮云退款 通过于合作商的友好协商,云服务器提供2天内全额退款,超过2天不退款 物...
Webhosting24宣布自7月1日起开始对日本机房的VPS进行NVMe和流量大升级,几乎是翻倍了硬盘和流量,价格依旧不变。目前来看,日本VPS国内过去走的是NTT直连,服务器托管机房应该是CDN77*(也就是datapacket.com),加上高性能平台(AMD Ryzen 9 3900X+NVMe),还是有相当大的性价比的。此外在6月30日,又新增了洛杉矶机房,CPU为AMD Ryzen 9...