快取排它策略應用於網頁代理伺服器
快取排它策略?用於??代理伺服器
Eviction Policy on Cache for Web Proxy Server
段裘?*?承丞 ?嘉言
Chiu-Ching Tuan* Chan-Chen Huang Chia-Yan Chien
?立?北科技大??子工程系*
??樵 Chen-Chau Yang
?立??科技大??子工程系
摘要
有?於快取空?的排?效?以及各??物件群?的再用程度不一等因素下,本研究提出一「快取排它策略」 ?用於??代理快取伺服器(WebPCS) ,藉以提?快取系?效能。
本研究主要的方法如后, 1)先透?Proxy 2日???分析?本,?分析WebPCS之群?式快取效能。 2)依前???,再?立出「快取排它??」 ?件,用以????物件作?快取?象。本快取效能模?之比??象???LRU vs.排它式LRU。
?由模??果得知,?排它???件??C3、 C4或C5之?,有高於99.5%用?端可?益於WebPCS之命中率上??平均等待??下降之??;但是,最多只?牲27%用?端可能受?於命中高容量物件的??而?致WebPCS之?料量命中率下降。此一研究成果??,?排它策略置於快取替??制之前,可?期改善系?的快取效益。
???:??代理快取伺服器、快取排它策略、快取替??制、存取日??、 LRU替?
法。
投稿受理??:90年10月28日 ?查通???:91年2月5日
ABSTRACT
This paper proposed a novel “cache eviction policy” CEP designedfor web proxy cache server WebPCS to improve the performance on cachingobjects First, we investigated the effects of grouped objects on cacheperformance of WebPCS through the on-line access logs of Proxy2 suppliedby NTUST Then from the data investigated as above, we could set the valuesof threshold with which the evictor could determine whether to evictobjects the server downloadedLast, we have selected two types ofreplacements policy, the conventional LRU LRU and evicted LRU LRU-evict,to be evaluated by the simulation system for comparing their cacheperformance, .
The experimental results shows that more than 99.5%of clients mayobtain more benefits, including the hit ratio rose and the averagelatency time fell, as the threshold conditions of LRU-evict were set tobe C3, C4, or C5On the other hand, at most only 27% of clients may losea chance to hit high-volume objects; therefore, the byte-hit ratio wouldbecome lower These findings confirmed that the overall performance ofcache systemcouldbe promotedby locating the CEP aheadof the replacementmechanism like LRU for intercepting low reusable objects.
Keywords:web proxy cache server, cache eviction policy, cachereplacement policy, access logs, LRU replacement壹、 ??
全球???(World Wide Web, )於1989年由?洲核子研究委??(CERN)的TimBerners-Lee所倡?[5] ,其意?建置一?分散式超媒?系?可?由???路快速存取散?在全球各地的研究?料。 ?后, Marc Andreessen和Eric Bina於1993年在美??家超??算?用中心(NCSA)??出??式超媒?文件的????器NCSA Mosaic[3] ,?此引??入高速成?的新?元。
一、之?展概?
根?我??策?F IND研究?告[17] ,2001年1月全球??的主??已超?一?台(10957?部) ,而台?也突破百?台(109?部)的成?。此外,累?至2001年9月底前,我????路用??已?755??且普及率攀升上34%。其中,台????(TANet)之用??就高?285?且季成?率?持7%。 同年6月,我??外?路??之???已高?4.06 Gbps且成?率?23.6%,而?往美?之??以2.74 Gbps居冠。
??如何,?多的研究??均?示出???路之使用已是一股?不可?的新潮流且?影?人?生活型?甚?,而各?也都??地??因?之道。
?成功地加速了???路的使用?潮,然而相?於使用人口的快速激增,?行???路基?建?的速度??落后於??的需求。在?路??不足之??下更加?化?路的服?品?,分析其原因有如下??:
1.???容逐?地使用高容量的多媒?物件;
2.??伺服器端引用自?的??推播(push)?制;
3.??的商?系?大幅地整合?且改以??平台提供全球性?子商?作跨?服?;
4.???路服?供?商(ISP)群起?逐市?更加吸?大量新?的?路使用人口。
相?於???路服?品?的低弱,?了改善?路品?也有??相?的研究??,例如:
1.?路基?建?:建置???路?研?更高速的?路??技?,例如??????(Cable Modem)和非同步?位用???(ADSL) 。
2.?路?定:改良?有的通??定或者??更具效率的新?路?定。
3.?料??技?:????效率更佳的???比更大的??技?,以促使??后的高容量多媒?物件於?路???,可大幅地降??路??的使用。
4.??快取(cache)技?:??快取?制是利用?料?份的概念??到加速物件存取??省?路??的目的。
上述研究??中,以??快取在不????路基?建?之下,就可以立即得到成效?且?易地?用在?有的??代理快取伺服器(Web Proxy Cache Server, WebPCS)之中。因此目前的????大都透?快取系??加快存取速度??少??端伺服器作重?的物件要求,以期使有限的?路??作更有效的?用。
二、本研究的主要目的?作法
有?於WebPCS之快取效能??行之服?品?具有??性的影?,所以本研究?先以??物件之「?料量」大小?分群?;再佐以群?物件?估因子作快取分析,以期研判出影?快取效能的??要素,藉以??出各不同群?物件所呈?出的再用性[10, 11] 。
依?上述??物件群?再用性之分析事?,再制定一新式的「快取排它策略」(Cache Eviction Policy)用以改善WebPCS?行快取的效能。
本研究主要的方法?步?概述如下:
1.先以Squid Proxy System[12]??例,??述??式快取系?之?作模式。
2.以群?物件方式?分析WebPCS之快取效能,包括「群??存取比」、 「群??命中比」、 「群???料量命中比」 ? 「群?平均使用?」等四?。
●分析?本?台?科大Proxy2日??。
3.依前???分析,?立出群?物件影?快取效能的??,??以研?快取排它策略、效能?量因子?效能比??象(如下) 。
●??LRU vs.排它式LRU(LRU-evict) 。
4.?作一?窗式效能模?系?,用以???探?此快取排它策略的??效?。
三、本文之章?架?
本文之章??序如后,第????Squid??式??快取系?;第??以Proxy2 日??分析WebPCS之快取效能;第肆?探究快取排它策略?系?效能分析;最后一?,第伍?作扼要??。
?、 Squid??式??快取系?
本??明TANet校??路架??例???式WebPCS之?作方式。
一、 TANet校??路?例架?
?一所示?TANet校??路?例架?,其?外之?路??方面,台?科大校???以一?T345Mbps?接至TANet,而TANet再??
?一TANet校?WebPCS之??架??:以台?科大Proxy2?例
?STM-1155.5×2 Mbps跨接至美?[18] 。
於台?科大???,?有?部快取容量各?20.6 GB之本地WebPCS,分?是??快取??外?域物件的//0>. . tw(Proxy)?快取????域物件的proxy2.//. (Proxy2) [16] 。至於Proxy2於Squid系???中所?定的?同式WebPCS包括如下:
●兄弟?同WebPCS:
兄弟?同WebPCS?//. . tw?//. . tw,其?作模式是以「快取摘?」 (caching digest)方式???所?存取的??物件存在?否[12] 。
●父?同WebPCS:
以//.?proxy1.//.??父?同WebPCS,?者?是以「?替式」 (round robin)的?作模式作??取父?同的??。
二、 ??式快取系?之?作
WebPCS之使用??可以有效地提?????的服?品?,其??可加快??下?的速度;?外可?少?相同的物件作重?性要求,藉以舒??端伺服器的工作?荷。此外,尚可降低?外?路??的使用,以提高???作效能??足?域?用?端群的需求。
?行所用的快取系?可分?用?端之??器快取??域?路中心之WebPCS等??,而WebPCS之系??品中?著名的有Aratech-2000 、Compaq-b17、Dell-100、 IBM-330、Lucent-100z、 Microbits-P、 Microsoft-2、 NetApp-C6100、 Squid-2.4.D4以及Swell-1450等[6, 19-28] 。
快取系?架?可?照?一之?例,?WebPCS接收到由?域?用?端所?出的???求?,WebPCS?先?查????料是否存在於本地伺服端的快取硬碟中。
?由??物件搜?之后,若是快取命中(cache hit) ,?直接地取用本地?料??回?用?端。反之,若?快取?失(cache miss) ,?WebPCS?向上??同快取之WebPCS或者向?域外之?端??伺服器代????求??候?料回?。
稍后,?WebPCS收到回?的??物件,除了?它再回??用?端之外;同?,?之??副本存入本地的快取硬碟中,以等待?后若再度被取用?能直接命中而快速的回??用?端。
至於?? 「快取替?」 (replacement)策略的研究,目前大致可???三?:
1.沿用??式策略,例如LRU、 LFU?FIFO等。
2.依多??特徵次序作比?,例如LOG2-Size和HYPER-G[13]等。
3. 制定?算公式作??量基?, 例如 LRFU[4] 、 LUV[11] 、LNC-R-W3[7,8]?Grey-based[9]等。
惟?行的WebPCS系?,例如Squid所用之替?策略仍以??式LRU?主,原因在於LRU演算程序???易且快速,但是其快取效能通常?不彰?。
再者,WebPCS所快取的各???物件,其?料量大小的相差?距甚大(由?MB至?KB) ;且各??物件原始?址(URL)所在的伺服器端也散?全球,故??物件下?所需要的等待??就存在更大的差距。?常使得不耐久候的用?端??常中??求服?,而更加?化?路的壅塞?浪??路??的使用。
因此,一效率佳的??快取技?可??地?少??物件在?路上的重???,?且可加速用?端存取???料。所以,有?於高效能??快取或?取技?的研?,目前而言仍然?具有高度的研??值。
?、 WebPCS之快取效能分析
由於WebPCS所快取的物件?型繁多,?且???多的用?端群所??的??意向也不相同,故WebPCS很?以?知其用?端群於后?中?存取??之??;也不易去?估一???物件??保留於快取中的使用?值。
因此,本?先以Proxy2日??作案例分析,?以物件群?型式?探究WebPCS的快取效能,以利於研判影?快取效能的??要素。同?,藉以研制一新式的快取排它?制。
一、 Proxy2快取效能之概?分析
本分析系??定台?科大Proxy2日??作?分析?本,而Proxy2所快取之物件?源以台??域(. tw)?主;而用?端群以台?科大校??路(140. 118.*.*)?限[10] 。
此外,Proxy2 日??於Zipf-like分析中[9] ,已??其??存取模式?Ω/i?分?[14] 。其中,α0.8?Cao分析?、美、澳等地?日??之Zipf-like分?的α值??
相近[2] ,??事??立了Proxy2日???之?料???的客?性。
由日???本所得的分析???示(?如表一) ,三天量的??物件存取??高?294.8??;?下?的???料量??29.4 GB;而其中?於cgi?型物件(即副??名?.cgi /.asp者)的存取????全?的6.9%。
此外,??量WebPCS之??快取效能,?定?快取命中率?快取?料量命中率byte等???估因子作?分析要?,?限定分析?象以非cgi物件存取?主。
[定?一]快取命中率, :
●?一物件命中?: ;
●?命中物件?: ;
?存取物件次?: 。
表一台?科大Proxy2??存取日??之概?分析
Access Logs of NTUST Proxy2 ServerSquid 2.3 / stable 3
Date HrsHttp Requests Size GB KB/Req. Sec./Req.byte Cgi %
June 6, 2001
June 7, 2001
June 8, 2001 24
24
24 1,301,420
1,341,590
1,304,945 8.97
10. 19
10.20 7.23
7.96
8.20 1.44
1.27
1.33 0.558
0.568
0.565 0.390
0.363
0.383 7.30
6.62
6.69
Total 72 3,947,775 29.36 Avg.7.80 Avg. 1.35 Avg.0.564
Avg.0.379 Avg.6.87
1
[定?二]快取?料量命中率, :
●?一物件?料量: ;
●?命中物件之?料量: ;
●?存取物件之?料量: 。
2
?由初步的概?分析后,得知如后?果:
1.快取命中率之三日均值??56%。
2.快取?料量命中率byte之三日平均值??38%。?然地,byte???低,此意?著由用?端所命中的非cgi物件以中、小型容量居多。
麻花云怎么样?麻花云公司成立于2007年,当前主打产品为安徽移动BGP线路,数据中心连入移动骨干网。提供5M,10M大带宽云主机,香港云服务器产品,数据中心为香港将军澳机房,香港宽频机房 cn2-GIA优质线路、采用HYPER-V,KVM虚拟技术架构一、麻花云官网点击直达麻花云官方网站合肥网联网络科技有限公司优惠码: 专属优惠码:F1B07B 享受85折优惠。最新活动 :双11 云上嗨购 香港云主...
阿里云国际版注册认证教程-免绑卡-免实名买服务器安全、便宜、可靠、良心,支持人民币充值,提供代理折扣简介SunthyCloud成立于2015年,是阿里云国际版正规战略级渠道商,也是阿里云国际版最大的分销商,专业为全球企业客户提供阿里云国际版开户注册、认证、充值等服务,通过SunthyCloud开通阿里云国际版只需要一个邮箱,不需要PayPal信用卡就可以帮你开通、充值、新购、续费阿里云国际版,服务...
云基成立于2020年,目前主要提供高防海内外独立服务器用户,欢迎各类追求稳定和高防优质线路的用户。业务可选:洛杉矶CN2-GIA+高防(默认500G高防)、洛杉矶CN2-GIA(默认带50Gbps防御)、香港CN2-GIA高防(双向CN2GIA专线,突发带宽支持,15G-20G DDoS防御,无视CC)、国内高防服务器(广州移动、北京多线、石家庄BGP、保定联通、扬州BGP、厦门BGP、厦门电信、...