微博平台首席架构师杨卫华演讲新浪科技讯
11月16日下午消息 由新浪微博(http://t.sina.com.cn)主办的中国首届微博开发者大会在北京举行这是国内微博行业的首场技术盛宴。作为国内微博市场的绝对领军者新浪微博将在此次大会上公布一系列针对开发者的扶持政策以期与第三方开发者联手推动微博行业的整体发展。
视频 中国首届微博开发者大会杨卫华演讲媒体来源新浪科技
以下为演讲实录
大家下午好在座的大部分都是技术开发者技术开发者往往对微博这个产品非常关心。最晚的一次是12点多收到一个邮件说想了解一下微博底层是怎么构架的。很多技术人员对微博的构架非常感兴趣就是一个明星他有300万粉丝这个技术怎么来实现今天在这里跟大家分享一下微博的底层机构让大家对微博的底层技术有更好的了解。另外不管是做客户端、Web
1.0、Web2.0、论坛、博客都要考虑架构的问题架构实际上是有一些共性的。今天我通过讲解微博里面的一些架构分析一下架构里面哪些共性大家可以参考。
首先给大家介绍一下微博架构发展的历程。新浪微博在短短一年时间内从零发展到五千万用户我们的基层架构也发展了3个大的版本。第一版就LAM P架构优点是可以非常快的实现我们的系统。我们看一下技术特点微博这个产品从架构上来分析它需要解决的是发表和订阅的问题。我们第一版采用的是推消息模式假如说我们一个明星用户他有10万个粉丝那就是说用户发表一条微博的时候我们把这个微博消息存成10万份这样就是很简单了第一版的架构实际上就是这两行字。第一版的技术细节典型的LAMP架构是使用MyISAM搜索引擎它的优点就是速度非常快。另外一个是MPSS就是多个端口可以布置在同一服务器上。为什么使用MPSS假如说我们做一个互联网应用这个应用里面有三个单元我们可以由2种部署方式。我们可以把三个单元分别部署在三台服务器上另外一种部署模式就是这三个单元部署在每个服务器上都有。我推荐第2种方法。这个方法解决了两个问题一个是负载均衡因为每一个单元都有多个节点处理另外一个是可以防止单点故障。如果我们按照模式1来做的话任何一个节点有故障就会影响我们系统服务如果模式二的话任何一个结点发生故障我们的整体都不会受到影响的。
我们微博第一版上线之后用户非常喜欢这个产品用户数增长非常迅速。我们技术上碰到几个问题。第一个问题是发表会出现延迟现象尤其是明星用户他的粉丝多系统需要处理很长时间。另外系统在处理明星用户发表时系统繁忙可能会影响到其他的用户因为其他的用户同一时间发表的话也会受到这个系统的影响。我们就考虑这个系统怎么改进。首先是推模式这肯定是延迟的首要原因我们要把这个问题解决掉。其次我们的用户越来越多这个数据库表从一百万到一亿数据规模不一样处理方式是有差别的。我们第一版单库单表的模式当用户数量增多的时候它不能满足就需要进行拆分。第二个是锁表的问题我们考虑的是更改引擎。另外一个是发表过慢我们考虑的是异步模式。
第二版我们进行了模块化我们首先做了一个分层最底层叫基础层首先对数据做了拆分图上最右边是发表做了异步模式。第二个服务层我们把微博基础的单元设计成服务层一个一个模块最大改进是对推模式进行了改进。首先看一下投递模式的优化首先我们
要思考推模式如果我们做一下改进把用户分成有效和无效的用户。我们一个用户比如说有一百个粉丝我发一条微博的时候不需要推给一百个粉丝 因为可能有50个粉丝不会马上来看这样同步推送给他们相当于做无用功。我们把用户分成有效和无效之后我们把他们做一下区分比如说当天登陆过的人我们分成有效用户的话只需要发送给当天登陆过的粉丝这样压力马上就减轻了另外投递的延迟也减小了。
我们再看数据的拆分数据拆分有很多方式很多互联网产品最常用的方法比如说如可以按照用户的UID来拆分。但是微博用户的一个特点就是说大家访问的都是最近的数据所以我们考虑微博的数据我们按照时间拆分比如说一个月放一张表这样就解决了我们不同时间的维度可以有不同的拆分方式。第二个考虑就是要把内容和索引分开存放。假如说一条微博发表的uid,
微博id是索引数据 140个字的内容是内容数据。假如我们分开的话 内容就简单的变成了一种key-value的方式 key-value是最容易扩展的一种数据。索引数据的拆分具有挑战 比如说一个用户发表了一千条微博这一千条微博我们接口前端要分页访问比如说用户需要访问第五页那我们需要迅速定位到这个记录。假如说我们把这个索引拆分成一个月一张表我们记录上很难判断第五页在哪张表里我们需要加载所有的索引表。如果这个地方不能拆分那我们系统上就会有一个非常大的瓶颈。最后我们想了一个方法就是索引上做了一个二次索引把每个月记录的偏移记下来就是一个月这个用户发表了多少条 ID是哪里就是按照这些数据迅速把记录找出来。
异步处理发表是一个非常繁重的操作它要入库、统计索引、进入后台如果我们要把所有的索引都做完用户需要前端等待很长的时间如果有一个环节失败的话用户得到的提示是发表失败但是入库已经成功这样会带来数据不一致问题。所以我们做了一个异步操作就是发表成功我们就提示成功然后在后台慢慢的消息队列慢慢的做完。另外新浪发表了一个很重要的产品叫做MemcacheQ我们去年做了一个对大规模部署非常有利的指令就是st a t squeue适合大规模运维。
第二版我们做了这些改进之后微博的用户和访问量并没有停止还有很多新的问题出现。比如说系统问题单点故障导致的雪崩第二个是访问速度问题因为国内网络环境复杂会有用户反映说在不同地区访问图片、js这些速度会有问题。另外一个是数据压力以及峰值MySql复制延迟、慢查询另外就是热门事件 比如说世界杯可能会导致用户每秒发表的内容达到几千条。我们考虑如何改进首先系统方面允许任意模块失败。另外静态内容第一步我们用CDN来加速另外数据的压力以及峰值我们需要将数据、功能、部署尽可能的拆分然后提前进行容量规划。
另一方面我们还有平台化的需求去年11月我们就说要做开放平台开放平台的需求是有差异的Web系统它有用户行为才有请求但是API系统特别是客户端的应用只要用户一开机就会有请求直到他关闭电脑这种请求一直会不间断的过来另外用户行为很难预测。
系统规模在持续的增大另外也有平台化的需求我们新架构应该怎么做才能满足这些需要我们看一下同行 比如说Google怎么样考虑这个问题的 Google首席科学家讲过一句话就是一个大的复杂的系统应该要分解成很多小的服务。 比如说我们在Google.com执行一个搜索查询的话实际上这个操作会调动内部一百多个服务。因此我们第三版的考虑就是先有服务才有接口最后才有应用我们才能把这个系统做大。
现在我们看一下第三版首先我们把底层的东西分成基础服务基础服务里面有分布式的存储我们做了一些去中心化、 自动化的操作。在基础服务之上有平台服务我们把微博常用的应用做成各种小的服务。然后我们还有应用服务这个是专门考虑平台各种应用的需求。最上面我们有
API API就是新浪微博各种第三方应用都在上面跑。
平台服务和应用服务是分开的这样实现了模块隔离 即使应用服务访问量过大的话平台服务不会首先影响。另外我们把微博的引擎进行了改进实现了一个分层关系。用户的关注关系我们改成一个多惟度的索引结构性能极大的提高。第四个层面就是计数器的改进新版我们改成了基于偏移的思路就是一个用户他原来读的一个ID比如说是10000系统最系的ID是10002的话我们很清楚他有两条未读。原来的版本是采用绝对计数的这个用户有几条未读都是用一个存储结构的话就容易产生一致性的问题采用这种偏移的技术基本上不会出错。
另外基础服务DB冷热分离多维度拆分在微博里面我们是按照时间拆分的但是一个大型的系统里面有很多业务需要有不同的考虑。比如说私信这个就不能按照时间来拆分这个按照UID来拆分可能更简单。然后我们突出存储还做了一个去中心化就是用户上传图片的速度会极大的提高另外察看其他用户的图片速度也会极大的提高。另外是动态内容支持多IDC同时更新这个是在国内比较新颖的。
下面给大家介绍一下新浪微博怎么样打造一个高性能架构。到目前为止有五千万用户使用新浪微博最高发表3000条以上每秒然后一个明星用户发表的话会被几百万用户同时读到。这些问题的本质是我们架构需要考虑高访问量、海量数据的情况下三个问题。易于扩展、低延迟、高可用和异地分布。我们每天有数十亿次外部网页以及API接口的需求我们知道微博的特点是用户请求是无法cache的。因此面对这个需求我们怎么样扩展几点思路。第一我们的模块设计上要去状态我们任意一个单元可以支持任意节点。另外是去中心化避免单点及瓶颈。另外是可线性扩展。最后一个是减少模块。
我们要做一个高性能的系统要具备一个低延迟、高实时性微博要做到高实时性这是核心的价值实时性的核心就是让数据离CPU最近避免磁盘的
IO。我们看淘宝核心系统专家余锋说过的一句话“CPU访问L1就像从书桌拿一本书L2是从书架拿一本书 L3是从客厅桌子上拿一本书访问主存就像骑车去社区图书馆拿一书”。我们微博如果要做到非常实时的话我们就需要把数据尽量离CPU节点最近。所以我们看一下cache设计里面怎么达到这个目标。首先INBOX这个数据我们需要放再一个最快
的地方因为用户随时访问。OutBOX里面的最近发表就是L1cache还有一个是中期的这个因为访问少一点它可以被踢。最后一部分内容体有三部分。 L0是本地的我们需要把一些经常访问的比如说明星发表微博的内容体本地化因为它被访问的概率非常大。然后L1里面存放着最近发表的还有一个是中期的。我们通常用L2就可以了 L1我们可以理解成它就是一个RAM存储。
一个好的架构还需要举行高可用性。我们看一下业界的指标S3是99.9%EC2是99.5%我们另外一个同行Facebook在这方面它是没有承诺的就是接口可用写。微博平台目前承诺的是99.95%就是说一天365天故障率应该小于9小时。这个怎么达到第一我们要做容量规划要做好监控以及入口的管理就是说有些服务如果访问量过了的话我们要有一个开关可以拦住他。我们通过这个图表可以清楚的看到 比如说我们要做L1的cache我们剩余空间有多少比如说80%就说明这个数据有可能会丢失有可能会对我们的系统造成影响。
另外一个层面就是接口监控我们目前有Google维度的接口监控包括访问错误失败率。然后要做架构给大家一个很重要的经验分享就是说监控的指标尽量量化。比如说他延迟30秒是小问题如果是延迟10分钟我们就要立即采取措施了就是所有可以量化的指标都要量化。
然后我们看监控怎么样更好的做我们看亚马逊的VP说过的一句话就是说监控系统确实特别好可以立即告诉我们哪里有故障但是有20%的概率我们人是会出错的。所以我们一个大型系统就应该要为自动化设计就是说尽可能的将一些运作自动化。比如说发布安装、服务、启用、停止。我们再看另外一句 Google的工程师是怎么做的。他是这么做的比如说第一周是处理线上的业务这一周他处理了很多事情处理了很多系统的情况剩下几周时间没有别的工作他只要把这一周碰到的情况用程序的方法来解决下次再碰到这种情况很简单的一个按钮就可以处理了。我们目前也在向自动化这方面努力就是我们的工具在持续增加。
另外一个异地分布在国内网络环境下 比如说IDC灾难机房检修甚至是机房掉电我们也碰到过中国最好的机房也会掉电所以要每个服务单元都能支持多机房部署。另外做多机房部署有一个好处就是用户的访问速度会提高。多IDC分布静态内容就不说了基本上大的互联网公司都会做它非常成熟基本上没有什么问题 比如说图片等等的静态内容。动态内容的CDN分布是业内的难点 国内很少有公司能够做到非常成熟的多机房动态内容发布的成熟方案它的核心就是分布式存储。一款理想的分布式存储产品它有哪些需求呢首先它要支持海量规模、可扩展、高性能、低延迟、高可用。第二个是需要多机房分布能够满足国内负责的网络环境还要具备异地容灾能力。第三个就是要调用简单具备丰富数据库特性。因此分布式存储需要解决一个多对多的数据复制。
如果要做复制无非是三种策略第一个是Master/Slave但是它也两个缺点第一个是M a ste r是中心化的如果Ma ste r在北京那广州访问就非常慢。第二个缺点是有单点风险的比如说Master在北京能立即迁到广州吗这样有个时间窗口的数据就丢失了而且需要人工的干预而且日常广州的用户访问北京的Master是有很大延迟问题的所以一般来说要做的非常优秀是不会考虑第一种方案的。第二种就是Multi-Master方案它需要应用避免冲突就是我们不能多处改变。这个对于微博来说不会特别难我们的用户通常只会再一个
地方发表微博用户不会同时在广州又在北京发表或者是修改自己的资料这样的话我们应用上就已经避免了这种情况。第三个就是Paxos就是可以达到强一致写就是一条数据如果成功肯定是多个机房都成功了这个也显而易见就是延迟性非常大。 因此总结一下Multi-Master是最成熟的策略但是它现在没有成熟的产品 因为确实没有。
我们再来看微博的方案所以我们自己实现了一个多机房同步的方案。就是我们前端应用将数据写到数据库再通过一个消息代理相当于通过我们自己开发的一个技术将数据广播到多个机房。这个不但可以做到两个机房而且可以做到三个、四个。具体的方式就是通过消息广播
方式将数据多点分布就是说我们的数据提交给一个代理这个代理帮我们把这些数据同步到多个机房那我们应用不需要关心这个数据是怎么样同步过去的。
用这种消息代理方式有什么好处呢可以看一下Yahoo是怎么来做的第一个是数据提供之后没有写到db之后是不会消失的我只要把数据提交成功就可以了不需要关心数据怎么到达机房。第二个特点YMB是一款消息代理的产品但是它唯一神奇的地方是为广域网设计的它可以把多机房应用归到内部我们应用不需要关注这个问题。这个原理跟我们目前自己开发的技术相似。
然后我们再看一下目前即将推出的微博平台的新架构。我们知道API大部分的请求都为了获取最新的数据。 API请求有一个特点它大目前调用都是空返回的 比如说一款手机的客户端每隔一分钟它都要调用服务器一下就是有没有新数据大目前的调用都是空返回就是说不管服务器有没有数据都要调用一次。这次询问到下一次询问中间如果有新的数据来了你是不会马上知道的。因此我们想API能不能改用推的方式就是客户端不需要持续的调用如果有新数据就会推过去。技术特点显而易见低延迟就是从发表到接受1秒内完成实际上可能用不了1秒。然后服务端的连接就是高并发长连接服务就是多点都连接在我们的服务器上这个比传统的API要大很多。
我们看一下推送架构怎么从架构底层做到实时性的。从左上角的一条微博在我们系统发布之后我们把它放在一个消息队列里面然后会有一个消息队列的处理程序把它拿过来处理以后放到db里面。假如说我们不做持久化 因为我们推送数据也不能丢失我们就要写一个很复杂的程序将数据异步去存这样就会非常复杂而且系统也会有不稳定的因素。从另外一个角度来说我们做持久化也是做过测试的。我们推送整个流程可以做到100毫秒和200毫秒之间就是说我们在这个时间能把数据推送出去。
我们再看一下内部细节就是我们收到数据之后首先要经过最上面RECEIVER。然后推到我们的引擎里面这个引擎会做两个事情首先会把用户的关系拿过来然后按照用户关系马上推送给他相应的粉丝。所以我们调用方已经在那儿等待了我们需要有一个唤醒操作就是说在接口这儿把它唤醒然后把它发送过去。最后是一个高并发的长连服务器就是一台服务器支持10万以上的并发连接。最右边中间有一个圆圈叫做Strea m
Buffer我们需要Strea m
Buffer是要保存用户最近的数据。因为用户可能会有断线的 比如说他发送数据的时候
断线半分钟我们需要把这半分钟补给他。这就是我们的推送架构。
下面介绍一下平台安全部分。由于我们的接口是完全开放的所以我们要防范很多恶意行为有很多人担心我们接口是开放的是不是有人通过这个接口发垃圾广告或者是刷粉丝我们技术架构怎么来防范这一点呢这是我们的安全架构做了三个层面的事情。最上面是我们有一个实时处理比如说根据频度、内容的相似性来进行判断判断发的是不是广告或者是垃圾内容。中间这个是一个日志处理器我们会根据一些行为进行判断比如说如果我们只是实时拦截的话有些行为很难防止我们做了个离线纠正的模块比如说他潜伏的几个月开始发广告了我们可以事后把这些人清除掉以保证我们平台的健康。最后是通过监控的维度来保证内容的安全。 目前内容安全的架构大概是541的体系就是说我们的实时拦截可以做到50%的防止离线分析大概可以做到40%的防止。
微博平台需要为用户提供安全及良好的体验应用 以及为开发者营造一个公平的环境所以我们的接口需要清晰安全的规则。从一个APP调用我们的接口需要几个阶层需要划分不同的业务模块。第二个是安全层。第三个是权限层。这是我们平台安全的两个维度一个接口安全一个是内容安全。
我今天讲的是架构方面的问题在座大部分是开发者可能大家都在处理不同的架构问题架构很多地方是相通的。我们需要做一个软件系统需要解决的本质问题是什么微博第一版解决发布规模问题第二版是解决数据规模的问题第三版是解决服务化的问题。将复杂的问题简单化之后我们才可以设计出一个容易扩展的大规模架构。我今天介绍就这么多我们微博实际上是很需要各方面的技术人员大家对我们的架构如果感兴趣的话、对我们的系统感兴趣的话也希望各方面的技术人员参与我们微博的团队随时可以给我微博上发私信。
亲爱的朋友上文已完 为感谢你的阅读特加送另一篇范文如果下文你不需要可以下载后编辑删除谢谢
道路施工方案
1、 工程概况
2、 编制说明及编制依据
3、 主要施工方法及技术措施
3 1施工程序
3 2施工准备
3 3定位放线
3. 4土方开挖
3 5卵石路基施工
3 6天然砾基层施工
3. 7高强聚酯土工格楞
3 8水泥稳定砂砾基层施工
3 9路缘石施工
3. 10玻璃纤维土工格栅施工
3 11沥青面层施工
3. 12降水施工
4、 质量控制措施
5、 雨季施工安排
6、 安全技术措施
1.工程概况
本项目建设的厂址位于新疆石河子市。工程场地位于石河子高新技术开发区经七路西。场地原为麦田地势南高北低。厂区道路连通各装置区域并与经七路相连。
2.编制说明及编制依据
为保质按时顺利完成厂区道路根据工程施工招标文件、设计施工图 以及现场实际场地并结合我公司多年来的现场施工经验编制此方案。
规范及标准
《沥青路面施工技术质量规范》 JTG F40-2004
《工程测量规范》 GB50026-2007
《建筑施工安全检查标准》 JGJ59-1999
3.主要施工方法及技术措施
3.1施工程序
降水——施工测量——土方开挖——路基卵石整平——机械压
实——天然砂砾基层——机械压实——高强聚酸土工格楞——浆砌
卵石立缘石基础——水泥砂浆勾鏠——天然砂砾基层——机械压实
——安装路缘石——水泥稳定砂砾底基层——玻璃纤维土工格楞
——粗粒式沥青混凝土面层——中粒式沥青混凝土面层
3.2施工准备
熟悉图纸及规范做好技术交底工作。按图纸范围确定施工范围标出外框范围线清出障碍物。联系施工需用材料、机械的进场工作。根据业主提供的平面控制坐标点与水准控制点进行引测。根据施工图规定的道路工程坐标点进行测量放样的业内复合计算。
3.3定位放线
根据现场实际情况在道路两侧沿线间隔50m左右布置测量控制桩轴线定位坐标桩与高程测量控制桩合用。控制点沿道路中心线两侧交错间隔布置形成多个控制体系同时控制桩做醒目标志 以防在施工过程中被碰动。土方施工后测量人员应及时重新放线路基处理后应在路基上测定路面中心线、边界线以及标高控制点。
其基本步骤为校验路基轴线控制桩合格后根据轴线控制桩详细放出路边线以及设置标高控制桩。
放线自检和业主监理验收后方可使用。验线允许偏差根据规范规定。
3.4土方开挖
施工方法在施工测量放线确定基础位置经检查复核无误后作为施工控制的依据并经过监理确认后 即可进行基础土石方的开挖。
主要施工机具挖掘机、装载机、尖、平头铁锹等。
3.4. 1作业条件
土方开挖前应摸清地下管线等障碍物 以及地下水位等情况并应将施工区域内的地下障碍物清除和处理完毕。
道路的定位控制线桩标准水平桩及基槽的灰线尺寸必须经过共同检验合格并办完预检手续。考虑在机械无法作业的部位和修整边坡坡度采用人工进行施工。熟悉图纸做好技术交底。索取地勘资料及气象资料。
bgp.to对日本机房、新加坡机房的独立服务器在搞特价促销,日本独立服务器低至6.5折优惠,新加坡独立服务器低至7.5折优惠,所有优惠都是循环的,终身不涨价。服务器不限制流量,支持升级带宽,免费支持Linux和Windows server中文版(还包括Windows 10). 特色:自动部署,无需人工干预,用户可以在后台自己重装系统、重启、关机等操作!官方网站:https://www.bgp.to...
已经有一段时间没有分享阿里云服务商的促销活动,主要原因在于他们以前的促销都仅限新用户,而且我们大部分人都已经有过账户基本上促销活动和我们无缘。即便老用户可选新产品购买,也是比较配置较高的,所以就懒得分享。这不看到有阿里云金秋活动,有不错的促销活动可以允许产品新购。即便我们是老用户,但是比如你没有购买过他们轻量服务器,也是可以享受优惠活动的。这次轻量服务器在金秋活动中力度折扣比较大,2G5M配置年付...
racknerd当前对美国犹他州数据中心的大硬盘服务器(存储服务器)进行低价促销,价格跌破眼镜啊。提供AMD和Intel两个选择,默认32G内存,120G SSD系统盘,12个16T HDD做数据盘,接入1Gbps带宽,每个月默认给100T流量,5个IPv4... 官方网站:https://www.racknerd.com 加密数字货币、信用卡、PayPal、支付宝、银联(卡),可以付款! ...