指令小型机

小型机  时间:2021-03-27  阅读:()

计算机体系结构学科发展简介石教英浙江大学计算机学院计算机系统研究所2002年11月目录一、计算机体系结构学科发展回顾1.
计算机性能高速发展及其原因2.
计算机的分类3.
计算机设计的任务4.
技术发展趋向二、指令级并行性开发技术1.
RISC与CISC2.
流水线技术3.
指令级并行性技术三、指令多发射技术1.
指令多发射技术概述2.
超标量处理器3.
超长指令字处理器4.
多发射处理器的技术难点四、Cache技术1.
为什么要引入Cache2.
为什么引入Cache能提高计算机性能3.
Cache技术的发展五、多处理器技术1.
并行计算机体系结构分类2.
集中共享存储器型多处理计算机3.
分布式存储器型多处理器计算机4.
并行处理的难点六、我国计算机体系结构研究进展一、计算机体系结构学科发展回顾ComputerArchitecture定义应用机器语言的程序员为了能正确编写时序无关的程序所必须了解的计算机的结构.
简单讲:计算机体系结构是一门设计计算机的学科,包括计算机的指令系统设计,结构设计,实现技术,以及与系统软件操作系统和编译器相关的技术.

1、计算机性能高速发展及其原因1946年第一台通用电子计算机ENIAS诞生至今仅56年——每秒5000次运算加法计算机技术以惊人速度发展,并将继续高速发展1980年百万美元机器的性能比不上今年小型机被采用微处理器的服务器所代替大型机被采用数十个至上百个微处理器构成的多处理器计算机所代替超级计算机正在被成千上万个微处理器构成的多处理器计算机所代替体系结构发展的核心-定量方法近年来计算机体系结构发展的核心,也是计算机创新设计技术的核心归功于——定量方法.
用定量方法进行计算机设计用定量方法作为工具分析程序实际运行结果、各类实验和仿真用定量方法寻找计算机体系结构的新思路、新技术,保证计算机性能继续按现在速率提高2、计算机的分类传统的计算机分类:大型机、小型机、巨型机(成熟超级计算机)按机器规模指令(字长,内外存储器容量,速度等指标),价格等指标进行分类(PC)机、工作站,服务器1980年代产生了新的机型:个人(PC)机、工作站、服务器主要按用途来分类1990年代产生了嵌入式系统:高性能家电、机顶盒、电子游戏机、手机、网络路由器、交换机等这里微处理器成为设备的一个组件,如马达所起的作用,主要不是作计算用计算机的新分类台式机服务器嵌入式计算机它们分别面向不同应用,具有不同要求,采用不同技术台式机、服务器、嵌入式系统特征对比3、计算机设计的任务计算机设计目标:应满足市场对功能的要求,同时也应满足成本,功耗和性能的目标计算机设计任务指令集设计——这是传统计算机体系结构的任务,即程序员面对的(看得见的)指令系统的设计计算机组织设计——存储器设计,CPU设计,I/O总线结构设计等高层内容,同一个指令集可以对应不同组织设计硬件设计——芯片的逻辑设计、封装、冷却.

相同的指令集和组织可以对应不同的硬件实现形成一个产品系列,如PentiumⅡ和Celeron,使Celeron适用于低端产品计算机体系结构学科应包含上述三方面的内容Fig1.
4,p10计算机设计技术人员的任务明确具体的功能要求,因为来自市场的功能要求往往是不明确的明确最主要的任务是什么,最主要的功能往往是使用最频繁的部件,做好了最主要部件的设计对提高性能影响最大.
优化设计——根据不同准则来选择最优的设计方案,例如前面介绍过对于个人机、服务器和嵌入式计算机的不同优化目标4、技术发展趋向由于计算机技术发展十分快速,一个成功的指令集设计不应该因为技术发展而遭淘汰计算机体系结构设计师应预见到技术发展的趋向,在设计下一代产品时,预见到产品大规模进入市场时恰好是所用的下一代技术的性价比达到最佳的时候,从而使其设计的产品生命周期得以延长影响最大的四种关键技术集成电路技术半导体DRAM磁盘技术网络技术集成电路技术晶体管密度每年增加35%,即每4年增加4倍集成电路芯片的尺寸每年提高10%-20%综合上述两个参数,芯片的晶体管数每年提高55%半导体DRAM(动态随机存取存储器)芯片密度每年递增40%-60%,即每3-4年增加4倍存取周期缩短相对较慢,每10年缩短1/3DRAM接口改进提高了存取带宽磁盘技术近年来磁盘的存储密度以每年100%速度递增,并将继续一段时间(1990年以前每年以30%速度递增)磁盘的存取周期缩短相对较慢,每10年缩短1/3网络技术网络性能与交换机和发射端的性能有关衡量网络的指标有:延迟时间和带宽等,带宽是主要指标近年来带宽提高速度较快如以太网从10Mbps提高到100Mbps花了10年时间,而从100Mbps提高到1Gbps只用了5年二、指令级并行性技术(InstructionLevelParallelism-ILP)指令级并行性技术是RISC(精减指令集计算机)(——ReducedInstructionsetComputer)的主要贡献1、RISC与CISCCISC即复杂指令集计算机(——ComplexInstructionsetComputer)RISC思想在1980年代初提出1980年代末大规模投入实际使用1980年代中期以前的微处理器可统称为CISC体系结构微处理器RISC与CISC的最主要的区别平均执行每条指令的时钟周期数CPI(CyclesperInstruction)的不同RISC的CPI≤1CISC的CPI<1CPI的作用:CPI数越小,CPU速度越快CPI数越大,CPU速度越慢CPU性能公式CPUfime=IC*CPI*CCCPUfime——执行一般代码所需的中央处理站(CPU)时间IC——代码的指令条数(InstructionComt),与指令集设计编译器的优化有关CPI——平均执行每条指令的时钟周期数,与指令集设计、体系结构等技术有关CC——时钟周期(ClockCyde)与计算机组成,IC工艺等技术有关缩短CPI成为缩短CPUtime的主要技术途径RISC体系结构追求精减的指令集数据类型、寻址主式精减,指令长度统一,格式统一,提高流水线的效率,实现了每一时钟周期能执行一条指令(CPI=1)RISC体系结构进一步提出指令多发射技术即每一时钟周期可发射多条指令,执行多条指令,进一步实现CPI<1CISC计算机速度提高较慢的原因传统CISC体系结构计算机的CPI≌5-8原因:以DEC公司的VAX机器为例,指令系统复杂,指令集有304条指令,指令长度:1Byte~64Byte,操作数不足:0-6个,操作数达十几种,寻址方式达几十种;采用微程序控制——导致流水线结构复杂,效率低下,速度提高有困难目前几乎所有微处理器,包括传统著名的CISC微处理器,如Intel系列和Motorola系列微处理器都采用RISC体系结构2.
流水线技术这是理想流水线的性能:达到每一个时钟周期可以完成一条指令与指令串行执行相比较,速度提高5倍简介:流水线是一种多条指令重叠执行的实现技术流水线的竞争实际流水线不可能像上述理想流水线那样完美存在三种流水线竞争结构竞争:由硬件资源不足造成流水线停顿数据竞争:由前后指令之间存在数据相关性造成流水线停顿控制竞争:由转移指令造成流水线停顿实际流水线的性能实际流水线的CPI=理想流水线的CPI+结构竞争造成的停顿周期+数据竞争造成的停顿周期+控制竞争造成的停顿周期要提高CPU的性能就是要消除或减少三种竞争造成的停顿周期流水线竞争的解决结构竞争可以通过增加硬件资源来解决数据竞争和控制竞争只有通过挖掘代码指令之间的平行性,即通过开发和发现指令之间存在的可并行(重叠)执行的可能性,然后对指令执行顺序进行调度,即用不相关的指令来填补本来应该停顿周期的方法,达到消除或减少停顿周期,提高指令执行速度3.
指令级并行性(ILP)开发技术ILP开发技术分两大类:基于硬件的ILP开发技术,又称动态开发ILP技术基于软件的ILP开发技术,又称静态开发ILP技术用于解决数据竞争的ILP开发技术静态调度技术动态调度技术采用改名技术的动态调度技术编译分析数据相关性软件流水线路经调度用于解决控制相关性的ILP开发技术静态转移预测技术动态转移预测技术静脉投机技术动态投机技术循环体展开技术延时转移技术三、指令多发射技术1.
指令多发射技术概述从CPUtime=IC*CPI*CC公式出发,进一步提高CPU性能的途径是令CPI<1要达到CPI<1的目的,必须做到每个时钟周期发射多条指令,有多个处理部件和足够的硬件资源来并行处理多条指令,达到平均每条指令的处理时间小于1个时钟周期指令多发射处理器有两类:超标量处理器(Superscalarprecessors)超长指令字处理器(VLIW-veryhonginstructionword)根据指令发射机制,即调度、组织可同时发射指令的机制,也可分为两类:动态多发射机制,即由硬件在程序执行过程中调度静态多发射机制,即由编译器在程序编译过程中调度2.
超标量处理器超标量处理器流水线操作超标量处理器的特点在一个周期里能发射可变数量的指令,通常为1-8条指令/周期同时发射的指令按规定搭配,不能自由搭配,即有限制:如同时发射的指令必须是独立的,即无数据竞争,以及满足访存次数规定等等.
采用静态调度(compiler完成)和/或动态调度(硬件完成)方法确定可同时发射的指令3.
超长指令字处理器(VLIW)VLIW处理器特点一次发射一条超长指令,其中包含多个操作,而不像超标量处理器那样一次发射多条指令在超长指令当中多个操作按规定搭配顺序排列,即指令类型不能任意搭配,操作顺序不能任意颠倒VLIW究竟有多长以一个拥有多个功能单元的VLIW处理器为例:设7个功能单元可支持:2个整数操作、2个FP操作、2个存储器访问操作和1个转移操作,这样这条含7个操作的VLIW的功能相当于7条指令,为支持每一功能单元正常工作,应分配每一功能单元相应的数据域;一般每个数据域为16~24位这一VLIW长度为:16bits*7=112bits或为:24bits*7=168bits比较:一个拥有7个功能单元的超标量处理器,一次发射7条指令,总长度为32bits*7=224bits超长指令字的组装由编译器完成,即由编译器作静态调度,选择无相关性指令按搭配顺序填入超长指令字为充分发挥VLIW处理器功能单元的作用,必须要有足够多的可并行执行指令提供给VLIW,编译器必须采用功能更强的全局调度技术4.
多发射处理器的技术难点程序固有指令级并行性有限是多发射处理器的本质困难,需要的可并行执行的指令数大致等于功能单元数乘以流水线级数.
多发射处理器硬件数量多、速度快,且复杂性高,从而成本高.
超标量处理器的特殊困难发射逻辑复杂且高速动态调度硬件极其复杂超长指令字处理器的特殊困难对编译器的要求高VLIW系列机二进制代码兼容困难四、Cache技术Cache—一种小容量的高速缓冲存储器Cache在计算机中的位置1、为什么要引入Cache首先看一下CPU芯片速度与内存储器DRAM芯片速度的差别有多大CPU与DRAM速度差意味着什么说明单纯地改善CPU的设计,一味追求提高CPU的速度,并不能提高计算机整机的性能,因为高速CPU的性能被低速的存储器访问所抵销.
为了提高计算机整机性能,必须消除两者性能差,或者仅可能缩小两者性能差.

解决办法在高速CPU与低速Memory之间引入一个小容量的高速缓冲存储器(Cache),Cache速度与CPU速度之差(不足1个数量级)远远小于CPU与DRAM速度差(3个数量级~4个数量级),通过将存储器分级的方法来缓解这一巨大的速度差,提高计算机的性能.

2、为什么引入Cache能提高计算机性能问:既然用作Cache的SRAM芯片的速度远远高于用作主存储器的DRAM芯片,那么为什么主存储器不用SRAM芯片来实现答案:SRAM的价格远高于DRAM,而且主存储器的容量大,采用高速SRAM使成本急剧上升,因此从性能/价格综合考虑只能采用小容量的Cache.
问:小容量的Cache能否满足程序存取指令和数据的需求答案:计算机设计定量原理中有一条局部性原理告诉我们:程序总是倾向于重用那些刚刚用过的数据和指令,这是计算机程序非常重要的性质.
局部性原理的另一种表述:程序90%的执行时间是花在10%的代码上.
局部性原理告诉我们:可以根据程序最近访问的数据和指令来预测程序将要调用的数据和指令,且这一预测正确度是比较高的.
所以小容量的Cache能满足程序存取数据和指令的需求3.
Cache技术的发展采用多级Cache1980年代的微处理器大多没有片上Cache,只有片外Cache2001年的微处理器大多都有2级片上Cache,再加上一级片外Cache增加Cache容量1980年代的片外Cache通常只有几十KB2001年的微处理器三级Cache的容量可达16MB采用各种优化技术来提高Cache性能,包括减少失配造成的代价减少失配率减少命中时间五、多处理器技术单处理器计算机性能是否已接近其极限然而从1985起到2000,这一段正是单处理器计算机性能突飞猛进的时代单处理器计算机至少在未来5年仍将以目前速度发展多处理器计算机将越来越重要的理由微处理器已主宰单处理器计算机技术,因此为了提高单处理器计算机性能而将多个微处理器连接起来就成为很自然的选择现在还不清楚使计算机体系结构不断创新的指令级并行技术能否继续无限地发展下去曾经是并行机发展障碍的软件有了新的发展和进展,主要是在服务器和嵌入式系统方面为多处理器计算机发展带来曙光1.
并行计算机体系结构分类Flynn在1966年提出的计算机分类方法,即按指令流和数据流进行计算机分类的方法仍适用至今单指令流,单数据流(SISD)—单处理器计算机单指令流,多数据流(SIMD)—矢量计算机多指令流,单数据流(MISD)—市场上无此类计算机多指令流,多数据流(MIMD)—通用多处理器并行计算机,是广泛应用的多处理器并行计算机体系结构MIMD多处理器计算机分类可按处理器数目,存储器组织以及互连网络的策略来分类按存储器组织进行分类的两种多处理器计算机:集中共享存储器体系结构分布式存储器体系结构2.
集中共享存储器型多处理器计算机基本结构此类计算机适用于处理器数目相对较少的场合,对于只有几个、十几个处理器,有可能共享一个主存储器,以及采用总线实现处理器和主存的互连对于含有二、三十个处理器的机器需用多总线,甚至用交换器才能满足存储器带宽的要求集中共享存储器型多处理器计算机只有一个主存储器,对所有处理器都是对称的,访问存储器的时间都是均等的,所以这种体系结构又称为对称(共享存储器)处理器(SMP)集中共享存储器型多处理器是目前最成功的多处理器计算机3.
分布式存储器型多处理器计算机基本结构此类计算机适用于处理器相对较多的场合,可以是上百个、上千个、甚至数千个之多.
此类计算机要求互连网络的带宽较高,通常采用交换机或多维网格实现处理器之间的直接互连.
分布式存储器型体系结构的最大缺点是处理器之间的数据通信变得非常复杂(一致性问题),并且延时较长.

HostYun 新上美国CN2 GIA VPS 月15元

HostYun 商家以前是玩具主机商,这两年好像发展还挺迅速的,有点在要做点事情的味道。在前面也有多次介绍到HostYun商家新增的多款机房方案,价格相对还是比较便宜的。到目前为止,我们可以看到商家提供的VPS主机包括KVM和XEN架构,数据中心可选日本、韩国、香港和美国的多个地区机房,电信双程CN2 GIA线路,香港和日本机房,均为国内直连线路。近期,HostYun上线低价版美国CN2 GIA ...

LightNode($7.71/月)香港cn2精品线路

LightNode官网LightNode是一家位于香港的VPS服务商.提供基于KVM虚拟化技术的VPS.在提供全球常见节点的同时,还具备东南亚地区、中国香港等边缘节点.满足开发者建站,游戏应用,外贸电商等应用场景的需求。为用户带来高性能服务器以及优质的服务的同时还提供丰厚的促销活动,新用户注册最高送$20。注册用户带新客即可得10%返佣。商家支持PayPal,支付宝等支付方式。官网:https:/...

易探云(QQ音乐绿钻)北京/深圳云服务器8核8G10M带宽低至1332.07元/年起

易探云怎么样?易探云香港云服务器比较有优势,他家香港BGP+CN2口碑不错,速度也很稳定。尤其是今年他们动作很大,推出的香港云服务器有4个可用区价格低至18元起,试用过一个月的用户基本会续费,如果年付的话还可以享受8.5折或秒杀价格。今天,云服务器网(yuntue.com)小编推荐一下易探云国内云服务器优惠活动,北京和深圳这二个机房的云服务器2核2G5M带宽低至330.66元/年,还有高配云服务器...

小型机为你推荐
云计算什么是云计算?22zizi.com河南福利彩票22选52010175开奖结果lunwenjiancepaperfree论文检测安全吗月神谭求几个个性网名:789se.comwuwu8.com这个站长是谁?4400av.com在www.dadady.com 达达电影看片子很快的啊javbibinobibi的中文意思是?lcoc.top服装英语中double topstitches什么意思www.1diaocha.com请问网络上可以做兼职赚钱吗?现在骗子比较多,不敢盲目相信。请大家推荐下hao.rising.cn我一打开网页就是瑞星安全网站导航,怎么修改?
vps优惠码cnyvps 个人域名备案 美国主机评测 shopex空间 php探针 150邮箱 免费防火墙 免费申请网站 支持外链的相册 银盘服务是什么 银盘服务 google台湾 photobucket cdn网站加速 国外免费云空间 杭州电信宽带 japanese50m咸熟 htaccess forwarder 远程登录 更多