推土机解读amd“推土机”架构 比拟intel的酷睿技巧[基础]

推土机amd  时间:2021-03-09  阅读:()

解读AMD“推土机”架对比intel的酷睿技术10月22日AMD创新技术大会在京召开AMD向业界展示了在CPU和GP U设计方面的创新成果和技术趋势。虽然AMD全球首发的Radeon HD6800系列显卡以及“融聚CP U和GP U”的AP U设计足够夺人眼球不过令笔者更加关注的还是AMD的下一代处理器架构“Bulldo zer” “推土机” 毕竟 自1999年K7架构问世以来这将是AMD最为不同的一代处理器架构。

或许应该用“革命”这样的形容词 因为“推土机”将是一个全新的处理器架构基于“推土机”架构的处理器将和K7之后的所有AMD处理器都不尽相同。

AMD全球服务器首席技术官Don Newell先生介绍Bulldozer架构

对此 AMD也有自己的官方理由 “推土机”采用的是介于传统的“多核”和同步多线程s imultaneous mult ithreading简称SMT之间的第三种方式。我们知道之前的AMD皓龙处理器采用的是“芯片多处理器” chip multiprocessing,即CMP设计每个独立的核心运行一个线程比如AMD双核、四核皓龙采用的就是CMP设计而S MT技术是允许两个或更多的线程共享相同的核心并发执行比如像英特尔的Hyper-Thre ading。

首先有必要来回顾一下CMP和S MT的优劣势

SMT和CMP方式对比

C MP CMP的方式非常直接简单来说 CMP是通过“复制”物理核心来扩展处理器在多线程软件中的性能这是获得最佳性能一种最简单和最有效的方式。但CMP的缺点是制造成本很昂贵并且也要受到处理器制造工艺的限制毕竟不能将芯片做的越来越大。并且C MP的方式对负载要求也很高只有经过适当并行优化的负载才能充分发挥C MP的性能很多核心的C MP常常会浪费资源在一些应用中主频更高、结构更简单的双核和四核处理器就往往可以获得更好的性能。

S MT S MT是一个相对廉价的技术 比如英特尔的Hyp er-T hreading允许每个物理核心运行两个同步线程。 S MT的设计思想是充分利用每个核心的资源。如果一个物理核心只有一个执行线程那么在等待内存中的关键代码或数据的时候线程处于停顿状态这样核心的利用率是低下的。而S MT技术允许一个物理核心运行两个或更多的线程可以根据当前的状况动态进行切换如果一个线程处于停顿状态等待内存另一个线程的指令则可以使用这个物理核心的所有执行单元让物理核心利用的更加充分。

为了让SMT正常工作处理器的所有代码和存储部分需要被复制或分区。例如一个双线程S MT处理器需要两套架构寄存器和重命名寄存器一套给线程A一套给线程B。另外组成指令窗口的共享指令队列要具备很大的空间这样指令窗口才能容纳足够多的来自两个线程的指令让执行单元可以保持在忙碌状态。最后两个线程任何共享单元比如处理管线不同部分的指令缓存都不能被任一个线程独占。换句话说 S MT核心的两个线程需要和另一个紧密的共享资源保证核心的缓存单元不会空置没有线程利用。

S MT技术对那些不需要核心线程thr eads全负荷运行的多线程负载比较有意义对于一个双线程S MT设计来说如果这两个线程都需要花费很长时间等待主内存那么这个双线程S MT会表现的就一个CMP双核处理器甚至更加高效——因为它比CMP双核成本要低得多。在这种理想的状况下一个双线程S MT核心几乎可以等同于一个双核处理器并且能耗上还要低的多。

但S MT的效率根据负载不同会有很大差异 AMD认为在真实的应用情况中一个双线程S MT核心仅仅等同于1.3个常规核心的效能 因为很多时候线程都在执行资源而不是等待主内存响应换句话说如果主内存不再是瓶颈 S MT的执行单元就过剩了而一个S MT核心也就不再比一个单纯的核心更高效毕竟S MT核心需要增加一些电路设计 比一个单纯的核心成本要高一些。

解读“推土机”架构

AMD“推土机”将采用32nm SOI工艺这让“推土机”相比“马尼库尔”皓龙处理器可以在不增加功耗的前提下增加33%的核心数量、增加50%的吞吐量。与AMD之前所有处理器都有所不同的是 “推土机”采用了“模块化”的设计每个“模块”包含两个处理器核心这有些像一个启用了S MT的单核处理器。每个核心具有各自的整数调度器和四个专有的管线两个核心共享一个浮点调度器和两个128位FMAC乘法累加器。

所不同的在K 10架构中 AL U和AGU共享三个管线平均1.5个  “推土机”中每个核心整数单元管线的数量增加为4个 2个AGU专有、 2个ALU专有。 L 1缓存也有所不同在K10架构中每个核心具有64KB L1指令缓存和64KB L1数据缓存而“推土机”每个核心具有16KBL1数据缓存、每个模块具有64KB双向L1指令缓存至于减小的L1缓存是否会影响性能还有待观察。两个核心共享L2缓存模块之间共享L 3缓存及北桥。

AMD“推土机”模块

“模块”和“核心”这让我们不免会产生混淆实际对于用户们来说没必要去刻意的关注“模块”的概念这只不过是AMD在设计上的称谓而当产品投放市场的时候依旧会以核心数量为标识 比如我们说采用推土机架构的“Interlago s”服务器处理器具有16个核心而不会说是8个模块。对于为何采用这种“模块”设计的主要原因AMD表示是“为了减少CP U的冗余电路”。

如果采用CMP的方式随着核心数量的增加 CPU的核心面积也会越来越大重复的电路也会越来越多功耗也会随之增加——因为CMP是采用复制核心的方式。而采用“模块”设计可以大大减少冗余电路这对核心的大量增加很有意义。 比如“推土机”两个核心共享浮点部分对于大部分服务器应用来说整数运算的部分要远远高于浮点运算高性能计算除外 所以将浮点执行单元共享并不会影响大多数应用中的性能。而整数部分则不是共享的否则会造成瓶颈。

上文我们回顾过CMP和S MT设计的特点我们可以把AMD“推土机”架构看做是介于这两种之间的一种设计两个线程核心共享浮点执行单元但是各自具有独立的整数执行资源。这看上去像是S MT的另一种形式或者说是经过AMD改良的一种“AMD式的第三种方式”。但与传统的S MT设计不同 S MT仅仅复制的是核心的存储部分一个线程一个存储模块register file 而AMD“推土机”架构中每个线程复制的是完整的整数执行单元硬件一个线程具有一个存储模块register file和一组完整的整数执行单元。

AMD“推土机”核心架构的一些特性

每个线程具有独立的整数执行单元是AMD“推土机”和双线程S MT设计的主要区别。不过从“推土机”的设计来看这并不像真正意义上的“C MP双核”毕竟两个核心还要共享浮点执行单元或者可以称之为“1.5核”。这样设计的好处就是能够大大节省晶体管的数量、降低核心面积和功耗同时降低成本。即使不是真正的“双核”但不难想象这样的设计要比S MT更加高效相比之下传统的S MT设计可以称之为是一种“1.2核”的设计。

AMD表示平均计算下一个单独的“推土机”核心执行两个线程可以达到1.8核CMP的效率但是这样的数字也是要依赖于负载情况。虽然“推土机”的模块设计要比传统的S MT设计在执行效率上更高但是增加的整数执行单元也提高了成本和能耗。另外没有意外的话 AMD“推土机”应该具备很好的浮点计算性能。 AMD表示虽然F P U是被两个线程共享

的一个部分如果给予足够的内存带宽芯片将具有很高的浮点运算能力。

革命还是渐进

采用了全新的“模块”设计 “推土机”堪称AMD处理器发展史上一个里程碑式的设计。但是仔细来看 “推土机”的设计并不能算是一种颠覆性的设计可以说是一种渐进式的设计方案。在处理器设计领域渐进式的设计思路要比革命式的更稳妥一些激进的设计往往达不到好的预期如奔腾四、 IBM Cell等更加保守、渐进的方式往往可以赢到最后。

AMD“推土机”和“山猫”架构

不过AMD“推土机”增加一组四个独立的整数单元的方式也可算是一中幅度较大的渐进式方法这带来了很多的改变当然还需要很多因素的协调才能充分发挥“推土机”的真正价值如缓存大小、缓存关联性、缓存延迟、指令缓冲区大小、分区策略、解码带宽等等。当然这些都是一个新处理器诞生时候所不得不面对的问题随着设计的不断成熟这些因素也会不断的调整至最佳状态。采用“推土机”架构的“Interlago s” 16核心皓龙处理器将在2011年面世虽然具体时间AMD并没有透露不过作为AMD近年来最为重头的产品 “推土机”不会让我们等得太久。

日本vps云服务器选择指南。

日本vps云服务器怎么选择?很多人都会遇到日本vps和日本云服务器怎么选择的问题,日本云服务器具有免备案的特点。小编今天就分析一下日本云服务器价格多少钱,以方便大家选购的时候有个更加合适的取舍。日本云服务器租用前比较选择,高性能、安全、高效、免备案日本云服务器是很关键的因素。那么,日本云服务器该怎么选择呢?日本作为我们的邻国,与其贸易、文化往来是比较多的。日本云服务器价格多少钱一年?一、日本·CN...

天上云月付572元,起香港三网CN2直连,独立服务器88折优惠,香港沙田机房

天上云怎么样?天上云隶属于成都天上云网络科技有限公司,是一家提供云服务器及物理服务器的国人商家,目前商家针对香港物理机在做优惠促销,香港沙田机房采用三网直连,其中电信走CN2,带宽为50Mbps,不限制流量,商家提供IPMI,可以自行管理,随意安装系统,目前E3-1225/16G的套餐低至572元每月,有做大规模业务的朋友可以看看。点击进入:天上云官方网站天上云香港物理机服务器套餐:香港沙田数据中...

Hostodo:4款便宜美国vps七折优惠低至$13/年;NVMe阵列1Gbps带宽,免费DirectAdmin授权

hostodo怎么样?快到了7月4日美国独立日,hostodo现在推出了VPS大促销活动,提供4款Hostodo美国独立日活动便宜VPS,相当于7折,低至$13/年,续费同价。Hostodo美国独立日活动结束时间不定,活动机售完即止。Hostodo商家支持加密数字货币、信用卡、PayPal、支付宝、银联等付款。Hostodo美国独立日活动VPS基于KVM虚拟,NVMe阵列,1Gbps带宽,自带一个...

推土机amd为你推荐
网红名字被抢注想用的微博名被人抢注了 而且是个死号 没发博没粉丝 该怎么办同ip网站查询服务器禁PING 是不是就可以解决同IP网站查询问题杰景新特谁给我一个李尔王中的葛罗斯特这个人物的分析?急 ....先谢谢了xyq.163.cbg.com梦幻西游里,CBG是什么?在那里,能帮忙详细说一下吗www.haole012.com012qq.com真的假的336.com求那个网站 你懂得 1552517773@qq梦遗姐我姐姐很漂亮,她24了,我才15,晚上我和他睡在一起,我经常挨遗精,咋办?hao.rising.cn瑞星强制篡改主页 HTTP://HAO.RISING.CN 各位有什么办法可以解决吗?网页源代码网页的HTML代码莱姿蔓圣诗蔓有祛痘功效吗
中国万网虚拟主机 泛域名解析 西安服务器 2019年感恩节 5折 highfrequency 息壤主机 56折 卡巴斯基永久免费版 anylink hostker xshell5注册码 windowsserver2012r2 .htaccess phpwind论坛 cloudflare ddos防火墙 冰盾ddos防火墙 kosskeb79 长沙服务器托管 更多