推土机[优质文档]可否推倒i7?amd推土机cpu架构全解析

推土机cpu  时间:2021-03-09  阅读:()

能否推倒i7AMD推土机CPU架构全解析APU性能喜忧参半推土机能否推倒i7

泡泡网CPU频道7月21日 AMD终于发布了让人期待已久的Llano高性能APU 加速处理器  APU的真正实力毫无保留的展现在了世人面前详细的评测参见《AMD桌面级APU发布 Llano A8深度评测》一文。

简单来说 APU的表现可谓是喜忧参半喜的是GPU部分确实强大绝对可以秒杀主流级独立显卡性能是Intel SandyBridge集显HD3000的2-3倍甚至更多忧的是CPU部分原地踏步与Intel CPU的差距越来越大。

APU的CPU部分使用的还是Phenom II架构而且还是没有三级缓存的精简版。PhenomII的架构相比Phenom I改进不大还停留在Intel Core 2 Quad的级别。而Intel此后已经推出了两代Core i7产品性能节节攀升 AMD想要与SandyBridge架构的第二代Core i7抗衡使用老架构简单扩充核心是毫无胜算的。

AMD下一代CPU架构——Bulldozer 推土机就肩负起了对抗SandyBridge Core i7的重任。现在距离推土机发布已经不远了相信更多的DIY玩家都在期待AMD全新CPU架构的表现那么首先我们就来详细了解一下推土机架构到底有什么值得期待之处吧。

Intel的杀手锏——HT同步多线程技术

我们知道在Core 2时代 AMD和Intel的CPU性能差距还不算太大。但Core i7问世之后性能有了质的提升其中贡献最大的非HT Hyper-Threading超线程技术莫属。HT技术可以轻易地把4核虚拟成8线程在任务管理器中看到的“8个核心”不仅仅是看着爽而已它确实带来了不小的性能增益进一步与AMD CPU拉开了差距。

●SMT同步多线程技术的工作原理

SMT Simultaneous Multi-threading 同步多线程的设计初衷非常简单就是为了充分利用CPU物理核心的资源防止运算能力被浪费。

左没有超线程时的CPU处理过程 右超线程模式CPU处理过程

一般情况下 CPU的物理核心只有一个执行线程很多时候CPU核心会处在等待内存中关键代码或数据的状态此时线程为暂停状态核心运算能力被闲置。而SMT技术可以允许一颗核心运行两个或多个线程当第一个线程暂停时将第二个资源准备充分的线程安排给核心处理这样动态切换的结果就是 CPU的运算能力得到了最大的利用。

简言之 SMT的设计理念就是用多个线程“喂饱” CPU物理核心尽可能不让CPU运算单元闲置。

SMT是一种非常廉价的技术因为CPU的物理内核并没有增加只需要为CPU赋予两套架构寄存器和重命名寄存器即可而这些寄存器并不会消耗太多的晶体管。最终在操作系统

中的呈现方式和物理核心没有区别操作系统会把4核8线程的CPU当作8核CPU来使用并安排运算任务。

四核八线程CPU在系统中就是“八核”的

SMT技术对那些CPU负载不是很高且支持多路并发处理的线程比较有意义典型的比如文件压缩解压缩、视频编码解码等。如果两个线程都需要花费较长的时间等待内存和缓存准备数据的话那么一个双线程SMT核心几乎就可以等同于一个双核处理器。

但SMT的效率根据应用的不同会有很大差异如果内存和缓存的压力不大 CPU核心一直都在忙于处理线程的话另一个线程迟迟排不上队此时SMT核心的效率可能还不如单颗物理核心。这就是此前测试时关闭HT技术反而在部分项目中性能更好的根本原因

根据Intel公布的数据来看在真实的应用环境下超线程技术能够给CPU带来20-30%额外的性能提升也就是说一颗双线程SMT核心相当于1.2个常规核心的效能。

AMD又一次创新——反其道而行之

通过前面的介绍我们可以知道 Intel的同步多线程技术实际上并不能提升CPU的理论运算性能只是消除了CPU等待指令时的瓶颈在部分应用中提升了效能。这样HT技术就存在很大的局限性如果主内存不再是瓶颈 SMT的执行单元就过剩了而一个SMT核心也

就不再比一个单纯的核心更高效毕竟SMT核心需要增加一些电路设计比一个单纯的核心成本要高一些。

所以AMD并没有照搬Intel的做法走SMT路线也不是继续暴力增加CPU的物理核心数目 CPU的未来并不是只有这两条路可走于是AMD有了一个新的想法 Intel是把一颗物理核心虚拟成两颗来用而AMD是把两颗物理核心组合成一颗大核心来用——这颗大核心的官方名称叫做“推土机模块” 。

为什么要把两颗核心合成一颗来用呢有两个好处一是可以共享运算单元和缓存提升效能二是共享之后会节约晶体管重复单元合二为一 而不是像SMT那样增加晶体管两份寄存器 。

AMD认为随着CPU的物理内核数目越来越多4/6/8核甚至更多  CPU的核心面积也会越来越大功耗成倍增加。传统CMP暴力复制核心的方式会造成大量重复性的电路。而减少冗余电路的最好方法就是整合把两颗核心整合在一起共用一套指令发射器和解码器还有缓存。

相信细心的读者已经发现了 AMD并不是简单的把两颗核心放在了一起而是有所精简——两颗核心的整数运算单元都被完整的保留了下来而浮点运算单元只留了一份这又是为什么呢

数据显示存在于服务器和超级计算机上80%的操作都是纯粹的整数运算 CPU的浮点运算器利用率很低所以AMD在开发新一代CPU架构时强化了整数运算而忽视浮点运算。

另一方面随着CPU和GPU异构计算应用越来越多 GPU将会越来越多的负担起浮点运算的操作预计未来3-5年的时间内据大多数浮点运算都将会交给最擅长做浮点运算的GPU这也就是推土机加强整数运算而精简浮点运算的真正目的虽然推土机CPU并未整合GPU因为它定位高端不论企业还是玩家都需要最强的CPU和GPU 但下一代APU Trinity将会使用推土机的CPU核心加HD69004D架构的GPU核心推土机架构依然在为Fusion APU而准备着可以说AMD继64b i t、整合内存控制器、 HT总线、三个层级缓存之后又一次采用创新的设计理念引领业界走在了巨头Intel前面

推土机模块化设计的四大优势

其实在上一页介绍推土机架构的设计理念时已经将其优势体现了出来下面就再强调一下。

第一 AMD虽然将两颗物理内核设计成为一个推土机模块但每个模块依然是真双核设计操作系统深信不疑

第二模块化设计节约了大量重复性晶体管 8核心的推土机CPU在晶体管数、核心面积、功耗发热方面也不会很大 因为它比传统意义上的8核心处理器“瘦身”不少

第三一个推土机模块内部的两颗物理内核共享二级缓存四个推土机模块共8颗物理内核共享三级缓存缓存利用率大大提升

一级数据缓存有8份一级指令缓存和二级缓存都只有4份三级缓存为1份

第四 CPU的单核效能不仅不会下降而且还可以共享推土模块内部相邻核心的运算资源。 Intel处理器开启超线程在部分应用中性能不升反降的情况在推土机上是不会出现的。

当然推土机架构的缺点也是很明显的它虽然拥有8颗物理核心但浮点运算能力只相当于是传统4核心的水平。

理论上 Intel的HT超线程技术能够一定程度上提升多任务性能每颗物理核心相当于是1.2核的性能而AMD的每个推土机模块则可以达到1.8核的性能。

推土机模块相对于羿龙II的改进

AMD推土机架构的设计理念不难理解但更多人担心的是其核心执行效率毕竟这些年来AMD在效能方面改进缓慢。如果CPU内核效率不行的话整体架构再怎么优秀也不会有很好的综合表现。现在我们就来看看推土机内核相对于羿龙有何改进

根据AMD官方发布的Bul ldozer架构资料推土机模块的指令解码宽度将从K7/K8/K10的每时钟周期三条微指令提升为四条。

推土机的前端指令解码和分派模块

这里我们把一个推土机的模块看作是一颗核心的话里面有两个独立的整数核心每一个都拥有自己的指令、数据缓存。虽然两个整数运算核心要比K10的三个少但实际上其中任何一个核心的运算能力都要强于Phenom II。

Intel的Core架构无论整数或者浮点都采用了统一的Scheduler 调度派发指令。推土机构架使用独立的整数和浮点派发器而且整数派发器有两个对应推土机模块里面的两颗核心。

推土机模块和K10微架构对比图

推土机模块的两个核心支持执行两个线程会共享对延迟要求较高的功能、平缓突发和低效应用、线程间动态分配资源好处是比两个线程共享一个核心更高的伸缩性和可预测性、多线程负载的吞吐优势、单线程时所有共享资源均可访问、以少得多的面积和功耗提供物理核心80的性能。

推土机模块的浮点运算单元是两个128位的FMAC 乘加运算器 这两个运算器可以被两个整数核心共享如果其中一个整数核心获得的线程支持纯粹的整数操作那么另外一个核心就可以获得全部的浮点执行资源。

这样设计的结果就是推土机的单核效能将会比Phenom II强不少而多核效能部分整数运算能力很强而浮点运算能力也不会太弱。

推土机的初步性能小胜i7-2600K

虽然距离推土机正式发布还有一段时间但国外网站已经放出了很多工程样品的测试成绩其中最为可信的当属donanimhaber网站给出的测试报告我们可以拿它与Intel的当红明星Core i7 2600K做一个简单对比。

Pacificrack:新增三款超级秒杀套餐/洛杉矶QN机房/1Gbps月流量1TB/年付仅7美刀

PacificRack最近促销上瘾了,活动频繁,接二连三的追加便宜VPS秒杀,PacificRack在 7月中下旬已经推出了五款秒杀VPS套餐,现在商家又新增了三款更便宜的特价套餐,年付低至7.2美元,这已经是本月第三波促销,带宽都是1Gbps。PacificRack 7月秒杀VPS整个系列都是PR-M,也就是魔方的后台管理。2G内存起步的支持Windows 7、10、Server 2003\20...

tmhhost:全场VPS低至6.4折,香港BGP200M日本软银美国cn2 gia 200G高防美国三网cn2 gia韩国CN2

tmhhost放出了2021年的端午佳节+618年中大促的优惠活动:日本软银、洛杉矶200G高防cn2 gia、洛杉矶三网cn2 gia、香港200M直连BGP、韩国cn2,全都是高端优化线路,所有这些VPS直接8折,部分已经做了季付8折然后再在此基础上继续8折(也就是6.4折)。 官方网站:https://www.tmhhost.com 香港BGP线路VPS ,200M带宽 200M带...

物语云-VPS-美国洛杉矶VPS无限流量云windows大带宽100M不限流量 26/月起

物语云计算怎么样?物语云计算(MonogatariCloud)是一家成立于2016年的老牌国人商家,主营国内游戏高防独服业务,拥有多家机房资源,产品质量过硬,颇有一定口碑。本次带来的是特惠活动为美国洛杉矶Cera机房的不限流量大带宽VPS,去程直连回程4837,支持免费安装Windows系统。值得注意的是,物语云采用的虚拟化技术为Hyper-v,因此并不会超售超开。一、物语云官网点击此处进入物语云...

推土机cpu为你推荐
李子柒年入1.6亿将55g铁片放入硫酸铜溶液中片刻,取出洗净,干燥后,称重为56.6g,问生成铜多少g??求解题步骤及答案www.yahoo.com.hk香港有什么网页haole018.com为啥进WWWhaole001)COM怎么提示域名出错?囡道是haole001换地了吗www.228gg.comwww.a8tb.com这个网站该如何改善www.7788dy.comwww.tom365.com这个免费的电影网站有毒吗?www.javmoo.comjavimdb是什么网站为什么打不开www.kaspersky.com.cn现在网上又有病毒了?m88.comwww.m88.com现在的官方网址是哪个啊 ?www.m88.com怎么样?yinrentangWeichentang正品怎么样,谁知道?www.ca800.comPLC好学吗
重庆域名注册 备案未注册域名 vps安全设置 如何注册中文域名 smartvps 罗马假日广场 php主机 一元域名 申请个人网页 丹弗 免费个人空间 789电视 东莞数据中心 天翼云盘 香港新世界中心 如何注册阿里云邮箱 vul 新加坡空间 网页加速 卡巴斯基官网下载 更多