推土机能否推倒i7?amd推土机cpu架构全解析

推土机cpu  时间:2021-03-09  阅读:()

能否推倒i7AM D推土机C P U架构全解析APU性能喜忧参半推土机能否推倒i7

泡泡网CPU频道7月21日 AMD终于发布了让人期待已久的Llano高性能APU 加速处理器  APU的真正实力毫无保留的展现在了世人面前详细的评测参见《AMD桌面级APU发布 Llano A8深度评测》一文。

简单来说 APU的表现可谓是喜忧参半喜的是GPU部分确实强大绝对可以秒杀主流级独立显卡性能是Intel SandyBridge集显HD3000的2-3倍甚至更多忧的是CPU部分原地踏步与Intel CPU的差距越来越大。

APU的CPU部分使用的还是Phenom II架构而且还是没有三级缓存的精简版。PhenomII的架构相比Phenom I改进不大还停留在Intel Core 2 Quad的级别。而Intel此后已经推出了两代Core i7产品性能节节攀升 AMD想要与SandyBridge架构的第二代Core i7抗衡使用老架构简单扩充核心是毫无胜算的。

AMD下一代CPU架构——Bulldozer 推土机就肩负起了对抗SandyBridge Core i7的重任。现在距离推土机发布已经不远了相信更多的DIY玩家都在期待AMD全新CPU架构的表现那么首先我们就来详细了解一下推土机架构到底有什么值得期待之处吧。Intel的杀手锏——HT同步多线程技术

我们知道在Core 2时代 AMD和Intel的CPU性能差距还不算太大。但Core i7问世之后性能有了质的提升其中贡献最大的非HT Hyper-Threading超线程技术莫属。HT技术可以轻易地把4核虚拟成8线程在任务管理器中看到的“8个核心”不仅仅是看着爽而已它确实带来了不小的性能增益进一步与AMD CPU拉开了差距。

●SMT同步多线程技术的工作原理

SMT Simultaneous Multi-threading 同步多线程的设计初衷非常简单就是为了充分利用CPU物理核心的资源防止运算能力被浪费。

左没有超线程时的CPU处理过程 右超线程模式CPU处理过程

一般情况下 CPU的物理核心只有一个执行线程很多时候CPU核心会处在等待内存中关键代码或数据的状态此时线程为暂停状态核心运算能力被闲置。而SMT技术可以允许一颗核心运行两个或多个线程当第一个线程暂停时将第二个资源准备充分的线程安排给核心处理这样动态切换的结果就是 CPU的运算能力得到了最大的利用。

简言之 SMT的设计理念就是用多个线程“喂饱” CPU物理核心尽可能不让CPU运算单元闲置。

SMT是一种非常廉价的技术因为CPU的物理内核并没有增加只需要为CPU赋予两套架构寄存器和重命名寄存器即可而这些寄存器并不会消耗太多的晶体管。最终在操作系统中的呈现方式和物理核心没有区别操作系统会把4核8线程的CPU当作8核CPU来使用并安排运算任务。

四核八线程CPU在系统中就是“八核”的

SMT技术对那些CPU负载不是很高且支持多路并发处理的线程比较有意义典型的比如文件压缩解压缩、视频编码解码等。如果两个线程都需要花费较长的时间等待内存和缓存准备数据的话那么一个双线程SMT核心几乎就可以等同于一个双核处理器。

但SMT的效率根据应用的不同会有很大差异如果内存和缓存的压力不大 CPU核心一

直都在忙于处理线程的话另一个线程迟迟排不上队此时SMT核心的效率可能还不如单颗物理核心。这就是此前测试时关闭HT技术反而在部分项目中性能更好的根本原因

根据Intel公布的数据来看在真实的应用环境下超线程技术能够给CPU带来20-30%额外的性能提升也就是说一颗双线程SMT核心相当于1.2个常规核心的效能。

AMD又一次创新——反其道而行之

通过前面的介绍我们可以知道 Intel的同步多线程技术实际上并不能提升CPU的理论运算性能只是消除了CPU等待指令时的瓶颈在部分应用中提升了效能。这样HT技术就存在很大的局限性如果主内存不再是瓶颈 SMT的执行单元就过剩了而一个SMT核心也就不再比一个单纯的核心更高效毕竟SMT核心需要增加一些电路设计比一个单纯的核心成本要高一些。

所以AMD并没有照搬Intel的做法走SMT路线也不是继续暴力增加CPU的物理核心数目 CPU的未来并不是只有这两条路可走于是AMD有了一个新的想法 Intel是把一颗物理核心虚拟成两颗来用而AMD是把两颗物理核心组合成一颗大核心来用——这颗大核心的官方名称叫做“推土机模块” 。

为什么要把两颗核心合成一颗来用呢有两个好处一是可以共享运算单元和缓存提升效能二是共享之后会节约晶体管重复单元合二为一 而不是像SMT那样增加晶体管两份寄存器 。

AMD认为随着CPU的物理内核数目越来越多4/6/8核甚至更多  CPU的核心面积也会越来越大功耗成倍增加。传统CMP暴力复制核心的方式会造成大量重复性的电路。而减少冗余电路的最好方法就是整合把两颗核心整合在一起共用一套指令发射器和解码器还有缓存。

相信细心的读者已经发现了 AMD并不是简单的把两颗核心放在了一起而是有所精简——两颗核心的整数运算单元都被完整的保留了下来而浮点运算单元只留了一份这又是为什么呢

数据显示存在于服务器和超级计算机上80%的操作都是纯粹的整数运算 CPU的浮点运算器利用率很低所以AMD在开发新一代CPU架构时强化了整数运算而忽视浮点运算。

另一方面随着CPU和GPU异构计算应用越来越多 GPU将会越来越多的负担起浮点运算的操作预计未来3-5年的时间内据大多数浮点运算都将会交给最擅长做浮点运算的GPU这也就是推土机加强整数运算而精简浮点运算的真正目的虽然推土机CPU并未整合GPU因为它定位高端不论企业还是玩家都需要最强的CPU和GPU 但下一代APU Trinity将会使用推土机的CPU核心加HD69004D架构的GPU核心推土机架构依然在为Fusion APU而准备着可以说AMD继64b i t、整合内存控制器、 HT总线、三个层级缓存之后又一次采用创新的设计理念引领业界走在了巨头Intel前面

推土机模块化设计的四大优势

其实在上一页介绍推土机架构的设计理念时已经将其优势体现了出来下面就再强调一下。

第一 AMD虽然将两颗物理内核设计成为一个推土机模块但每个模块依然是真双核设计操作系统深信不疑

第二模块化设计节约了大量重复性晶体管 8核心的推土机CPU在晶体管数、核心面积、功耗发热方面也不会很大 因为它比传统意义上的8核心处理器“瘦身”不少

第三一个推土机模块内部的两颗物理内核共享二级缓存四个推土机模块共8颗物理内核共享三级缓存缓存利用率大大提升

一级数据缓存有8份一级指令缓存和二级缓存都只有4份三级缓存为1份

第四 CPU的单核效能不仅不会下降而且还可以共享推土模块内部相邻核心的运算资源。 Intel处理器开启超线程在部分应用中性能不升反降的情况在推土机上是不会出现的。

当然推土机架构的缺点也是很明显的它虽然拥有8颗物理核心但浮点运算能力只相当于是传统4核心的水平。

理论上 Intel的HT超线程技术能够一定程度上提升多任务性能每颗物理核心相当于是1.2核的性能而AMD的每个推土机模块则可以达到1.8核的性能。

推土机模块相对于羿龙II的改进

AMD推土机架构的设计理念不难理解但更多人担心的是其核心执行效率毕竟这些年来AMD在效能方面改进缓慢。如果CPU内核效率不行的话整体架构再怎么优秀也不会有很好的综合表现。现在我们就来看看推土机内核相对于羿龙有何改进

根据AMD官方发布的Bul ldozer架构资料推土机模块的指令解码宽度将从K7/K8/K10的每时钟周期三条微指令提升为四条。

推土机的前端指令解码和分派模块

这里我们把一个推土机的模块看作是一颗核心的话里面有两个独立的整数核心每一个都拥有自己的指令、数据缓存。虽然两个整数运算核心要比K10的三个少但实际上其中任何一个核心的运算能力都要强于Phenom II。

Intel的Core架构无论整数或者浮点都采用了统一的Scheduler 调度派发指令。推土机构架使用独立的整数和浮点派发器而且整数派发器有两个对应推土机模块里面的两颗核心。

推土机模块和K10微架构对比图

推土机模块的两个核心支持执行两个线程会共享对延迟要求较高的功能、平缓突发和低效应用、线程间动态分配资源好处是比两个线程共享一个核心更高的伸缩性和可预测性、多线程负载的吞吐优势、单线程时所有共享资源均可访问、以少得多的面积和功耗提供物理核心80的性能。

推土机模块的浮点运算单元是两个128位的FMAC 乘加运算器 这两个运算器可以被两个整数核心共享如果其中一个整数核心获得的线程支持纯粹的整数操作那么另外一个核心就可以获得全部的浮点执行资源。

这样设计的结果就是推土机的单核效能将会比Phenom II强不少而多核效能部分整数运算能力很强而浮点运算能力也不会太弱。

推土机的初步性能小胜i7-2600K

虽然距离推土机正式发布还有一段时间但国外网站已经放出了很多工程样品的测试成绩其中最为可信的当属donanimhaber网站给出的测试报告我们可以拿它与Intel的当红明星Core i7 2600K做一个简单对比。

Donanimhaber拿到的这颗推土机工程样品默认频率是3.2GHz借助新的Turbo Core加速技术 8核负载可以加速到3.6GHz而在4核负载时更可以加速到4.2GHz。

而Core i7 2600K的默认主频的3.4GHz可睿频至3.8GHz。推土机是4模块8核心而2600K是4核心8线程两者从哪方面来看都是旗鼓相当。测试结果如下

国际象棋Benchmark测试推土机每秒14197千步 i7-2600K每秒13759千步推土机小胜。

CineBench R10多线程图形渲染测试推土机得分为24434 i7-2600K得分为24381再次小胜。

由于没有更多的成绩作为参考但基本上在多线程运算方面 8核推土机的性能已经和Intel最强4核8线程处理器相当了。

AMD拿什么对抗SandyBridge-E

通过前面的分析测试我们可以得知推土机的性能最终也就和i7-2600K一个级别。Intel是把4颗传统物理核心当作8颗用而AMD是把8颗精简过的物理核心当作4颗用最终所实现的性能居然旗鼓相当。

我们知道近年来AMD处理器的单核效能始终要比I nt el差一截这就导致在核心数量大战时代核心越多 AMD的性能弱势就越明显。在核心微架构不做革命性改进的情况下想要超越Intel真的是很难。

而推土机这种创新的模块化设计理念虽然与Intel的超线程技术完全相反但最终实现的效果就是——同为8线程多核性能实现了追平甚至反超不禁令人拍案叫绝。

但是 Core i72600K并非Intel最高端的产品 Intel还有6核12线程三通道的产品未来还将发布8核16线程四通道的SandyBridge-E这颗怪兽CPU的性能将会达到i7-2600K的两倍左右 AMD将如何应付呢

两颗推土机被封装在一起所以CPU显得很宽实现“胶水” 16核心

不难 AMD将会以彼之道还施彼身把两颗推土机封装在一起实现16核心这就是下一代的服务器处理器“Interlagos” 。 Interlagos和桌面版本的FX推土机架构一致只不过是双芯FX所以核心数倍增到16而且内存也将是四通道CPU整合内存控制器两个双通道 。如此一来16核推土机的性能也应该不会输给8核16线程的SandyBridge-E。

首批推土机处理器规格表

可惜的是SandyBrdige-E已经确定登陆桌面级平台配套芯片组是X79而AMD暂时没有将16核推土机引入桌面级的打算。 8核FX搭配990FX芯片组可能就是AMD的顶级平台了残阳渐逝血红冲天。

半是夕阳余光半是狰狞血雨。

是的血到处都是冷腥的鲜血。

整个皇宫之内血流成河 白玉理石全被洗涮成黑红之色到处是断壁残肢尸横一片到处是厮杀后的痕迹。

“为什么 ”

百里冰左手紧捂着胸口瞪大着眼睛看着对面十米敌对方处挥手点兵之人。

那是她的未婚夫她倾尽一生所爱之人。

亦是绝杀她百里一族将她迫入绝境之人。

她不懂为何倾尽所有的爱换来的是百里一族的灭顶之灾。

台下之人仍是一身儒雅白衣清俊的脸上就连平日里对她宠溺的笑容都没有变过。

冷逸辰就这样含笑相对却不肯多说只字片语。

权利利益

她虽是寒月帝国唯一的继承人可是她早已与身为寒月帝国帝皇的外公达成协议她与冷逸辰成婚后冷逸辰为帝她为后她会做好他的贤内助她从来不是他成功之路上的绊脚石他为何要如此对她

冷逸辰仍是气定神闲的坐在不远处手中的白羽扇仍旧轻摇着完全不惧百里冰眼中的怒意只是仿佛没有听到她的问话般仍一派温和之笑却坚定的吐出一个字 “杀 ”

百里冰怒上心头。

手中剑气如虹眼看便要破势而出却听到远处传来震天动地撕心裂肺的愤然吼声,“冷逸辰我百里一族与你不死不休 ”

“噗 ”

百里冰同一时刻一口鲜血狂喷而出心脏之处传来剧痛。

她突的单腿倒下。

是皇帝外公的声音。百里冰痛苦的闭上眼睛。

果然冷逸辰在派人围杀她的同时也对她的皇帝外公与其他族人动手了看来百里一族今日恐怕难逃灭族之祸了。

她看着惜日对她呵护倍至的爱人指甲恨得深入掌心却感觉不到半丝痛意。

血阳残光打在百里冰的脸上映红了她的眼也血洗了她的心。

“冷逸辰你借我生辰之名将我百里一族全部聚此竟是为了灭我全族。

你可知欺我百里者杀无赦。 ”明明落在下风却仍是气度非凡那轩昂之姿百分不输男儿。

百里冰冷面肃目冷冷怒视着冷逸辰。

天色瞬间黯然黑云密布邪风四起所有天地剑气从四面八方汇集于百里冰身上她的剑力更胜之前。

冷逸辰前密密麻麻的高手执剑相护可他仍然感觉到了百里冰身上所散发的凛冽剑气。

他笑容未变眼神却一沉。

第一高手就是第一高手她的内功竟让他觉得有毁天灭地之势难怪她会成为寒月帝

ParkInHost - 俄罗斯VPS主机 抗投诉 55折,月付2.75欧元起

ParkInHost主机商是首次介绍到的主机商,这个商家是2013年的印度主机商,隶属于印度DiggDigital公司,主营业务有俄罗斯、荷兰、德国等机房的抗投诉虚拟主机、VPS主机和独立服务器。也看到商家的数据中心还有中国香港和美国、法国等,不过香港机房肯定不是直连的。根据曾经对于抗投诉外贸主机的了解,虽然ParkInHost以无视DMCA的抗投诉VPS和抗投诉服务器,但是,我们还是要做好数据备...

易探云(QQ音乐绿钻)北京/深圳云服务器8核8G10M带宽低至1332.07元/年起

易探云怎么样?易探云香港云服务器比较有优势,他家香港BGP+CN2口碑不错,速度也很稳定。尤其是今年他们动作很大,推出的香港云服务器有4个可用区价格低至18元起,试用过一个月的用户基本会续费,如果年付的话还可以享受8.5折或秒杀价格。今天,云服务器网(yuntue.com)小编推荐一下易探云国内云服务器优惠活动,北京和深圳这二个机房的云服务器2核2G5M带宽低至330.66元/年,还有高配云服务器...

麻花云-香港CN2云服务器,安徽BGP线路,安徽移动大带宽!全系6折!

一、麻花云官网点击直达麻花云官方网站二、活动方案优惠码:专属优惠码:F1B07B 享受85折优惠。点击访问活动链接最新活动 :五一狂欢 惠战到底 香港云主机 1.9折起香港特价体验云主机CN2 云服务器最新上线KVM架构,,默认40G SSD,+10G自带一个IPv4,免费10Gbps防御,CPU内存带宽价格购买1核1G1M19元首月链接2核2G 2M92元/3个月链接2核4G3M112元/3个月...

推土机cpu为你推荐
空间邮箱什么邮箱存储空间最大??站酷zcool北京站酷网络科技有限公司怎么样?广东GDP破10万亿广东省2019年各市gdp是多少?罗伦佐娜米开朗琪罗简介www.haole012.com阜阳有什么好的正规的招聘网站?ip在线查询我要用eclipse做个ip在线查询功能,用QQwry数据库,可是我不知道怎么把这个数据库放到我的程序里面去,高手帮忙指点下,小弟在这谢谢了4400av.com在www.dadady.com 达达电影看片子很快的啊www.kaspersky.com.cn卡巴斯基中国总部设立在?partnersonline国外外贸平台有哪些?www.hyyan.comDOTA6.51新手选什么英雄为好,请详细讲述出装备顺序,加点顺序,以及注意事项。谢谢
已备案域名出售 132邮箱 荷兰服务器 sugarsync ssh帐号 天猫双十一抢红包 xen 777te anylink web服务器架设 有奖调查 699美元 速度云 河南移动网 江苏双线服务器 带宽租赁 中国电信网络测速 主机返佣 网页加速 1美元 更多