推土机终于来了推土机CPU

推土机cpu  时间:2021-03-09  阅读:()

终于来了推土机六大变化详细解读

翘首以盼的“推土机”终于来了

早在2007年基于K10架构的65nm第一代Phenom发布之时就已经传出AMD将要于2009年推出Bul ldozer推土机的消息了而当时的主要规划就是为了对付Intel 45nm全新架构的Nehalem处理器。和APU一样AMD早已画好了一个“大饼”可是这个“大饼”确实“熟”的慢了些。

说来也有些讽刺如今四年已经过去了 Intel已经完成了从45nm到32nm两次工艺革新、Core到Nehlaem再到Sandy Bridge三代核心架构换代而AMD方面却只从65nm升级到45nm、而且一直维持在K10架构09年进工艺升级架构方面也进行了优化也就是一直沿用到现在的K10.5 并没有本质上的变化。除了各种小道消息之外全新架构的Bul ldozer推土机至今难觅踪影。

大家都在说推土机跳票、延期但事实上AMD官方一直都未亲口确认正式发布日期只是提及了部分处理器型号以及架构细节云云各种所谓的“确切消息”也只是谣传罢了。虽然表面上我们并不能苛责AMD但如此的难产让众多A饭们早已等得望眼欲穿。而在对手新一代旗舰Sandy Bridge-E以及22nm Ivy Bridge已现雏形的情况下 AMD的心情恐怕也是一样。提到推土机的难产其中的原因是复杂的而且是多方面的。全新设计思路的转变、支持指令集的扩充、 “模块化”架构的变革、GlobalFoundries新工艺的成熟等等都可能带影响。不过恰恰正是这些创新和改变才造就了推土机的的不平凡。尤其是在AMD处理器架构数年都未补充新鲜血液的情况下推土机的成功与否就显得尤为重要意义重大而且让人充满期待。

推土机终于来了

不过好消息是让千万人翘首企盼的推土机来了可谓箭在弦上只待发布今天中午12点推土机将正式和广大玩家见面。前几日就有许多国外媒体已经拿到了正式版推土机而目前国内相关的评测套装以及配套软件也已由AMD中国官方寄出很快就会到达各大媒体的手中相信无需多时就能看到详细的评论以及测试结果了。届时之前的一切传言都会得到验证而大家最关心的“推土机”能否推倒“爱妻”的好戏也会激情上演。

在评测结果正式出炉之前我们要做的只是静静等待。除此之外号称K8架构以来AMD处理器最大变革的推土机究竟带来哪些架构和技术上的转变呢相信也是不少读者关心的。下面我们就根据已知的信息对其进行汇总在面对最终结果的时候我们也能知其然知其所以然。Up da te目前我们驱动之家评测室已经拿到了推土机FX-8150的实物以及配套水冷将会第一时间奉上测试结果敬请期待

设计理念之变多核心下的多线程

X86架构处理器诞生之后的很长一段时间内包括AMD和Intel在内的厂商在提升CPU性能方面的思路都大同小异无非是改进核心架构、提升处理器频率、优化和扩充指令集、加大二级缓存等等。而到了双核乃至多核CPU出现之后 AMD和Intel的处理器走向了截然不同的两种道路增加物理核心数量和虚拟同步多线程。

首先说一下SMTSimultaneous Multithreading 同步多线程 放在以前就是我们常说的HTHyper-Threading超线程技术。虽然这项技术在服务器领域早已应用多年但在桌面处理器实现还要追溯到In tel的P4时代。但是出现之初并没有在P4处理其上大放异彩而后的Core 2时代甚至遭到取消直到上代的Nehalem架构才重新复活重新命名为SMT一直延续到最新的Sandy Bridge架构。不过P4时代的HT超线程和目前的SMT多线程在提升效果上已不可同日而语。

我们知道传统CPU一个物理核心只能同步执行一个线程所以大多数情况下都会处在等待内存以及数据总线的状态而S MT可以使一个物理核心“同时”执行两个线程看起来就像两颗“核心”一样。当第一个线程暂停时将第二个资源准备充分的线程安排给核心处理达到运算资源利用最大化。从设计原理上来看 S MT的目的也很简单就是掩盖单个线程的延迟以充分利用核心运算资源 以防运算单元浪费。

Intel的Nehalem架构处理器重拾超线程

S MT从成本方面来看相当廉价因为它采用的是复制内核架构的方法来实现增加了处理器中

存储线程有关数据的单元数量并在硬件执行单元空闲时将这些数据送往其中处理 以便增加处理器执行单元的利用度而内部并没有增设一套额外的硬件执行单元。这样不需要增加物理核心也耗费不了太多的晶体管和核心面积所以比再另外增加一个物理内核更加划算。而且在操作系统中呈现出来和实实在在的物理核心并没有什么区别所以我们经常见到四核八线程CPU在资源管理器中有八个“核心”在同时工作。

虽然S MT看起来很好但也不是完美的。毕竟无论如何充分利用运算资源一颗核心始终都不可能达到两颗核心的效果。所以S MT的效率要根据实际的应用环境来定 比如遇到内存和缓存需要长时间等待的境况下 S MT就能发挥很好的作用反之甚至并不如一颗纯物理核心的执行效率。按照Intel之前公布的数据来看 SMT大约能带来20-30%的性能提升换句话说也就等效于1.2-1.3个物理核心的效果。

相比之下 AMD之前的办法更加简单暴力那就是CMP Chip MultiProcessors增加核心数量 。从理论上来看直接增加物理核心的方式对CPU的性能帮助比较明显也更加直接尤其是在多线程应用环境下。

Phenom II X6 1100T就有六个物理内核

但这种方式也有很大的代价和瓶颈毕竟每增加一颗物理核心就需要耗费更多的晶体管与核心面积功耗也会随之水涨船高而且核心数量增加到一定程度之后性能提升并不一定与之成比例很容易受到制造工艺的限制。 目前的软件以及游戏对多核心优化程度有限很多实际应用

环境只能利用其中的部分核心而多余的核心只处在低负载状态实际上也就被浪费了。由于没有相关的多线程技术单核性能也处于劣势AMD只能靠物理多核心来对抗Intel的SMT多线程反映到市场策略上来看就是在价格相差不多的情况AMD的四核/三核打Intel的双核而六核打Intel的四核。虽然表面上AMD还能依靠这种“田忌赛马”的策略占据不小份额但我们似乎也从其中感觉到丝丝无奈。

既非S MT也非C MP推土机采用了另一种设计思路。

不过好在推土机就要来了虽然我们不期望它能一招制胜但至少可以大大提升AMD的市场竞争力。工欲善其事必先利其器推土机又依靠什么呢相比之前的K10架构处理器推土机在多线程、核心架构、指令支持、运算单元、数据总线等诸多方面都进行了革新而其中以提高CPU的多核心下的多线程能力为主要设计目标可见推土机既非照搬Intel的SMT也非自家传统的CMP而是另辟蹊径寻求新的设计思路。

事实上在去年的年度高性能处理器研讨会Hot-Chips 22上 AMD就着重提到了推土机的多线程处理能力而今年的Hot-Chips 23中就此方面AMD更是不吝言辞宣传较多。可见 多线程技术是推土机设计理念转变的重中之重。而这种多线程 AMD称之为CMTCluster-Based Multi-Threading簇式多线程 。如何实现CMT呢就是我们下面要谈到的推土机模块化设计。

核心架构之变一个模块两个内核

在上一节的介绍中我们了解了S MT和C MP都有各自的优缺点 S MT成本虽低但执行效率并不如增加物理内核 CMP虽然效果不错但很容易受到制造工艺和功耗的制约。为了最大化的提升处理器多核心多线程的性能推土机改变了以上两种传统的设计思路将两颗物理合

理组成一颗核心 AMD称之为一个“模块”也就是所谓的“模块化”设计。

按照AMD的说法推土机之所以会采用这种设计思路主要是为了减少处理器多核心下的冗余电路 同时获得多线程的效能提升。确实如此如果依然采取传统的CMP方式随着CPU的物理内核数目越来越多核心面积也会越来越大功耗也随之升高而且会造成大量重复性冗余的电路。

而减少冗余电路的最好方法就是整合把两颗核心整合在一起。对于整数单元、一级数据缓存等等分别单独划分而对于浮点单元、二级缓存则由两个核心共享完成。AMD表示这种做法能够让每个核心在需要的时候完成更多功能、发挥更高性能 同时节省核心面积 比每个核心都单独割裂开来效率更高。

传统的物理核心

推土机的模块化核心

由上图不难看出推土机的模块化核心不再按照传统的整数单元+浮点单元构建而是每个模块中拥有两个整数单元Integer Unit和一个高度共享的弹性浮点单元Flex Floating Point 而每个整数单元都配备了一个单独的调度器所以可以在同一时刻同步执行两个线程从而每个模块都能实现C MT。

模块化设计使得推土机实现了C MT

事实上 C MT很像是C MP和S MT融合后的产物虽然这么说并不太准确不过道理确实如此。那么C MT相对C MP以及S MT又有何改进呢相比C M P的优势前面已经说过了能够大大减少冗余电路降低功耗以及缩小核心面积。而在执行过程中两个线程都有单独的整数执行单元是相对SMT最大的优势毕竟实实在在的硬件计算效率还是要大大高于资源切换的。

增加的整数单元所需要的电路只占总核心面积的12从芯片级别上讲这只会给整个内核增加5的电路却可以换来80%左右的整数运算性能提升。当然 C MT同样不可能做到真正的物理双核心 AMD表示平均计算下一个单独的“推土机”核心执行两个线程可以达到1.8个物理核心的整数运算效率也就是有80%左右的整数运算性能提升。所以综合来看 C MT综合了C MP和S MT的优点也是推土机全新设计思路的精髓所在。

高度共享的弹性浮点单元由两个128-bit FMAC单元组成

整数运算性能提升了那浮点运算呢虽然在大多数情况下浮点运算占据的比例不高仅有20%左右而且未来也可能更多会交给擅长浮点运算的GPU去处理。上面我们也看到了一个模块内的两个内核共享一个浮点运算单元那会不会造成推土机浮点运算性能的下降呢对此AMD给出的方案是增强共享浮点单元的弹性运算指令灵活多变 以应对不同的应用情景。比如如果指令是256-bit的那么两个FAMC单元可以合并为一个256-bit浮点单元进行计算如果指令不是256-bit的而是128-bit的那么FAMC单元可以同时执行两个同样的FADD或FMUL指令拆分即可。

按照AMD的说法虽然推土机内部的一个模块仅有一个浮点单元而且还要共享但这个浮点单元拥有独立的调度器无需依赖整数调度器来分配指令也就无需占用整数单元的资源来排定256-bit的执行方式。每个模块中的浮点单元都由两个128-bit FMACFused Multiply-accumulate混合累积乘单元构成这个浮点单元通用性很强每周期可以执行任意一个FAMC(Floating-Point Multiply-Accumulators浮点累积乘)、 FADDFloationg PointAddition浮点加或者FMUL Floationg Point Multipl ication浮点乘计算相比之下Intel的浮点单元功能就比较单一 FADD和FMUL计算则需要专用的FADD及FMUL管线。

所以理论上来说共享的浮点单元并不会对推土机的浮点运算性能造成影响相反还灵活多变而且通用性很高不仅减小了核心面积而且能够一定程度上降低功耗。

支持指令之变 SS E 5和AVX的交融

除了核心架构之外 CPU的性能高低还很大程度上取决于支持的指令集。所以以往每逢重大CPU产品发布总会伴随着相应的指令集优化和扩充。这一次推土机也不例外。除了SSE5还有A VX。

GeorgeDatacenter:洛杉矶/达拉斯/芝加哥/纽约vps云服务器;2核/8GB/250GB/2TB流量/1Gbps端口,$84/年

georgedatacenter怎么样?GeorgeDatacenter是一家2017年成立的美国商家,正规注册公司(REG: 10327625611),其实是oneman。现在有优惠,有几款特价VPS,基于Vmware。支持Paypal付款。GeorgeDatacenter目前推出的一款美国vps,2核/8GB内存/250GB NVMe空间/2TB流量/1Gbps端口/Vmware/洛杉矶/达拉...

飞讯云E5-2678V3 64GB,湖北十堰100G高防物理机330元/月

飞讯云官网“飞讯云”是湖北飞讯网络有限公司旗下的云计算服务品牌,专注为个人开发者用户、中小型、大型企业用户提供一站式核心网络云端部署服务,促使用户云端部署化简为零,轻松快捷运用云计算。飞讯云是国内为数不多具有ISP/IDC双资质的专业云计算服务商,同时持有系统软件著作权证书、CNNIC地址分配联盟成员证书,通过了ISO27001信息安全管理体系国际认证、ISO9001质量保证体系国际认证。 《中华...

PQ.hosting:香港HE/乌克兰/俄罗斯/荷兰/摩尔多瓦/德国/斯洛伐克/捷克vps,2核/2GB内存/30GB NVMe空间,€3/月

PQ.hosting怎么样?PQ.hosting是一家俄罗斯商家,正规公司,主要提供KVM VPS和独立服务器,VPS数据中心有香港HE、俄罗斯莫斯科DataPro、乌克兰VOLIA、拉脱维亚、荷兰Serverius、摩尔多瓦Alexhost、德国等。部分配置有变化,同时开通Paypal付款。香港、乌克兰、德国、斯洛伐克、捷克等为NVMe硬盘。香港为HE线路,三网绕美(不太建议香港)。免费支持wi...

推土机cpu为你推荐
.cn域名cn域名和com域名有什么不同?哪个更好?好在哪里?咏春大师被ko八极拳大师真的被咏春叶问打败了吗?八极咏春比优劣如何?谢谢.中老铁路中长铁路的铁路的新中国历史关键字关键字和一般标识符的区别m.kan84.net电视剧海派甜心全集海派甜心在线观看海派甜心全集高清dvd快播迅雷下载www.se222se.com原来的www站到底222eee怎么了莫非不是不能222eee在收视com了,/?求解广告法广告法有什么字不能用66smsm.comwww.zpwbj.com 这个网址是真的吗?我想知道它的真实性.......谢谢 我就剩50了,都给你了..............www.cn12365.orgwww.12365china.net是不是真的防伪网站300373一搓黑是真的吗云鹏清藏头诗!急急急急急急急!谢谢啦!大师进
asp虚拟主机 广州服务器租用 淘宝二级域名 arvixe Vultr 申请空间 申请个人网页 丹弗 smtp服务器地址 东莞主机托管 个人免费邮箱 存储服务器 双11促销 fatcow ping值 bwg 泥瓦工 ddos攻击器 ddos攻击器下载 主机配置 更多