流水线技术DSP中什么是流水线技术

流水线技术时间:2021-09-03 阅读:()

流水线技术的性能指标

衡量一种流水线处理方式的性能高低的书面数据主要由吞吐率、效率和加速比这三个参数来决定。

指的是计算机中的流水线在特定的时间内可以处理的任务或输出数据的结果的数量。

流水线的吞吐率可以进一步分为最大吞吐率和实际吞吐率。

它们主要和流水段的处理时间、缓存寄存器的延迟时间有关，流水段的处理时间越长，缓存寄存器的延迟时间越大，那么，这条流水线的吞吐量就越小。

因为，在线性流水线中，最大吞吐率Tpmax=流水线时钟周期△T/1=max（T1,...Ti,..Tm）+T1/1，而其中，m是流水线的段数，i是特定过程段执行时间。

如果，一条流水线的段数越多，过程执行时间越长，那么，这条流水线的理论吞吐率就越小。

由此，要对于流水线的瓶颈部分的处理主要在于减少流水段的处理时间。

实现的方法一般有两种： 1、把瓶颈部分的流水线分拆，以便任务可以充分流水处理。

流水段的处理时间过长，一般是由于任务堵塞造成的，而任务的堵塞会导致流水线不能在同一个时钟周期内启动另一个操作，可以把流水段划分，在各小流水段中间设置缓存寄存器，缓冲上一个流水段的任务，使流水线充分流水。

假如X流水段的处理时间为3T，可以把X流水段再细分成3小段，这样，每小段的功能相同，但是处理时间已经变成3T/3=T了。

2、在瓶颈部分设置多条相同流水段，并行处理。

对付流水段的处理时间过长，还有另外一种方法，那就是把瓶颈流水段用多个相同的并联流水段代替，在前面设一个分派单元来对各条流水段的任务进行分派。

仍然假设瓶颈流水段的处理时间是△3T，那么经过3条并联流水段的同时处理，实际需要的时间只是△T。

这样，就达到了缩短流水段处理时间，但这种方法比较少以采用，因为要3段相同的流水段并联，成本较高，而且，分派单元会比较麻烦处理。

使用效率：指流水线中，各个部件的利用率。

由于流水线在开始工作时存在建立时间；在结束时存在排空时间，各个部件不可能一直在工作，总有某个部件在某一个时间处于闲置状态。

用处于工作状态的部件和总部件的比值来说明这条流水线的工作效率。

计算机中流水线技术和超线程技术的物理上和逻辑上的区别

流水线和超线程完全是不同的概念。

流水线是指将整一个指令执行过程分为多个段，让不同的指令处于不同的段，几条指令一起推进。

理想的状况，流水线分几段，处理速度是不用流水线的几倍。

超线程是Intel的，其实是同时多线程。

一个物理处理器虚拟成多个逻辑处理器。

在原先的硬件上，添加必要的寄存器和相关的控制逻辑，复制流水线前端（前面几段，比如取指，译码……），然后流进同一个后端流水线。

每个周期可以从多个线程取多条指令，可有效隐藏由于cache缺失或分支预测错误引起的长延迟，同时多线程主要是为了提高执行部件的利用率，让它们始终处于工作状态。

两个线程的，基本上能比原先的速度提高30%-50%。

Intel p4 最早使用该技术，但是现在各厂家用的就多了。

我随便答的，相关东西还得看相关的资料，呵呵~

流水线技术怎么样提高处理器的性能

CPU的流水线　　1.主频　　主频也叫时钟频率，单位是MHz，用来表示CPU的运算速度。

CPU的主频＝外频×倍频系数。

很多人认为主频就决定着CPU的运行速度，这不仅是个片面的，而且对于服务器来讲，这个认识也出现了偏差。

至今，没有一条确定的公式能够实现主频和实际的运算速度两者之间的数值关系，即使是两大处理器厂家Intel和AMD，在这点上也存在着很大的争议，我们从Intel的产品的发展趋势，可以看出Intel很注重加强自身主频的发展。

像其他的处理器厂家，有人曾经拿过一快1G的全美达来做比较，它的运行效率相当于2G的Intel处理器。

　　所以，CPU的主频与CPU实际的运算能力是没有直接关系的，主频表示在CPU内数字脉冲信号震荡的速度。

在Intel的处理器产品中，我们也可以看到这样的例子：1 GHz Itanium芯片能够表现得差不多跟2.66 GHz Xeon/Opteron一样快，或是1.5 GHz Itanium 2大约跟4 GHz Xeon/Opteron一样快。

CPU的运算速度还要看CPU的流水线的各方面的性能指标。

　　当然，主频和实际的运算速度是有关的，只能说主频仅仅是CPU性能表现的一个方面，而不代表CPU的整体性能。

　　3.前端总线(FSB)频率　　前端总线(FSB)频率(即总线频率)是直接影响CPU与内存直接数据交换速度。

有一条公式可以计算，即数据带宽＝(总线频率×数据带宽)/8，数据传输最大带宽取决于所有同时传输的数据的宽度和传输频率。

比方，现在的支持64位的至强Nocona，前端总线是800MHz，按照公式，它的数据传输最大带宽是6.4GB/秒。

　　6.缓存　　缓存大小也是CPU的重要指标之一，而且缓存的结构和大小对CPU速度的影响非常大，CPU内缓存的运行频率极高，一般是和处理器同频运作，工作效率远远大于系统内存和硬盘。

实际工作时，CPU往往需要重复读取同样的数据块，而缓存容量的增大，可以大幅度提升CPU内部读取数据的命中率，而不用再到内存或者硬盘上寻找，以此提高系统性能。

但是由于CPU芯片面积和成本的因素来考虑，缓存都很小。

　　11.超流水线与超标量　　在解释超流水线与超标量前，先了解流水线(pipeline)。

流水线是Intel首次在486芯片中开始使用的。

流水线的工作方式就象工业生产上的装配流水线。

在CPU中由5—6个不同功能的电路单元组成一条指令处理流水线，然后将一条X86指令分成5—6步后再由这些电路单元分别执行，这样就能实现在一个CPU时钟周期完成一条指令，因此提高CPU的运算速度。

经典奔腾每条整数流水线都分为四级流水，即指令预取、译码、执行、写回结果，浮点流水又分为八级流水。

　　超标量是通过内置多条流水线来同时执行多个处理器，其实质是以空间换取时间。

而超流水线是通过细化流水、提高主频，使得在一个机器周期内完成一个甚至多个操作，其实质是以时间换取空间。

例如Pentium 4的流水线就长达20级。

将流水线设计的步(级)越长，其完成一条指令的速度越快，因此才能适应工作主频更高的CPU。

但是流水线过长也带来了一定副作用，很可能会出现主频较高的CPU实际运算速度较低的现象，Intel的奔腾4就出现了这种情况，虽然它的主频可以高达1.4G以上，但其运算性能却远远比不上AMD 1.2G的速龙甚至奔腾III。

　　12.封装形式　　CPU封装是采用特定的材料将CPU芯片或CPU模块固化在其中以防损坏的保护措施，一般必须在封装后CPU才能交付用户使用。

CPU的封装方式取决于CPU安装形式和器件集成设计，从大的分类来看通常采用Socket插座进行安装的CPU使用PGA(栅格阵列)方式封装，而采用Slot x槽安装的CPU则全部采用SEC(单边接插盒)的形式封装。

现在还有PLGA(Plastic Land Grid Array)、OLGA(Organic Land Grid Array)等封装技术。

由于市场竞争日益激烈，目前CPU封装技术的发展方向以节约成本为主。

　　好了,上面贴的一些都是和CPU的运行效率直接相关的参数,剩下的参数,有的太简单,有的我们不常接触到.没有贴, 　　好,看一下流水线的来由,大家都知道,两个CPU会比一个CPU快,但是为什么呢,也不会出现,一个CPU,运行WORD,一个CPU,运行CS呀, 那是因为,把指令细分成线程后,他们可以分别运行,cyrix的MII,当时不是有个技术么,乱序运行!!就是提高运行效率的一个手段,流水线,也是这种目的,P4,的时候,就20级流水线了,就是说,CPU运行一次的时候,等于,20个CPU(没有流水线),同时运行一样,这本来是什么呢,运行速度一下子,提高了20倍　　但是,事实上并不是这样,为什么呢,这20个东东运行完了,得把他们再拼一起呀,还有一件事,如果拼错了,(下面的工人装不上,就认为是原料有问题)他就认为,这次的运行结果是错的,说,"重来"吧. 那么,有一个CPU,只有10级流水线,但是由于他们的管理很好,每次运行都不返工,所以,他们的生产效率反而更高!!! 　　AMD,和INTEL,现在正是这种情况,一个抓管理,管理上去了,下面的工人出错的才少,(返工次数少) 　　一个抓技术,工人熟练了,生产的东西,质量才高!!(每次出来的东西多) 　　当然,又抓管理,又抓技术,两手都要抓,两手都要硬,这是中国人的想法,都抓的人,显然什么都没抓好,都破产了,现在只有这两家还存活着,......现在我想给流水线一个公正一点的说法, 如果你的CPU组装的水平很差,那当然,流水线越多,你越乱,就像,你的水平不行, 管理了,10000多个程序员高手, 项目乱的一团糟, 但是,如果你是一个管理经验丰富的人, 下面的人一下也不会做活, 那么,项目也是一个失败, 幸好,事实上,并不是这样绝对,管理员也是差不多的水平, 程序员也是差不多的水平, 那么你建一个项目, 你选好的程序员,还是好的管理员!!! 　　我说,不一定,我得看是什么项目, 如果项目是一般的项目, 一般的管理员就可以了,那么,我当然选好的程序员, 项目完成的又快又好, 一个程序,本身就可以乱序运行, 那么,INTEL的CPU当然就是最好了, 反正,大家都不会返工!!!!! 但是一个项目是很复杂的, 而代码量并不多, 那么,当然是选好的管理员, 如果一个程序,就是针对测试而测试的, 导致,CPU运算不断的返工, 那当然就是AMD的CPU好, 比如,大浮点数的运行,AMD,比INTEL的高50%现在看不到这种比较了, 但是,你可以查一查,以前的资料, 有PIII1G,与AMD速龙1G的比较, 这个差异到现在也没有改变, 这就是为什么AMD的CPU,显卡得分,会比INTEL的高, 3Dmark2001的得分,一般都比INTEL的高, 而,business stone,INTEL 一般都比AMD要高, SYSMARK,也是,INTEL 比AMD要高, 因为这些程序不复杂,(线程复杂,和我们想的程序本身复杂是两回事) 　　买CPU也是一样, AMD,和INTEL谁好,????? 我也不知道,我喜欢AMD,但我目前确实使用的是INTEL, 家里的两台机子全是INTEL. 没有AMD,INTEL不会这么便宜, 没有AMD,中国的D版软件..... 中国的组装机.............但是,我要为流水线正一正名, 并不是流水线长了,运行效率就低了, 流水线长了,运行效率绝对是高了, 但是,运行出错的代价是大了,流水线,这本身是一个提高效率的技术, 怎么现在的人,都当成是,因为提高频率,所必须采用的手段呢????? 当时没有流水线的时候, 流水线一出来的时候, 大家都认为这是提高效率的秘密武器呀!!! 　　越是实际的程序，越容易发生流水线返工，因此P4效能越差。

　　倒是纯粹的理论测试，比如sandra,pcmark还有3dmark之类P4表现不错（老实说P4在3dmark里面的表现相对于在bussiness winstone里面算好的了），而到了实际测试，特别是bussiness winstone(直接调用office源代码）或者sciencemark(直接编译的标准量子化学代码）里面，p4的表现那叫一个菜。

。

。

。

连P4c都不是同PR的AthlonXP的对手。

　　至于sysmark里面Intel的分高,那是一个著名的bug,因为sysmark认为AthlonXP不支持SSE，结果是AthlonXP用x87浮点对抗专门为SSE优化的多媒体代码，自然性能不成（即使这样Intel也没有多少优势）　　在bussiness winstone 2002的测试结果，看看就会发现，P4 3.2c的性能刚刚可以匹敌公认为虚标最严重的AthlonXp 3200+。

当然，多媒体性能上P4 3.2c还是毫无疑问的战胜AXP 3200+,毕竟，AXP不支持SSE2。

　　即使没有流水线返工，长流水线的性能也就和短流水线相同，因为每条流水线每周期就只能执行一条指令（p4有个怪异的设计就是如果跑配对的两个简单微指令，那么两个可以并成一个执行，所以如果你反复执行完全相同的指令比如a=a+1一百亿次，那么P4比AthlonXP要快一倍），所以长流水在任何角度也不可能提升效率。

　　长流水的唯一好处就是，电路比较简单，设计起来比较容易.解释的详细一点就是，并不是说20级流水线每次执行的动作比10级流水线多一倍，相反，他们能执行的实际功能是一样的，只是每级执行的操作简单了一些。

　　比如，一个工厂造螺丝，可以分成两级流水，一个人造螺丝，一个人车螺纹。

也可以分成100个步骤，第一个人负责拿铁块，第二个人负责递，第三个人负责往上画线。

。

。

。

第99个人车单数螺纹，第100个人负责擦掉粉尘。

　　如果每个步骤耗费的时间都一样，那么两种做法速度完全一样，唯一的区别是，前面的办法工人素质必须很高，因为他每个人干了对方50个人的活。

超线程和流水线技术有什么区别？

据我知道超线程技术是一种CPU建立一个虚拟的运算，直说就是假双核，模拟出来的，当然，比没有这个技术的单核CPU性能要好些而流水线，是CPU在制作工艺的一种工序这样的事情，他们是两回事

流水线技术和并行处理技术是什么关系？

流水线技术是并行处理技术的一种，一条流水线上可以同时处理几条指令（的不同阶段），虽然指令最终还是一个个离开流水线的（也就是完成全部处理阶段），但是前后两条指令处理完成的时间间隔远小于每条指令在流水线中的时间。

流水线是时间并行技术，除此之外的并行技术叫做空间并行技术。

DSP中什么是流水线技术

原理流水线是一种在时间上串行，在空间上并行的技术，其基本原理如图1所示。

将整个电路划分为若干个流水线级，流水线每级之间设置寄存器锁存上一级输出的数据；每一级只完成数据处理的一部分；一个时钟周期完成一级数据处理，然后在下一个时钟到来时将处理后的数据传递给下一级；第一组数据进入流水线后，经过一个时钟周期传到第二级，同时第二组数据进入第一级，数据队列依次前进。

每组数据都要经过所有的流水级后才能得到最后的计算结果，但是对整个流水线而言，每个时钟都能计算出一组结果，所以平均计算一组数据只需要一个时钟周期的时间，这样就大大提高了数据处理速度，电路在单位时间内处理的数据量就愈大，即电路的吞吐量就越大，保证整个系统以较高的频率工作。

DSP中采用流水线技术的优势 (1)采用流水线技术普遍比不用流水线工作速度显著提高，体现流水线技术在高速DSP运算上的优势。

(2)采用流水线技术在资源耗用(逻辑单元与寄存器个数、存储器位数)上有所增加。

(3)采用不同的流水线级数在速度指标和资源耗用率上有所不同，流水线级数增加，速度指标不一定增加，但资源耗用大大增加，所以应注意速度和资源耗用指标的权衡。

如对16位加法器，如不用M4K(专用存储器资源)，以采用2级流水线最佳；如选用M4K，则取6级流水最佳。

8位乘法器则以2级或6级流水最佳。

对于其他DSP运算，在设计时必须通过反复比较、设计，选择符合系统性能要求的流水线级数。

展开全文