上行ai内存不足

ai内存不足  时间:2021-01-19  阅读:()

ApplicationReportZHCA538–July20131在KeyStone器件上实现高效的LTE上行基带前端处理范伟,尹志新MulticoreDSP/FAE摘要LTE上行基带前端处理包括为PUSCH、PUCCH、SRS信道执行的FFT,以及为PRACH信道执行的时频转换.
这些操作处理的是原始时域天线数据,数据量大,对计算资源和存储资源的需求都较高.
文本针对TI的KeyStone器件给出了完整的LTE上行基带前端处理设计,目标是尽可能减少核的干预,消耗尽可能少的资源.
本文还详细列出了该设计对各种硬件资源的需求,以及c66x核上任务的实测负载.
文档历史版本日期作者注释1.
02013年6月5日范伟,尹志新初始发布版本.
1.
12013年6月9日范伟,尹志新修改错误,补充内容.
1.
22013年6月26日范伟,尹志新格式、图片调整,规范化器件型号,增加前端FFT的TTI配置函数的负载测量,调整TDD情况下的前端FFT入队EDMA的图示及相应描述.
ZHCA5382在KeyStone器件上实现高效的LTE上行基带前端处理目录1引言.
42上行前端FFT52.
1FFTCTx侧设计.
72.
2FFTCRx侧设计122.
3硬件资源需求.
172.
4C66x核负载测量183PRACH前端时频转换183.
1长RACH——大点DFT法.
193.
1.
1原理193.
1.
2实现213.
1.
3硬件资源需求253.
1.
4负载测量253.
2长RACH——混合法.
263.
3长RACH——直接DFT.
273.
4短RACH.
274小结.
28参考文献28附录A:PRACH分布与EDMA参数29图1:LTE上行基带前端处理4图2:上行前端FFT设计(例子:TD-LTE8天线)6图3:FFT入队EDMA设计——FDD(例子:NormalCP)8图4:FFT入队EDMA设计——TDD(例子:UL/DL配置6,特殊子帧配置5~8,NormalCP)10图5:上行前端FFTTx描述符配置(例子:同图2)12图6:上行前端FFTRxbuffer结构(例子:20M,动态scaling)13图7:前端FFT的上行子帧Rx描述符配置(例子:动态scaling)14图8:前端FFT的UpPTSRx描述符配置(例子:动态scaling)15图9:QPend事件传递路径举例(单片TCI6634K2K/TCI6638K2K实现3载扇)16图10:PRACH接收机流程图18图11:DIT大点DFT原理.
20图12:抽取EDMA配置举例.
23图13:PRACH导频的频域位置.
24图14:混合法原理26表1:TTI配置函数负载(coldcache)18表2:PRACH前端时频转换DFT原始长度.
19表3:PRACH前端处理步骤3和4的硬件实测cycle数.
26表4:表5到表12中的变量取值.
29表5:PRACH分布与EDMA参数(FDD)30表6:PRACH分布与EDMA参数(TDDUL/DL配置0)31ZHCA538在KeyStone器件上实现高效的LTE上行基带前端处理3表7:PRACH分布与EDMA参数(TDDUL/DL配置1)32表8:PRACH分布与EDMA参数(TDDUL/DL配置2)33表9:PRACH分布与EDMA参数(TDDUL/DL配置3)34表10:PRACH分布与EDMA参数(TDDUL/DL配置4)35表11:PRACH分布与EDMA参数(TDDUL/DL配置5)36表12:PRACH分布与EDMA参数(TDDUL/DL配置6)37ZHCA5384在KeyStone器件上实现高效的LTE上行基带前端处理1引言LTE(LongTermEvolution)是由3GPP组织制定的3G演进标准,在物理层采用OFDM和MIMO技术.
LTE分为FDD和TDD两种双工模式.
目前,LTE-FDD在20MHz频谱带宽下的实际速率大约能达到下行100Mbps、上行50Mbps.
LTE-TDD(国内通常称为TD-LTE)的实际速率会随上、下行子帧的配比关系而变化.
[1][2][3][4]是主要的几个LTE物理层协议文本.
[1]描述了上、下行发射机从星座点调制到基带信号上变频之间的处理步骤,通常称为符号级处理.
[2]描述了星座点调制之前的处理步骤,通常称为比特级处理.
[3]描述了各种物理层过程.
[4]描述了各种物理层测量.
LTE的上行物理信道信道包括用来传输数据和物理层随路控制信令的PUSCH,专门用来传输物理层控制信令的PUCCH,用于随机接入的PRACH,以及用于上行信道探测的SRS.
下行物理信道包括用来传输数据的PDSCH,用来传输各种物理层控制信令的控制信道PCFICH、PHICH和PDCCH.
本文描述的是LTE上行基带前端处理.
如图1所示,LTE上行基带前端处理包括从天线接口接收时域数据,以及随后的时频变换.
LTE中所有上行信道接收机的第一步都是把信号从时域变到频域,这是上行基带前端处理最主要的任务.
PRACH采用和其它上行物理信道不同的时频结构,因此,前端时频变换需要做两次,一次用于PRACH,一次用于其它上行物理信道.
本文把前者称为"PRACH前端时频转换",把后者称为"上行前端FFT".
天线接口时域数据上行前端FFT(含1/2子载波频偏校正)PUSCH接收机PUCCH接收机SRS接收机PRACH前端时频转换常规频域数据PRACH频域数据PRACH接收机中频上行基带前端处理图1:LTE上行基带前端处理TI推出了一系列用于LTE基站基带处理的SoC(SystemOnChip).
这些SoC基于TI的KeyStone架构,该架构目前已演进了两代——KeyStoneI和KeyStoneII.
KeyStoneI家族基于40nm工艺,包括如下基带SoC器件型号:TCI6616,详细资料参见[5]TCI6618,详细资料参见[6]TCI6614和TCI6612,详细资料参见[7]和[8]TMS320C6670,详细资料参见[9]KeyStoneII家族基于28nm工艺,包括如下基带SoC器件型号:TCI6636K2H,详细资料参见[10]ZHCA538在KeyStone器件上实现高效的LTE上行基带前端处理5TCI6634K2K,详细资料参见[11]TCI6638K2K,详细资料参见[12]TCI6630K2L,详细资料参见[13]所有这些器件都具有多模能力,支持GSM/EDGE、WCDMA、TD-SCDMA、WiMAX、LTE的单模实现或混模实现.
所有这些器件使用的DSP核都是c66x,但个数不同.
TCI6614和TCI6612带一颗ARMCortexA8,TCI6636K2H和TCI6638K2K带4颗ARMCortexA15,TCI6630K2L带2颗A15,它们除支持物理层以外,还支持高层(层2,层3)和传输处理.
这些器件也可用于基于OFDM的无线回传(wirelessbackhaul),如LTErelay站.
本文介绍如何在上述KeyStone器件上实现高效的LTE上行基带前端处理.
上述KeyStone器件中,只有TCI6630K2L包含中频处理模块,称为DFE模块,该模块通过IQNet模块和系统总线相连.
图1中的天线接口对TCI6630K2L来说指的是IQNet,对其它器件来说指的是AIF2.
IQNet和AIF2都使用PktDMA作为对内接口,行为方式类似.
本文用AIF统一指代IQNet和AIF2,描述的前端处理方法同时适用于两者.
关于KeyStoneI和II的AIF2,请参考[14]和[15].
关于PktDMA,请参考[16].
天线接口一旦配置完毕,在实时运行过程中不需要软件干预,不产生实时负载.
本文重点描述时频转换.
对天线接口,仅描述其与时频转换交互的部分.

基带前端工作在基带时域采样率上,对20MHz载波通常为30.
72Msps,而系统中通常存在多个这样的数据流,对应多天线和/或多载波.
对这样高速的数据流做处理,效率至关重要,应尽量减少对处理资源、存储资源、总线资源的占用.
上行基带前端的处理效率是基带整体效率的重要组成部分.
本文给出了在KeyStone器件上用FFTC硬件加速器完成尽可能多的时频转换,并将天线接口和两类时频转换用EDMA进行直连的方法.
该方法使相关的软件负载降至最低,并且尽可能地降低对内存和总线的占用.
本文还给出了由c66x和FFTC共同完成PRACH时频转换的方法,并给出了实测负载.
该方法减少了对FFTC、内存、总线的占用,但增加了c66x负载.
用户可根据自身系统的资源消耗情况选择不同的PRACH时频转换方法.
关于EDMA,请参考[17].
关于FFTC,请参考[18].
本文中的"符号"默认指的是OFDM符号.
2上行前端FFT图2以单片TCI6634K2K或TCI6638K2K实现2个8天线TD-LTE载扇为例,描述了上行前端FFT的设计,包括对Tx/Rx通道、flow、Q(本文用Q表示硬件队列)、Tx和Rx描述符、Acc(本文用Acc表示Accumulator)等物理资源的使用,以及描述符的传递路径.
相关的原理和更多的细节参见以下各节.
虽然这里以单片TCI6634K2K/TCI6638K2K实现8天线TDD双载扇为例,本文描述的设计实际上适用于在所有KeyStone器件上实现各种部署场景.
注意,对于TCI6634K2K/TCI6638K2K,当不要求所有载扇同时达到最高规格(比如在所有RB上执行带信道估计时域内插的MU-MIMOIRC均衡,下行每载扇瞬时数据流量300Mbps,每载扇400个激活用户等)且经过充分优化时,单片可支持8天线TDD三载扇.
ZHCA5386在KeyStone器件上实现高效的LTE上行基带前端处理该设计以一个载扇为基本设计单位.
多载扇时,每个载扇使用相同的设计,但可以配置不同的硬件资源.
考虑到一个FFTC可以在一个符号周期内完成8次带1/2子载波频偏校正的2048点FFT,为简单起见,要求一个载扇的上行前端FFT处理由一个FFTC完成.
图2中的例子采用的物理层核间分工策略是:8个c66x核分为2组,核0~3是一组,核4~7是另一组,每组处理一个载扇.
对第一组:核0和核1处理PUSCH,其中信道估计按天线分工,均衡按时隙分工;核2处理PUCCH和PRACH;核3处理下行和SRS,包括上行子帧最后一个符号上的SRS,以及UpPTS内的SRS.
第二组内的核间分工与第一组相同.
TxQ0ReturnQFlowxRxFDQ0(FDQ0,1,2,3offlow0)FFTCDescriptorsetforonesubframeTxQ0TxPktDMARxQPendQ0RxQPendQ1RxPktDMARxPktDMARxPktDMATx/RxchannelPINGdescriptorsetPONGConfigureduringdriverinit.
@tx_filt_einfo=1.
@tx_filt_pswords=0.
@tx_aif_mono_mode=0.
@priority=any.
@tx_enable=1.
@rx_enable=1.
INTtoc66x0/4INTtoc66x1/5Symbol0……Symbol1~2Symbol3……TxPktDMAAcc(AccchannelforFFTTx)0120101234567013123456789101112AntennaSymbolDatasymbolslocatinginLL2ofc66x0/4DatasymbolslocatinginLL2ofc66x1/5PilotsymbolslocatinginLL2ofc66x0/4PilotsymbolslocatinginLL2ofc66x1/5RxPktDMAlinksfivedescriptorsfromoneRxFDQandpushesthelinkeddescriptorintooneRxqueue.
……Symbol4~6……Symbol7~9Symbol10……Symbol11~13RxGeneralQRxPktDMARoutedtoQPendQ0RoutedtoQPendQ1RoutedtoQPendQ0RoutedtoQPendQ1RoutedtoQPendQ2C66x0/4PUSCHdataC66x1/5PUSCHdataC66x0/4PUSCHpilotC66x1/5PUSCHpilotC66x2/6PUCCHSL2sideinfoandguardFFTTxAccListBuffer(Pong,[(N_UL_TTI*14+N_UPPTS_SYM)*8+1]32-bitwordsFFTTxAccListBuffer(Ping,[(N_UL_TTI*14+N_UPPTS_SYM)*8+1]32-bitwordsArrayconsistingofaddressesofallFFTTxdescriptorsforULTTIinorderwithinoneULTTIburst(N_UL_TTI*14*832-bitaddresses)InSL2orDDREDMA(ATtimerevent)InSL2Sym3Sym10Sym0Sym13Sym12Sym11Acc(AccchannelforFFTRx)FFTRxAccListBuffer(Ping,[(N_UL_TTI*(14*8-5)+N_UPPTS_SYM*(8-2)+1]32-bitwordsInSL2orDDRArrayconsistingofaddressesofallFFTRxdescriptorsforULTTIinorder(2*14*8*5=112032-bitaddresses)InSL2QDMA(ManualeventduringTTIconfig)RxQPendQ2INTtoc66x(1+2)/(5+6)RxPktDMAConfigureduringdriverinit.
@RxdestinationqueueisNOTused.
@RX_SOP_OFFSET=0,RX_PS_LOCATION=0,RX_DESC_TYPE=0,RX_ERROR_HANDLING=0,RX_PSINFO_PRESENT=0,RX_EINFO_PRESENT=0.
@RX_SIZE_THRESH_EN=0.
@FDQ0/1/2/3areRxFDQiforflowi(i=0or1).
DescriptorsroutingpathArrayconsistingofaddressesofallFFTTxdescriptorsforUpPTSinorderwithinoneULTTIburst(N_UPPTS_SYM*832-bitaddresses)InSL2EDMA(ATtimerevent)RxPktDMAC66x0/4(PopinINThandler)C66x1/5(PopinINThandler)C66x1/5(PopinINThandler)UpPTSdescriptorsarenotshownhere.
Example:N_UPPTS_SYM=2FlowyUpPTSdescriptorsarenotshownhere.
C66x3/7UpPTSSpecialsubframesym12Specialsubframesym13RxFDQ1(FDQ0,1,2,3offlow1)DescriptorsetforoneUL/DLswitchperiodExample:N_UPPTS_SYM=2RxPktDMAArrayconsistingofaddressesofallFFTRxdescriptorsforUpPTSinorder(N_UPPTS_SYM*8*332-bitaddresses)InSL2QDMA(ManualeventduringUpPTSconfig)FFTRxAccListBuffer(Pong,[(N_UL_TTI*(14*8-5)+N_UPPTS_SYM*(8-2)+1]32-bitwords331312UpPTSsymbolslocatinginLL2ofc66x3/7ULsubframeUpPTSN_UL_TTIisthenumberofULTTIsinoneUL/DLswitchperiodwhichis5msforUL/DLconfiguration0~2,or10msfor3~6.
N_UPPTS_SYMisthenumberofUpPTSsymbolsinoneUL/DLswitchperiod.
ForFDD,N_UL_TTI=1andN_UPPTS_SYM=0.
TheTxdescriptoraddressesofoneTTIrepeatN_UL_TTItimes,expectforUL/DLconfiguration6inwhichcaserepeatingonly3times.
RxQPendQ3INTtoc66x3/7C66x3/7(PopinINThandler)图2:上行前端FFT设计(例子:TD-LTE8天线)ZHCA538在KeyStone器件上实现高效的LTE上行基带前端处理72.
1FFTCTx侧设计AIF每收齐一根天线上的一个完整符号,就把一个包push到一个RxQ中.
本设计假设一个载扇的A根接收天线与基带之间的延时是相同的,则对一个符号,A根天线对应的A个包几乎同时被AIF的RxPktDMApush到RxQ中.
为避免对Rx描述符的回收操作,可把AIF的RxQ和RxFDQ配置成同一个Q.
除了ATtimer,其它关于AIF的部分没有在图2中画出.
AIF和FFTC之间的直连不是通过AIF的RxPktDMA把接收包直接push到FFTC的TxQ来实现的.
实际上,AIF可以通过内部的ATtimer产生符号级事件,在一个符号的A个Rx包被push到RxQ之后,立即产生一个系统事件.
该事件被用于触发一个EDMA操作,该操作把A个包push到FFTC的TxQ中.
称该EDMA为FFT入队EDMA.
对TD-LTE,AIF可以做到只接收上行子帧和UpPTS内的符号数据,但无法屏蔽其它符号对应的ATtimer事件.
FFT入队EDMA接收所有的ATtimer事件,但仅为上行符号对应的事件执行入队操作.
为了给应用提供尽可能多的灵活性,为一个子帧内的每个【符号,天线】分配一个FFTCTx描述符,并使用描述符的PSdata承载FFTC本地配置(LocalConfiguration).
记一个子帧的符号数为sym,则需要分配symA个Tx描述符,每个描述符的大小是64B.
这样,应用可以在初始化时为每个【符号,天线】配置任意的参数,如destinationQ、outputscaling等.
用Acc对TxreturnQ中的描述符进行自动回收,但不需要产生Acc中断或EDMA事件.
为了正常工作,Acc要求在一个乒或乓ListBufferPage满了之后,向InterruptNCount寄存器写1,作为应用对Acc的响应.
因为不需要产生Acc事件,响应时不需要写EOI寄存器.
结合以上几点,FFT入队EDMA的设计如图3和图4所示.
图3以NormalCP为例给出了FDD时的设计.
此时用到了3个PaRAMset:PaRAMset0只用一次,为系统启动后的第一个上行子帧的符号执行FFTC入队操作;PaRAMset2以子帧为单位被周期性地使用,为第一个上行子帧之后的所有上行符号执行入队操作;PaRAMset1用于在每个上行子帧开始时,响应前一个上行子帧的Acc操作.
注意,为了使Acc操作正常,这里实际上有一个隐性前提:Acc总能以略短于一个符号的延时处理完被FFTC的TxPktDMApush进TxreturnQ的描述符.
该条件在通常的Acc负载下都能被满足.
对ExtendedCP,只要把PaRAMset0和2中的CCNT从14改为12即可.
FFT入队EDMA在处理完入队操作后,通过chain机制产生PRACH触发事件,该事件将触发PRACH前端时频转换.
ZHCA5388在KeyStone器件上实现高效的LTE上行基带前端处理FFTEnqueueChannelOPT=AB-syncSRC=UpPTSTxDescriptorArrayBCNT=NAACNT=4DST=RegDofTxQDBIDX=0SBIDX=4BCNTRLDLINKDCIDX=0SCIDX=4NARsvdCCNT=14InitULMappingOPT=A-syncSRC="1"variableaddressBCNT=1ACNT=4DST=InterruptNCountRegisterDBIDXSBIDXBCNTRLDLINKDCIDXSCIDXRsvdCCNT=1DecAccIntCntOPT=AB-syncSRC=UpPTSTxDescriptorArrayBCNT=NAACNT=4DST=RegDofTxQDBIDX=0SBIDX=4BCNTRLDLINKDCIDX=0SCIDX=4NARsvdCCNT=14ULATtimerevent(14events)ATtimerevent(1event)ATtimerevent(13events)NormalCPLongRACHtriggerevent(14events)LongRACHtriggerevent(14events)LinkChainPaRAMset0PaRAMset1PaRAMset2图3:FFT入队EDMA设计——FDD(例子:NormalCP)图4以"UL/DL配置6、特殊子帧配置5~8(UpPTS包含2个符号)、NormalCP"为例给出了TDD时的FFT入队EDMA设计.
在该系统配置下,用到了8个PaRAMset:PaRAMset0只用一次,用于消耗掉系统启动后的第一个UpPTS之前的所有ATtimer事件,不执行有实际意义的数据搬移操作.
PaRAMset2和5以无线帧为单位被周期性地使用,分别为一个无线帧的前、后半帧中的所有上行子帧的符号执行FFTC入队操作.
PaRAMset1和4分别为一个无线帧的前、后半帧中的UpPTS符号执行FFTC入队操作.
PaRAMset3和6负责消耗掉非上行符号对应的ATtimer事件.
ZHCA538在KeyStone器件上实现高效的LTE上行基带前端处理9PaRAMset7响应前一个操作周期的Acc操作,这里的操作周期指的是从一个无线帧的第一个UpPTS开始的一个10ms.
对UL/DL配置6,需要为前、后半帧的上行子帧集合、UpPTS、其它符号集合的ATtimer事件响应使用不同的PaRAMset,这是因为两个半帧包含的上行子帧数是不一样的.
对其它所有UL/DL配置,只需要5个PaRAMset,对应的操作周期等于上下行切换周期(UL/DL配置0~2是5ms,3~5是10ms).
不论是FDD还是TDD,服务于上行子帧或UpPTS的PaRAMset使用AB-sync,每次事件触发当前上行符号的A个Tx描述符的FFTC入队操作.
CCNT等于该上行子帧集合或UpPTS包含的符号数.
上行子帧集合和UpPTS对应的PaRAMset使用的源buffer的大小,以及Acc的ListBufferPage的大小,参见图2.
对TDD,如果当前载扇使用的是长RACH(PRACHpreamble格式0~3),上行子帧中的FFT入队EDMA在处理完入队操作后,还需通过chain机制产生长RACH触发事件,该事件将触发针对长RACH的前端时频转换;如果当前扇区使用的是短RACH(PRACHpreamble格式4),UpPTS中的FFT入队EDMA通过chain机制产生短RACH触发事件,触发针对短RACH的前端时频转换.
一个TDD小区不会同时使用长RACH和短RACH,因此这两类PRACH触发事件不需要同时配置.
注意,AIF无法屏蔽非上行符号对应的ATtimer事件,但是,经过FFT入队EDMA的过滤,PRACH前端时频转换功能模块只会收到上行子帧对应的符号级事件.
ZHCA53810在KeyStone器件上实现高效的LTE上行基带前端处理FFTEnqueueChannelOPT=A-syncSRC=DummyByteAddrBCNT=26ACNT=1DST=DummyByteAddrDBIDXSBIDXBCNTRLDLINKDCIDXSCIDXRsvdCCNT=1InitDummyMappingOPT=AB-syncSRC=UpPTSTxDescriptorArrayBCNT=NAACNT=4DST=RegDofTxQDBIDX=0SBIDX=4BCNTRLDLINKDCIDX=0SCIDX=4NARsvdCCNT=2UpPTSOPT=AB-syncSRC=ULTxDescriptorArrayBCNT=NAACNT=4DST=RegDofTxQDBIDX=0SBIDX=4BCNTRLDLINKDCIDX=0SCIDX=4NARsvdCCNT=42ULATtimerevent(26events)ATtimerevent(Initial2events,run-time1event)ATtimerevent(42events)TDDUL/DLconfiguration6,Specialsubframeconfiguration5/6/7/8,NormalCPDlDummyATtimerevent(40events)OPT=A-syncSRC=DummyByteAddrBCNT=40ACNT=1DST=DummyByteAddrDBIDXSBIDXBCNTRLDLINKDCIDXSCIDXRsvdCCNT=1OPT=AB-syncSRC=ULTxDescriptorArrayBCNT=NAACNT=4DST=RegDofTxQDBIDX=0SBIDX=4BCNTRLDLINKDCIDX=0SCIDX=4NARsvdCCNT=28ULATtimerevent(28events)OPT=AB-syncSRC=UpPTSTxDescriptorArrayBCNT=NAACNT=4DST=RegDofTxQDBIDX=0SBIDX=4BCNTRLDLINKDCIDX=0SCIDX=4NARsvdCCNT=2UpPTSATtimerevent(2events)LongRACHtriggerevent(42events)LongRACHtriggerevent(28events)LinkChainNote:InTDD,chainingtothePRACHtriggereventdoesn'texistsifPRACHpreambleformat4isused.
PaRAMset0PaRAMset1PaRAMset2PaRAMset4PaRAMset5PaRAMset6ShortRACHtriggerevent(2events)ShortRACHtriggerevent(2events)OPT=A-syncSRC="1"variableaddressBCNT=1ACNT=4DST=InterruptNCountRegisterDBIDXSBIDXBCNTRLDLINKDCIDXSCIDXRsvdCCNT=1DecAccIntCntATtimerevent(1event)PaRAMset7OPT=A-syncSRC=DummyByteAddrBCNT=26ACNT=1DST=DummyByteAddrDBIDXSBIDXBCNTRLDLINKDCIDXSCIDXRsvdCCNT=1DlDummyATtimerevent(26events)PaRAMset3图4:FFT入队EDMA设计——TDD(例子:UL/DL配置6,特殊子帧配置5~8,NormalCP)图5以TDD8天线、normalCP为例描述了Tx描述符的配置.
所有的配置域都是静态的,也就是说,只需要在小区建立或重配时配置,实时运行过程中无需修改.
大部分配置域的取值对上行前端FFT应用来说是确定的,也有一些域的配置具有一定程度的灵活度,可根据算法、软件框架、资源分配等方面的考虑灵活配置,这些域在图5中用下划线标识,并说明如下.
ReturnQ和flow根据应用的硬件资源分配进行配置.
为了尽可能节省内存,这个例子为AIF接收数据使用符号级乒乓缓存.
挂在Tx描述符上的buffer指针根据该描述符对应的【符号,天线】指向16个buffer中的一个.
AIF使用的是monolithic描述符,这种描述符的净荷直接跟在描述符头的后面.
为了避免数据搬移,FFTCTx描述符的buffer指针直接指向AIFRxmonolithic描述符中净荷的起始位置.
注意,即使不按符号乒乓设计AIF接收数据缓存,其它方面的设计无需变化,只影响Tx描述符中buffer指针的配置.
这个例子使用了FFTC的动态scaling功能,使FFT计算过程完全不发生饱和截位,同时每步蝶形运算的输入数据都有最大有效位宽,因而获得最高的计算精度.
此时,每个【符号,天线】ZHCA538在KeyStone器件上实现高效的LTE上行基带前端处理11的FFT输出数据块的定标各不相同,应用应使能FFTC的sideinformation输出,该信息包括FFTC内部实际执行的各级scaling的总和,应用在随后的信道估计、测量、均衡处理中应考虑到各【符号,天线】上的scaling的不同,执行必要的定标对齐.
应用也可以不使用动态scaling,直接配置各级蝶形运算之前的移位量.
无论使用动态还是静态scaling,都需要配置静态的outputscalingfactor参数.
该参数限制了FFT输出I/Q分量的最大幅度,应用可根据随后的信道估计和均衡所执行的计算,分别限制导频符号和数据符号的FFT输出最大幅度,使随后的计算在不出现饱和或溢出的情况下具有尽可能高的有效数据位宽.
这个例子把outputscalingfactor配置成了0x40,这使得输出数据的I/Q分量最大幅度是Q15定标下的1/2,也就是说,输出复样本的最大幅度是Q15定标下的1.
不使用动态scaling时,通常不需要使能sideinformation输出.
上行前端FFT通过将Rx描述符push进相应的QPendRxQ来通知c66x核,从而启动信道估计或均衡.
在这个例子中,一个核处理天线0~3的信道估计,另一个核处理天线4~7的信道估计,因此:每个导频符号上的天线3的Rx包被push进一个QPendQ,触发前一个核上的信道估计;每个导频符号上的天线7的Rx包被push进另一个QPendQ,触发后一个核上的信道估计.
另外,子帧中最后一个符号上的天线7的Rx包被push进第3个QPendQ,该QPendQ触发均衡.
剩下的所有【符号,天线】对应的Rx包进一个GeneralPurposeQ.
对不同的核间分工,触发c66x核的细节也会不同,但只影响Tx描述符中的destinationQ的配置,其它方面的设计不变.
o本设计用FFTC提供的destinationQ本地配置域指定RxQ.
其实还可以把FFTC本地配置中的destinationQ配置成无效值(0x3FFF),然后配置多个flow,为每个flow配置不同的destinationQ,并为每个【符号,天线】的Tx描述符指定相应的flow.
o如果一个上行子帧的最后一个符号是SRS符号,当PUSCH和SRS由不同的核处理时,收到QPend中断的PUSCH核应向SRS核发送核间中断,触发后者的SRS处理.
UpPTS使用和上行子帧不同的flow.
UpPTS符号统一由一个核来处理,每个UpPTS符号的最后一根天线对应的Rx包触发对该符号的处理.
UpPTS也采用符号级乒乓缓存,且和上行子帧共用缓存,但需要注意,当UpPTS仅含一个符号时,该符号使用的是乓(而非乒)缓存.
ZHCA53812在KeyStone器件上实现高效的LTE上行基带前端处理Hostpacketdescriptor:Staticfields,configuredduringdriverinit.
@Hostdescriptorisused.
@LinkedpacketisreturnedbyTxPktDMAasawhole.
@ThereturnqueueistheallocatedQ.
@ThenextdescriptorpointerisNULL.
@TheflowIDistheallocatedvalue.
@PSflag:controlheaderpresent,nodebughalt,noEOPinterrupt.
@PSwordspresentandlocateindescriptor.
@PSwordcountisto6.
@BufferpointerpointstotheassociatedaddressintheMSMCbufferpoolforULfront-endFFTinput.
@PacketlengthandbufferlengthareboththetotalnumberofCPsamplesandvalidsamplesmultipliedby4.
@Controlheader:>Localconfigurationdatapresent.
>DFTsizeslistnotpresent.
>Pass-throughdatanotpresent.
@Localconfiguration:>Noinputshift.
>Outputleft-rightshiftisenabled.
>LTEfrequencyshiftisenabledwithfourparameterssetaccordingtothecellbandwidth.
>Dynamicscalingisenabled.
>Outputscalingfactoris0x40(inQ7).
>CPadditionisdisabled.
>CPremovalisenabledwith0offset.
>Sideinformationisenabled.
>DFTmodeisused.
>Zeropaddingisdisabled.
>FFTsizeindexissetaccordingtothecellbandwidth.
>DestinationqueueissettoRxQPendQ0for(pilotsymbol,antenna3),RxQPendQ1for(pilotsymbol,antenna7),RxQPendQ2for(thelastdatasymbol,antenna7),orRxGeneralQ0fortheothers.
Front-endFFTTxpacket0~14*8-1forULTTIAntenna1Antenna2Antenna3Antenna4Antenna5Antenna6Antenna7Antenna0Antenna1Antenna2Antenna4Antenna5Antenna6Antenna7PINGPONGSL2Bufferpointer(example)(2048+160)*4+32=8864BperbufferBufferpointer(example)Antenna0Antenna3Hostpacketdescriptor:Staticfields,configuredduringdriverinit.
ThesameastheTxdescriptorforULTTIexceptthebelowfields.
@TheflowIDistheallocatedvalue.
@IfN_UPPTS_SYM=1,onlypongbuffersareused.
IfN_UPPTS_SYM=2,thefirstsymbolpointstopingandthesecondtopong.
@Localconfiguration:>DestinationqueueissettoRxQPendQ3for(UpPTSsymbol,antenna7),orRxGeneralQ0fortheothers.
Front-endFFTTxpacket0~N_UPPTS_SYM*8-1forUpPTS图5:上行前端FFTTx描述符配置(例子:同图2)2.
2FFTCRx侧设计在Tx侧,在一个符号内接收到的时域天线数据可以由FFTC在下一个符号内处理完毕,因此可以使用符号级乒乓缓存.
在Rx侧,FFTC输出的频域数据需要被PUSCH、PUCCH、SRS接收机处理,其中PUSCH和PUCCH处理不是符号级的,需要对整个子帧的数据做综合处理,且处理时间较长,理论上只要在该子帧全部收齐后1ms内处理完即可.
因此,Rx侧数据的生存期较长,需要使用子帧级乒乓缓存.
如前所述,在图2所示的例子中,上行前端FFT之后,PUSCH导频符号按天线在双核间分工,PUSCH数据符号按时隙分工.
数据符号按时隙分工的优点是:当使用IRC均衡算法时,每个RB的所有RE共用一个噪声干扰空间相关阵Rn,因此,把一个RB的所有RE的处理集中在一个核上,有利于核尽可能多地复用加载到寄存器中的Rn元素,执行效率更高;当不做时域信道估计内插时,ZHCA538在KeyStone器件上实现高效的LTE上行基带前端处理13一个子载波在一个时隙内的6个数据RE共用一个信道估计矩阵H,因此,把一个子载波在一个时隙内的所有RE的处理集中在一个核上,有利于核尽可能多地复用加载到寄存器中的H元素,执行效率更高.
对不同的核间分工,基本设计不变,只是Rx描述符中的buffer指针会有不同的配置,宗旨是尽量把FFT输出数据直接送到将要处理该数据的那个核的LL2,以使随后的处理有尽可能高的执行效率.
和Tx侧类似,在Rx侧,用Acc对RxGeneralQ中的描述符进行自动回收,但不需要产生Acc中断或EDMA事件.
为了正常工作,Acc要求在一个乒或乓ListBufferPage满了之后,向InterruptNCount寄存器写1,作为应用对Acc的响应.
因为不需要产生Acc事件,响应时不需要写EOI寄存器.
Tx侧的响应由EDMA完成,Rx侧的响应由核完成.
对FDD,Rx侧的Acc响应周期是一个子帧;对TDDUL/DL配置0~5,响应周期是UL/DL切换周期;对TDDUL/DL配置6,响应周期是10ms.
对FDD,Rx侧的Acc响应在"TTI配置函数"中实现;对TDD,该响应在"UpPTS配置函数"中实现.
"TTI配置函数"和"UpPTS配置函数"的主要任务是修改Rx描述符中的动态域,并完成RxFDQ入队,参见后面关于Rx描述符配置的部分.
注意,Acc不处理进入QPendQ的Rx描述符——如图2所示,这些Rx描述符的回收由中断处理函数执行.
为了尽量减少实时运行时修改Rx描述符所引入的开销,为两个子帧内的每个【符号,天线】分配一组FFTCRx描述符.
当软件架构要求FFT输出的PUSCH和PUCCH数据分开存放时,每个Rx包由5个描述符链接而成;当不要求这样的PUSCH/PUCCH数据分离时,每个Rx包由3个描述符链接而成.
因此,总共需要分配的Rx描述符个数是2symA5或2symA3.
每个Rx描述符的大小是32B.
一次FFT的输出数据块格式如图6所示——先是16字节的sideinformation(如果使能的话),然后是低频侧保护子载波,接着是PUCCH低频侧RB、PUSCHRB、PUCCH高频侧RB,最后是高频侧保护子载波.
FFTC的RxPktDMA不能自动去除两边的保护子载波.
为了减少内存占用,可以让所有FFT输出数据块的左侧和右侧保护段都输出到同一块内存中.
UselessguarddataPUCCHRBsPUSCHRBsPUCCHRBsUselessguarddata424subcarriers424subcarriers1200subcarriersSideinfo16B图6:上行前端FFTRxbuffer结构(例子:20M,动态scaling)对PUSCH/PUCCH数据分离的情况,图7以动态scaling为例描述了上行子帧Rx描述符的配置.
RxPktDMA为每个FFT输出块从RxFDQ中pop出5个描述符,将这5个描述符链接成一个Rx包,按顺序将输出数据块(包括sideinformation)写入这5个描述符提供的5个buffer,再将这个包的SOP描述符(也就是构成这个包的第一个描述符)push到RxQ中.
因为每个上行子帧中实际承载PUCCH的RB数是动态变化的(实际上,频段外侧用于2类格式的RB数是半静态配置的,内侧用于1类格式的RB数动态变化的),所以,用于PUSCH和PUCCH的Rx描述符中的originalbufferlength域需要根据当前上行子帧实际包含的PUCCHRB数进行修改.
另外,当存在位于上行子帧的SRS符号,且软件架构要求SRS使用和PUSCH最后一个数据符号不同的buffer时,上行子帧中最后一个符号对应的用于PUSCH的Rx描述符中的originalbufferpointer域也需要根据该符号属于PUSCH还是SRS动态更新.
注意,SRS符号上的PUCCHRB数和非SRS符号可能不同(SRS可能使PUCCH1类格式采用协议中定义的shortened格式).
上行子帧Rx描述符动态域的修改以及它们的RxFDQ入队操作都在"TTI配置函数"中完成,该函数必ZHCA53814在KeyStone器件上实现高效的LTE上行基带前端处理须在相应上行子帧开始之前、在该上行子帧之前使用相同的乒或乓描述符集合的最近上行子帧结束之后调用.
为降低核负载,TTI配置函数用EDMA完成Rx描述符的修改和入队,启动后无需等待传输结束,最多需要3个EDMA通道,分别对应非最后一个符号的Rx描述符修改、最后一个符号的Rx描述符修改、Rx描述符入RxFDQ.
在图7中,对乒或乓,高频侧保护段的输出地址是固定的,低频侧保护段的输出地址按照FFTC实际处理的【符号,天线】顺序从左向右递进,每次增加16B,目的是保存一个子帧中每个【符号,天线】对应的sideinformation.
Sideinformation区域必须是子帧级乒乓的,导致保护段区域也不得不按乒乓分配.
当不要求PUSCH和PUCCH数据分离时,每个Rx包由3个描述符链接而成,PUCCH位于每个buffer的两侧.
Front-endFFTRxpacket0~2*Nsym*NA-1forULTTI,whereeachpacketisconstructedby5connectedbuffersHostpacketdescriptor:Staticfields,configuredduringdriverinit.
@Originalbufferpointerpointstotheassociatedstaticbuffer.
@Originalbufferlengthissettothenumberofguardsubcarriersatonesideofthebandmultipliedby4plus0(fixedscaling)or16(dynamicscaling).
SideinfoandleftguardHostpacketdescriptor:Staticfields,configuredduringdriverinit.
@Originalbufferpointerpointstotheassociatedstaticbuffer.
Dynamicfields,changedduringruntimeconfiguration.
@OriginalbufferlengthissettothenumberofPUCCHsubcarriersatonesideofthebandmultipliedby4.
LeftPUCCHHostpacketdescriptor:Staticfields,configuredduringdriverinit.
@Originalbufferpointerfornon-lastsymbolpointstotheassociatedstaticbuffer.
Dynamicfields,changedduringruntimeconfiguration.
@OriginalbufferpointerforthelastsymbolswitchesbetweenPUSCHbufferandSRSbuffer.
@OriginalbufferlengthissettothenumberofPUSCHsubcarriersmultipliedby4.
PUSCHorSRSHostpacketdescriptor:Staticfields,configuredduringdriverinit.
@Originalbufferpointerpointstotheassociatedstaticbuffer.
Dynamicfields,changedduringruntimeconfiguration.
@OriginalbufferlengthissettothenumberofPUCCHsubcarriersatonesideofthebandmultipliedby4.
RightPUCCHHostpacketdescriptor:Staticfields,configuredduringdriverinit.
@Originalbufferpointerpointstotheassociatedstaticbuffer.
@Originalbufferlengthissettothenumberofguardsubcarriersatonesideofthebandmultipliedby4.
RightguardLinkedbyRxPktDMALinkedbyRxPktDMALinkedbyRxPktDMALinkedbyRxPktDMAPingPongSL2SideinfoGuardSideinfoGuardBufferpointerBufferpointerBufferpointerDataorpilotbufferinLL2ofPUSCHc66xcoresAnt0PUCCHbufferAntNA-1Sym0Ant0AntNA-1SymNsym-1PingAnt0AntNA-1Sym0Ant0AntNA-1SymNsym-1Pong………………………………BufferpointerBufferpointerNPUCCH,maxRBx12subcarriersBufferinLL2ofSRSc66xcoresBufferpointer图7:前端FFT的上行子帧Rx描述符配置(例子:动态scaling)图8以动态scaling为例描述了UpPTSRx描述符的配置.
和上行子帧相比,UpPTS没有PUSCH/PUCCH分离的问题,所以一个Rx包总是由3个描述符链接而成,而且描述符的所有域都是静态域,不需要动态修改.
UpPTSRx描述符的RxFDQ入队操作在"UpPTS配置函数"中完成,该函数必须在相应UpPTS开始之前、前一个UpPTS结束之后调用.
为降低核负载,用ZHCA538在KeyStone器件上实现高效的LTE上行基带前端处理15EDMA完成描述符入队.
注意,对TDDUL/DL配置6,"UpPTS配置函数"每半帧调一次,但Rx侧Acc响应每10ms只需执行一次.
Front-endFFTRxpacket0~NUpPTS,sym*NA-1forUpPTS,whereeachpacketisconstructedby3connectedbuffersHostpacketdescriptor:Staticfields,configuredduringdriverinit.
@Originalbufferpointerpointstotheassociatedstaticbuffer.
@Originalbufferlengthissettothenumberofgarbagesubcarriersatonesideofthebandmultipliedby4plus0(fixedscaling)or16(dynamicscaling).
SideinfoandleftguardHostpacketdescriptor:Staticfields,configuredduringdriverinit.
@Originalbufferpointerpointstotheassociatedstaticbuffer.
@Originalbufferlengthissettothenumberofvalidsubcarriersmultipliedby4.
ValidsubcarriersHostpacketdescriptor:Staticfields,configuredduringdriverinit.
@Originalbufferpointerpointstotheassociatedstaticbuffer.
@Originalbufferlengthissettothenumberofgarbagesubcarriersatonesideofthebandmultipliedby4.
RightguardLinkedbyRxPktDMALinkedbyRxPktDMASL2SideinfoGuardBufferpointerBufferpointerBufferpointerUpPTSbufferinLL2ofUpPTSc66xcores图8:前端FFT的UpPTSRx描述符配置(例子:动态scaling)图9以单片TCI6634K2K/TCI6638K2K实现3载扇为例描述了从QPend事件到核中断的传递路径实例.
在这个例子中:分配给每载扇的3个QPendQ的Q编号分别是652/653/654、655/656/657、658/659/660.
每个核的QPend中断索引都是10.
核0/1、2/3、4/5分别处理三个载扇的PUSCH.
PUSCH导频符号按天线分工,数据符号按时隙分工.
每对核中的第一个核只需接收导频符号上第NA21(从0开始编号)根天线对应的QPend中断(触发信道估计,而均衡可以在第二个时隙的信道估计完成后立即执行);第二个核既要接收导频符号上最后一根天线对应的QPend中断(触发信道估计),还要接收最后一个数据符号上最后一根天线对应的QPend中断(触发均衡).
核6处理前载扇0和2的PUCCH,核7处理载扇1的PUCCH.
因此,每个QPendQ654/657/660事件要传递到2个核(载扇0是核1和核6,载扇1是核3和核7,载扇2是核5和核6).
关于TCI6634K2K/TCI6638K2K的内部事件路由,参见[19].
关于CIC(ChipInterruptController),参见[20].
ZHCA53816在KeyStone器件上实现高效的LTE上行基带前端处理QMSS_QUE_PEND_652CIC0INTCofc66xCorePac087410INTCofc66xCorePac17410INTCofc66xCorePac27410INTCofc66xCorePac37410FixedmappingConfigurablemappingQPendINT47QMSS_QUE_PEND_65391QMSS_QUE_PEND_6549395QMSS_QUE_PEND_655CIC_OUT8_PLUS_16_MUL_NQPendINTCIC_OUT8_PLUS_16_MUL_N24QPendINTCIC_OUT8_PLUS_16_MUL_N40QPendINTCIC_OUT8_PLUS_16_MUL_N56CIC18QMSS_QUE_PEND_65847QMSS_QUE_PEND_65991INTCofc66xCorePac47410QPendINTINTCofc66xCorePac57410QPendINTCIC_OUT8_PLUS_16_MUL_NCIC_OUT8_PLUS_16_MUL_N97151QMSS_QUE_PEND_656QMSS_QUE_PEND_657QMSS_QUE_PEND_66093QMSS_QUE_PEND_654QMSS_QUE_PEND_657294297INTCofc66xCorePac67410QPendINTCIC_OUT8_PLUS_16_MUL_NINTCofc66xCorePac77410QPendINTCIC_OUT8_PLUS_16_MUL_N40560565624CIC_OUT0CIC_OUT0图9:QPend事件传递路径举例(单片TCI6634K2K/TCI6638K2K实现3载扇)ZHCA538在KeyStone器件上实现高效的LTE上行基带前端处理172.
3硬件资源需求对每个载扇,上行前端FFT所需的硬件资源如下:1个FFTC实例.
该FFTC实例上的1个Tx/Rx通道(和该FFTC实例的一个TxQ绑定).
1个用于上行子帧的flow.
TDD时,还需1个用于UpPTS的flow.
1个TxreturnQ,1个用于上行子帧的RxFDQ,1个RxGeneralQ,若干个RxQPendQ(具体个数由核间分工确定,比如:当PUSCH双核处理,PUCCH在另一个核上处理时,需要3个;当单核处理单载扇时,只需1个).
TDD时,还需1个用于UpPTS的RxFDQ.
symA个用于上行子帧的Tx描述符.
TDD时,还需UpPTS,symA个用于UpPTS的Tx描述符.
每个Tx描述符的大小是64B.
2symA5(要求PUSCH/PUCCH数据分离时)或2symA3(不要求数据分离时)个用于上行子帧的Rx描述符.
TDD时,还需UpPTS,symA3个用于UpPTS的Rx描述符.
每个Rx描述符的大小是32B.
用于Tx和Rx描述符回收的Acc所使用的PDSP实例.
用于Tx描述符回收的Accumulator通道,用于Rx描述符回收的Accumulator通道.
Tx侧TxQ入队EDMA用到的1个CC实例,1个TC实例,1个EDMA通道,3(FDD)、5(TDDUL/DL配置0~5)或8(TDDUL/DL配置6)个PaRAMset.
Rx侧为上行子帧用到了3个EDMA通道,分别对应非最后一个符号的Rx描述符修改、最后一个符号的Rx描述符修改、RxFDQ入队.
每类操作涉及1个CC实例,1个TC实例,1个EDMA通道,1个PaRAMset.
RxFDQ入队也可以改用QDMA,其它两类操作涉及3D搬移,只能用EDMA.
TDD时,只要在使用时间上不冲突,针对上行子帧和针对UpPTS的操作可以合用一套资源.
Acc内存资源:o用于Tx描述符回收的ListBufferPage:FDD时,以子帧为单位乒乓,总大小为2symA+14字节.
TDDUL/DL配置0~5时,以UL/DL切换周期为单位乒乓,总大小为2symTTI+UpPTS,symA+14字节,其中TTI表示一个UL/DL切换周期包含的上行子帧数.
TDDUL/DL配置6时,以10ms为单位乒乓,总大小为25sym+2UpPTS,symA+14字节.
o用于Rx描述符回收的ListBufferPage:ZHCA53818在KeyStone器件上实现高效的LTE上行基带前端处理FDD时,以子帧为单位乒乓,总大小为2symATTI,QPend+14字节,其中TTI,QPend表示一个上行子帧中进入QPendQ的Rx包个数.
TDDUL/DL配置0~5时,以UL/DL切换周期为单位乒乓,总大小为2symATTI,QPendTTI+UpPTS,symAUpPTS,QPend+14字节,其中UpPTS,QPend表示一个UpPTS中进入QPendQ的Rx包个数.
TDDUL/DL配置6时,以10ms为单位乒乓,总大小为2symATTI,QPend5+UpPTS,symAUpPTS,QPend2+14字节.
只要处理能力足够,多个载扇可以共用一个FFTC实例、一个CC甚至TC实例.
多扇区通常共用一个AccPDSP实例.
所有用于通知某个核或某组核的QPend事件可以来自同一个QPendQ,软件通过从中pop出的描述符地址辨别事件类型.
其它资源通常不适合多载扇共用,需要为每个载扇单独分配.
2.
4C66x核负载测量采用本设计,大部分配置工作在小区建立或重配时完成,需要在实时运行过程中调用的函数仅限于TTI配置函数和UpPTS配置函数.
表1给出了TTI配置函数的实测cycle数.
TTI配置函数的任务主要是响应Acc以及配置/启动用于Rx描述符修改和入队的3个EDMA,因为无需等待EDMA传输结束,所以该函数的负载和天线数无关.
UpPTS配置函数的负载比TTI配置函数更低,此处从略.
本测试使用TCI6638K2KEVM;L1P/L1Dcache初始状态都为cold,也就是说,函数开始执行时,代码和数据都不在L1cache中.
表1:TTI配置函数负载(coldcache)Cycle数PUSCH/PUCCH分离788PUSCH/PUCCH不分离3513PRACH前端时频转换图10给出了PRACH接收机的流程图,本章描述的PRACH前端时频转换包括去CP和转换至频域这两个步骤.
图10:PRACH接收机流程图本文用短RACH指代PRACHpreamble格式4,用长RACH指代其它格式.
表2给出了各种小区带宽情况下,长、短RACH的前端时频转换所需的DFT原始长度.
下面分情况描述时频转换方案设计:CPremovalConversiontofrequencydomainMatchedfilterinfrequencydomainPowerdelayprofilecombiningSignaturedetectionPerRxantenna(1,2,4,8)PerRootsequence(1,2,.
.
.
,64)ConversiontotimedomainPerRootsequence(1,2,.
.
.
,64)ZHCA538在KeyStone器件上实现高效的LTE上行基带前端处理19长RACH:o对20、15、10MHz小区,FFTC不支持DFT原始长度,需要采用间接的时频转换法,具体分为两种:大点DFT法.
该方法主要使用FFTC,辅以少量的核处理,直接完成一个大点数的DFT.
参见3.
1节.
混合法.
该方法使用核完成下变频和滤波降采样,然后用FFTC在降低后的采样率上执行小点DFT.
参见3.
2节.
o对更窄带宽的小区,可以直接用FFTC执行DFT.
参见3.
3节.
短RACH:o总是可以直接用FFTC执行DFT.
参见3.
4节.
表2:PRACH前端时频转换DFT原始长度带宽(MHz)长RACH短RACH202457640961518432307210122882048561441024330725121.
415362563.
1长RACH——大点DFT法本节先描述原理,再给出实现方案.
3.
1.
1原理一个长度为N的序列()的N点DFT定义为X()=()WNN1=0;=0,1,,N1其中是时间索引,是频率索引,WN=2N.
大点DFT法直接实现一个长度超过FFTC支持范围的FFT.
用于实现快速DFT的FFT算法通常可以分为时域抽取法(DIT)和频域抽取法(DIF)两类.
当计算完整的DFT时,DIT和DIF的计算复杂度是一样的.
但是,PRACH前端时频转换实际上只需要计算一部分X(),比如,对20MHz小区、频域仅1个opportunity的情况,N=24576,但真正需要的X()只有839点.
通过对比分析可知,只有DIT可以利用到这个应用特性降低核负载.
因此,我们选择采用DIT法.
DIT法将一个N点DFT分解成P个N/P点DFT的方式为X()=(P)WNPNP1=0+WN(P+1)WNPNP1=0++WN(P1)(P+P1)WNPNP1=0ZHCA53820在KeyStone器件上实现高效的LTE上行基带前端处理定义()=(P+);=0,1,,NP1,下标=0,1,,P1,定义F()是()的N/P点DFT,并注意到WNP=WNP,可得X()=F0()+WNF1()++WN(P1)FP1()进一步地,定义=′+′NP,′=0,1,,NP1,′=0,1,,P1,因为F()以N/P为周期,且WN=WN′+′NP=WP′WN′,X()可以拆分成如下的多个表达式X(′)=F0(′)+WP0WN′F1(′WP0(P1)WN(P1)′FP1(′)X′+NP=F0(′)+WP1WN′F1(′WP1(P1)WN(P1)′FP1(′)X′+(P1)NP=F0(′)+WPP1WN′F1(′WP(P1)(P1)WN(P1)′FP1(′)其中′=0,1,,NP1.
这组表达式可以用图11表示,并描述如下:1.
对输入N点序列做P点抽取,获得P个子序列,每个子序列的长度是N/P.
2.
分别对P个子序列做N/P点DFT运算,得到F(),=0,1,,P1,=0,1,,NP1.
3.
第p个子序列F()点乘WN.
4.
对第3步输出的P个子序列,执行P点"块DFT",相当于每次取P个子序列相同位置上的点,构成一个P点序列,然后对该P点序列执行P点DFT,第m次P点DFT输出的P个结果对应X(),X(+N/P),,X(+(P1)N/P).
x(0),x(P),x(2P)x(N-P)x(1),x(P+1),x(2P+1),.
.
.
,x(N-P+1)x(P-1),x(2P-1),x(3P-1),.
.
.
,x(N-1)N/P-pointDFTN/P-pointDFTN/P-pointDFT……F0(k)F1(k)FP-1(k)WNkF1(k)WN(P-1)kFP-1(k)x(p),x(P+p),x(2P+p),.
.
.
,x(N-P+p)N/P-pointDFTFp(k)WNpkFp(k)……F0(k)………………………………X(0),X(1),X(2),.
.
.
,X(N/P-1)X(N/P),X(N/P+1),X(N/P+2),.
.
.
,X(2N/P-1)X(pN/P),X(pN/P+1),X(pN/P+2),.
.
.
,X((p+1)N/P-1)…………X((P-1)N/P),X((P-1)N/P+1),X((P-1)N/P+2)X(N-1)Block-wiseP-pointDFT图11:DIT大点DFT原理ZHCA538在KeyStone器件上实现高效的LTE上行基带前端处理21对20MHz小区,按照FFTC支持的DFT长度对整个24576点序列做分割,有24576=8192*3=6144*4=4096*6=3072*8=2048*12=……,对应的抽取因子P分别是3、4、6、8、12等.
对P的选取应综合考虑以下因素:C66x核负载.
P越大,步骤3和4涉及的计算量就越大.
抽取EDMA的配置复杂度.
如前一章所述,AIF收到的上行时域天线数据是按符号乒乓缓存的,为了用EDMA完成P点抽取,最直接的方法是在FFT入队EDMA完成后,触发另一个EDMA把当前符号的时域数据以P点抽取的方式搬到别的地方去.
为了EDMA配置的简单性,一个符号内的样本数最好是P的倍数.
对20M小区、normalCP场景,为了满足此需要,P只能等于1、2、4、8、16.
FFTC执行效率.
根据[21],1GHzKeyStone器件上的一个FFTC的流量在DFT长度为8192、6144、4096、3072、2048时分别为378、360、437、413、431Msps.
不同长度对应的流量有较为可观的差异,比如,4096点时的流量比6144点时高21.
4%.
综合考虑以上因素,本文推荐使用P=4作为20MHz小区的抽取因子,对应6144点DFT.
对15和10MHz小区,假设采样率按带宽等比下降,则PRACH序列长度从20M时的24576降为18432和12288.
对这两类小区带宽,分别使用P=3和2,而保持6144作为DFT点数.
这样的选择偏向更轻的核负载和EDMA配置简单性,牺牲了一些FFTC执行效率.
3.
1.
2实现如上所述,基于DIT的大点DFT有4个处理步骤.
实现时,步骤1(P点抽取)由EDMA完成,步骤2由FFTC完成,步骤3和4由c66x核完成.
抽取EDMA需要用到2个EDMA通道,分别称为trigger通道和working通道.
图12以"TDDUL/DL配置1,PRACH配置10,20MHz,NormalCP"为例给出了抽取EDMA的配置细节.
根据附录A,在该系统配置下,trigger通道需要7个EDMAPaRAMset来响应上行前端FFT产生的长RACH触发事件.
第1个PaRAMset只用一次,用于响应系统初始化后最初的若干上行子帧符号对应的事件.
之后的6个PaRAMset以10ms为周期重复使用,用于处理该系统配置下一个无线帧包含的3个opportunity,以及相邻opportunity之间不承载PRACH数据的上行子帧符号.
对不承载PRACH的上行子帧符号,相应的长RACH触发事件不触发实际操作,本文称这样不承载实际数据搬移任务的EDMA为dummy类型的EDMA.
对承载PRACH的上行子帧符号,相应的长RACH触发事件通过trigger通道的chain机制间接触发working通道,并且在触发working通道之前先用trigger通道修改working通道将要用到的PaRAMset中的符号级动态域.
Working通道需要NA+3个PaRAMset.
第1个PaRAMset只用到1次,属于dummy类型的.
后面的NA+2个PaRAMset以link加self-chain的方式,以上行子帧符号为周期重复使用.
对每个上行子帧符号,先执行1个dummy类型的PaRAMset,用于确保trigger通道对接下来的NA+1个PaRAMset的动态域的修改已经完成.
接下来的NA个PaRAMset用于完成NA根天线的P点抽取.
最后1个PaRAMset用于在整个序列的最后一个符号处执行FFTCTxQ入队操作,非序列最后一个符号对应的该PaRAMset属于dummy类型.
ZHCA53822在KeyStone器件上实现高效的LTE上行基带前端处理Working通道的后NA+1个PaRAMset中的动态域包括SRC、DST和BCNT.
Trigger通道为每个上行子帧符号执行一次对这NA+1个working通道PaRAMset的动态更新,数据源位于内存中,称为PaRAMsetLUT,其内容在小区初始化或重配时由驱动软件配置.
对图12示例之外的其它系统配置,基本原理是类似的,但细节上有一些差别.
Trigger通道用到的PaRAMset个数等于附录A表格中"EDMA分段"列给出的值加1.
Trigger通道的每个PaRAMset负责响应的上行子帧符号数等于附录A表格中"初始Dummy符号数"列或"EDMA段内符号数"列给出的值.
对dummy类型的PaRAMset,这个值配置到BCNT;对其它PaRAMset,配置到CCNT.
对PRACH格式0和1,一个抽取目的buffer包含1个PRACH序列,仅需为最后一个符号执行FFTC入队操作.
对PRACH格式2和3,一个抽取目的buffer包含2个序列.
此时,为了在一个序列收齐之后立刻启动FFTC,需要为每个序列的最后一个符号执行FFTC入队操作.
这些都通过配置PaRAMsetLUT实现.
对PRACH格式0,如果两个相邻的上行子帧都承载了PRACH,需要分配两个抽取目的buffer,以子帧为单位乒乓使用.
此时,每个buffer有自己的PaRAMsetLUT.
对其它PRACH格式,一个buffer就够了,但格式2和3的一个buffer实际上包含2个序列.
对PRACH格式2和3,不能把一个opportunity的两个序列的抽取输出连续排列,这是因为DCIDX域最大只有16位(包括符号位),连续排列的话正好超出了表达范围.
对PRACH格式2和3,为了让两个序列各自放在连续的内存中,需要对两个序列交接处的那个符号的抽取EDMA做特殊处理.
为此,对working通道,在原有的NA+3个PaRAMset的基础上增加NA个,这些新增的PaRAMset不需要动态更新,负责处理交接符号中属于后一个序列的部分的抽取,而原有的用于抽取的NA个PaRAMset现在只处理属于前一个序列的部分.
这两组PaRAMset以相互交织的方式link和self-chain,为此,LINK必须成为动态更新域,以便动态改变link目标.
ZHCA538在KeyStone器件上实现高效的LTE上行基带前端处理23TriggerChannelWorkingChannelOPT=A-syncSRC=DummyByteAddrBCNT=1ACNT=1DST=DummyByteAddrDBIDXSBIDXBCNTRLDLINKDCIDXSCIDXRsvdCCNT=1InitDummyOPT=A-syncSRC=DummyByteAddrBCNT=1ACNT=1DST=DummyByteAddrDBIDXSBIDXBCNTRLDLINKDCIDXSCIDXRsvdCCNT=1WaitDummyOPT=AB-syncSRCBCNTACNT=4DSTDBIDX=4SBIDX=16BCNTRLDLINKDCIDX=24576SCIDX=4RsvdCCNT=4Decimation(Ant0)OPT=AB-syncSRCBCNTACNT=4DSTDBIDX=4SBIDX=16BCNTRLDLINKDCIDX=24576SCIDX=4RsvdCCNT=4Decimation(AntNA-1)FinalFinalMappingSym1(1232W)Sym12(1408W)BufferX(X=1,2)SRCDSTBCNT/ACNT(PongSymAddrofAnt0)+960W(BufXAddrofAnt0)(2192-960)/44(PongSymAddrofAntNA-1)+960W(BufXAddrofAntNA-1)2192/44PingSymAddrofAnt0(BufXAddrofAnt0)+23168B1408/44PingSymAddrofAntNA-1(BufXAddrofAntNA-1)+23168B1408/44PaRAMsetLUTOPT=A-syncSRC=DummyByteAddrBCNT=15ACNT=1DST=DummyByteAddrDBIDXSBIDXBCNTRLDLINKDCIDXSCIDXRsvdCCNT=1InitDummyMappingOPT=AB-sync,intermediate/finaltransfercompletionchainingenabledSRC=PseudoParamAddr_1BCNT=NA+1ACNT=12DST=ParamAddrDBIDX=32SBIDX=12BCNTRLDLINKDCIDX=0SCIDX=12*(NA+1)RsvdCCNT=12Buf1OPT=A-syncSRC=DummyByteAddrBCNT=2ACNT=1DST=DummyByteAddrDBIDXSBIDXBCNTRLDLINKDCIDXSCIDXRsvdCCNT=1Dummy1OPT=AB-sync,intermediate/finaltransfercompletionchainingenabledSRC=PseudoParamAddr_2BCNT=NA+1ACNT=12DST=ParamAddrDBIDX=32SBIDX=12BCNTRLDLINKDCIDX=0SCIDX=12*(NA+1)RsvdCCNT=12Buf2Dummy3LongRACHtriggereventinULsubframe(15events)LongRACHtriggereventinULsubframe(12events)LongRACHtriggereventinULsubframe(2events)LongRACHtriggereventinULsubframe(12events)LongRACHtriggereventinULsubframe(16events)PseudoParamAddr_XParamAddrOPT=A-syncSRC=DummyByteAddrBCNT=16ACNT=1DST=DummyByteAddrDBIDXSBIDXBCNTRLDLINKDCIDXSCIDXRsvdCCNT=1IntermediateExample:TDDUL/DLconfiguration1,PRACHconfiguration10,20MHz,NormalCPOPT=A-syncSRC=DummyByteAddrBCNT=2ACNT=1DST=DummyByteAddrDBIDXSBIDXBCNTRLDLINKDCIDXSCIDXRsvdCCNT=1Dummy2LongRACHtriggereventinULsubframe(2events)OPT=AB-sync,intermediate/finaltransfercompletionchainingenabledSRC=PseudoParamAddr_1BCNT=NA+1ACNT=12DST=NULLDBIDX=0SBIDX=0BCNTRLDLINKDCIDX=0SCIDX=12*(NA+1)RsvdCCNT=12Buf1LongRACHtriggereventinULsubframe(12events)Sym7(2208W)PongSymAddrofAnt0(BufXAddrofAnt0)+12192B2208/44PongSymAddrofAntNA-1(BufXAddrofAntNA-1)+12192B2208/44OPT=AB-syncSRCBCNT=4*NAACNT=4DSTDBIDX=0SBIDX=4BCNTRLDLINKDCIDXSCIDXRsvdCCNT=1FinalIntermediatePRACHfront-endFFTCenqueueNULLNULL10NULLNULL10DescriptoraddressarrayforBufferXRegDoftheFFTCTxQ4*NA4SRCDSTBCNT/ACNTSRCDSTBCNT/ACNT动态PaRAMset域静态PaRAMset域用于配置PaRAMset动态域的内存区LinkChain图12:抽取EDMA配置举例步骤2,也就是6144点DFT,由FFTC完成.
这一步采用原位操作以节省内存.
推荐采用动态scaling,此时每个6144点的buffer需要在头部多留出16B以容纳FFTC输出的sideinformation.
步骤3和4由核实现.
一个PRACHopportunity在频域占用6个RB,但并不是整个6RB带宽都被PRACH占用,因为两侧有相同宽度的保护频带.
图13给出了一个例子,其中,PRACH导频子载波被标记为红色.
ZHCA53824在KeyStone器件上实现高效的LTE上行基带前端处理图13:PRACH导频的频域位置对FDD,每小区在一个特定时刻最多只有1个opportunity,其起始物理RB索引是PRBRA=PRBoffsetRA,其中,PRBoffsetRA表示半静态的PRACH频偏参数.
对TDD,一个小区在一个特定时刻可以有多个opportunity,其中第RA个opportunity的起始物理RB索引是PRBRA=PRBoffsetRA+6RA2,ifRAmod2=0NRBUL6PRBoffsetRA6RA2,otherwise,其中NRBUL表示小区上行RB数.
假设一个PRACHopportunity的起始物理RB索引是PRBRA,以20MHz小区为例,它的第一个子载波在整个24576点DFT输出中的位置是start=(20481200)2+12PRBRA12+13+12288mod24576=144PRBRA+17389mod24576参考图11,假设该起始位置落在第0∈[0,P1]个大点DFT输出块内,在该块内的内部偏移是0,则0=start6144,0=startmod6144.
如果0≤6144839=5305,这个opportunity位于一个大点DFT输出块内;否则,这个opportunity跨越2个大点DFT输出块,其最后05305个点位于块1=(0+1)mod6的起始处.
如果该opportunity位于一个输出块内,核执行下面的计算Y()=X0(0+)=W40W24576(0+)3=0F(0+);=0,1,,838如果跨越2个块,计算Y()=X0(0+)=W40W24576(0+)3=0F(0+);=0,1,,61430a300a299DCa301a598a599a298Δfa302a303a304a367a368a369a370a371DCΔfφ=7a300a301a371ΔfRAUplink-RACH,10MHz,Δf=15000Hz,ΔfRA=1250Hz72xΔf=864xΔfRA(72x12=864)839xΔfRAExample:k0=0(nRAPRB=25)ZHCA538在KeyStone器件上实现高效的LTE上行基带前端处理25Y()=X1(6144+0)=W41W24576(6144+0)3=0F(6144+0);=61440,,838当FFTC为步骤2执行动态scaling时,核在处理步骤3和4时,除了上述公式描述的计算,还要执行定标对齐.
3.
1.
3硬件资源需求对每个载扇,PRACH前端时频转换所需的硬件资源如下:1个FFTC实例.
该FFTC实例上的1个Tx/Rx通道(和该FFTC实例的一个TxQ绑定).
1个flow.
1个TxreturnQ,1个RxFDQ,1个RxQPendQ.
XSAP个Tx描述符,其中S表示一个opportunity中的序列个数,X表示前面所说的抽取目的buffer个数(1或2,仅格式0在部分配置下取2).
每个Tx描述符的大小是32B.
Rx描述符的个数和Tx描述符一样.
每个Rx描述符的大小是32B.
抽取EDMA用到的1个CC实例,1个TC实例,2个EDMA通道.
Trigger通道需要的PaRAMset个数等于附录A表格的"EDMA分段"列取值加1,最大值等于11,发生在TDDUL/DL配置0、PRACH配置为15/16/17时.
对PRACH格式0或1,working通道需要NA+3个PaRAMset;对格式2或3,需要2NA+3个.
用于控制的内存资源:oPaRAMsetLUT,PRACH格式0或1时的大小是X(A+1)12字节,格式2或3时的大小是(A+1)20字节,其中表示一个opportunity的序列部分占用的符号数,如附录A中的表4所示.
o描述符地址数组(用于PRACH前端FFTC入队的源buffer),大小是Tx描述符个数乘以4字节.
只要处理能力足够,多个载扇可以共用一个FFTC实例、一个CC甚至TC实例.
所有用于通知某个核或某组核的QPend事件可以来自同一个QPendQ,软件通过从中pop出的描述符地址辨别事件类型.
其它资源通常不适合多载扇共用,需要为每个载扇单独分配.
3.
1.
4负载测量步骤3和4在c66x核上的硬件实测负载如表3所示,对应一个opportunity.
如果在频域有多个opportunity,则总cycle数要乘以opportunity个数.
本测试使用TMS320C6670EVM,内存配置是:输入、输出buffer都位于LL2;L1P/L1Dcache初始状态都为cold,也就是说,函数开始执行时,代码和数据都不在L1cache中.
ZHCA53826在KeyStone器件上实现高效的LTE上行基带前端处理表3:PRACH前端处理步骤3和4的硬件实测cycle数P=2P=4P=6P=82天线6,2709,43314,23420,9424天线12,42018,57827,97741,4918天线24,70536,66655,57982,6833.
2长RACH——混合法混合法的原理如图14所示.
C66x核负责下变频和低通滤波抽取,并启动FFTC完成降采样序列的DFT.
当频域有多个opportunity时,为每个opportunity分别执行整个处理流程.
降采样后的序列长度等于1536,20、15、10MHz小区分别对应16、12、8倍降采样.
图14:混合法原理C66x核处理任务可以每符号执行一次,也可以在一个PRACH序列收集完毕后执行一次.
前者的优点是节省内存;缺点是由多任务相互打断而导致的cache开销和任务切换开销,由"重叠相加"或"重叠保留"分段滤波带来的额外计算量,以及更频繁的中断开销.
反之,后者的优点是核开销较低,缺点是需要更多的内存.
对后者,如果因片内内存不够而需要把PRACH序列收集buffer放到DDR,则核开销方面的优点可能会被更低的内存访问效率抵消.
采用逐符号处理时,PRACH前端EDMA配置和图12之间的区别是:只用到了trigger通道,working通道及其PaRAMset不再需要.
原本用于触发working通道的事件现在用于触发核中断,相应的PaRAMset仅做dummy数据搬运.
采用逐序列处理时,PRACH前端EDMA配置和图12之间的区别是:Conversiontofrequencydomain.
.
.
.
.
.
DFTXe-j2π(position++6)tB.
.
.
PRACHdemappingNBUFFERNBUFFERNZCDataDataAAABBSpectrumofthetimedomainsamplesSpectrumofthetimedomainsamplesLow-passfilterwithdecimationNBUFFERABSpectrumofthetimedomainsamplesABNDFTDecimationintimedomainABNDFTZHCA538在KeyStone器件上实现高效的LTE上行基带前端处理27PaRAMsetLUT中的配置参数对应连续内存搬移,而非抽取操作.
Working通道用于FFTC入队的PaRAMset不再需要,而它之前的那个PaRAMset的final事件不仅触发self-chain事件,还产生核中断.
下变频和低通滤波抽取在c66x核上的硬件实测负载为:一个opportunity、一个序列、一根天线上的cycle数是55,958.
本测试使用TMS320C6670EVM,系统参数和内存配置是:20MHz小区,32阶滤波器;分为12段按重叠相加法处理;输入、输出buffer都位于LL2;L1P/L1Dcache初始状态都为cold.
注意,这里测量的负载没有包含多任务互相打断而导致的额外开销.

3.
3长RACH——直接DFT5、3、1.
4MHz小区中的长RACH使用直接DFT,因为根据表2,这些小区带宽下的DFT原始长度可以被FFTC直接处理.
此时,PRACH前端EDMA配置类似图12,唯一的区别是PaRAMsetLUT中的配置参数对应连续内存搬移,而非抽取操作.
直接DFT没有实时c66x核开销.
3.
4短RACHUpPTS的长度可以是1或2个符号,而短RACH仅在UpPTS长度是2个符号时才允许存在.
短RACH在UE侧UpPTS结束点之前4832Ts处发射,CP长度是448Ts,序列部分从第1个UpPTS符号的0Ts(normalCP)或736Ts(extendedCP)开始,长度是4096Ts.
如图4所示,前端FFT入队EDMA可以为UpPTS中的每个符号产生一个短RACH事件,该事件触发短RACH的working通道,完成数据搬移和FFTC入队.
短RACH的working通道使用4个PaRAMset,第一个用于初始dummy,接下来的两个分别用于两个符号的数据搬移,最后一个用于FFTC入队.
对每个载扇,短RACH前端时频转换所需的硬件资源如下:1个FFTC实例.
该FFTC实例上的1个Tx/Rx通道(和该FFTC实例的一个TxQ绑定).
1个flow.
1个TxreturnQ,1个RxFDQ,1个RxQPendQ.
NA个Tx描述符.
每个Tx描述符的大小是32B.
Rx描述符的个数和Tx描述符一样.
每个Rx描述符的大小是32B.
数据搬移EDMA用到的1个CC实例,1个TC实例,1个EDMA通道,4个PaRAMset.
用于控制的内存资源:o描述符地址数组(用于短RACH前端FFTC入队的源buffer),大小是Tx描述符个数乘以4字节.
ZHCA53828在KeyStone器件上实现高效的LTE上行基带前端处理只要处理能力足够,多个载扇可以共用一个FFTC实例、一个CC甚至TC实例.
所有用于通知某个核或某组核的QPend事件可以来自同一个QPendQ,软件通过从中pop出的描述符地址辨别事件类型.
其它资源通常不适合多载扇共用,需要为每个载扇单独分配.
4小结本文详细描述了在TI的KeyStone器件上实现高效的LTE上行基带前端处理的方法,包括对常规前端FFT的处理和对PRACH前端时频转换的处理,并给出了实测的c66x核负载.
从本文的描述可见,KeyStone架构提供的EDMA和Navigator机制非常灵活,可以把数据搬运、加速器启动、核触发等操作步骤串联成一个可自动执行的整体流程,极大降低了对核实时干预的需求.
当输入数据位于DDR时,FFTC的执行效率较低.
因此,对PRACH前端处理,建议把从符号级乒乓缓存搬移出来的数据放在片内.
对PRACH前端处理,大点DFT法比混合法节省10倍以上的核负载.
当FFTC和片内存储资源足够时(比如对小基站),大点DFT较为合适.
在其它情况下,哪种方法合适需要根据系统对c66x核、FFTC、内存的使用情况选择.
参考文献[1]3GPPTS-36.
211[2]3GPPTS-36.
212[3]3GPPTS-36.
213[4]3GPPTS-36.
214[5]http://www.
ti.
com/product/tms320tci6616[6]http://www.
ti.
com/product/tms320tci6618[7]http://www.
ti.
com/product/tms320tci6614[8]http://www.
ti.
com/product/tms320tci6612[9]http://www.
ti.
com/product/tms320c6670[10]http://www.
ti.
com/product/tci6636k2h[11]http://www.
ti.
com/product/tci6634k2k[12]http://www.
ti.
com/product/tci6638k2k[13]http://www.
ti.
com/product/tci6630k2l[14]KeyStoneArchitectureAntennaInterface2(AIF2)UserGuide(SPRUGV7)[15]KeyStoneIIArchitectureAntennaInterface2(AIF2)UserGuide(SPRUHL2)[16]MulticoreNavigatorUserGuide(SPRUGR9)[17]EnhancedDirectMemoryAccess(EDMA3)ControllerUserGuide(SPRUGS5)[18]FastFourierTransformCoprocessor(FFTC)UserGuide(SPRUGS2)[19]TCI6638K2KDataManual(SPRS836)[20]KeyStoneArchitectureChipInterruptController(CIC)UserGuide(SPRUGW4)[21]ThroughputPerformanceGuideforTCI66xKeyStoneDevices(SPRABH2)ZHCA538在KeyStone器件上实现高效的LTE上行基带前端处理29附录A:PRACH分布与EDMA参数表5到表12分别给出了FDD以及7种TDDUL/DL配置下的PRACH分布描述表.
解释如下.
"缓存数"一列描述每种配置下需要的缓存个数,等于1或2,2表示需要乒乓缓存.
对于PRACH格式2和3,每个opportunity包含2个序列,1个缓存对应一个opportunity,而非一个序列.
格式2和3时,缓存数总是等于1,为了强调该缓存实际上要容纳2个序列,在表中用"1'"标识.
当缓存数等于1时,这个唯一的缓存用1编号;当缓存数等于2时,两个缓存分别用1和2编号.
确定缓存数时,假设系统能够在"下下个"序列到达前处理完当前序列的时频转换.
假设系统启动后总是从一个无线帧的第一个子帧开始接收天线数据,则一开始会有若干个上行子帧符号不承载PRACH数据,这些上行子帧符号的个数在"初始Dummy符号数"一列给出.
注意,如前所述,经过FFT入队EDMA的过滤,PRACH前端时频转换功能模块只会收到上行子帧对应的符号级事件.
经过初始阶段的不承载PRACH数据的若干个符号后,随后的PRACH时域承载模式按周期重复,每个周期包含若干个EDMA分段,在"EDMA分段"一列给出.
1表示该分段内的符号数据被EDMA搬运到缓存1,2表示该分段内的符号数据被EDMA搬运到缓存2,0表示在该分段内不执行实际的天线数据搬运,只是消耗长RACH触发事件.
"EDMA段内符号数"一列给出每个EDMA分段中的上行子帧符号数.
表示一个上行子帧内的符号数,(=,,,)表示格式的一个opportunity中的1或2个序列跨越的总符号数,表示格式的一个opportunity从起始子帧的头部到序列开始前不承载PRACH的符号数(字母h表示head),表示格式的一个opportunity从序列结束后到结束子帧的末尾的不承载PRACH的符号数(字母t表示tail).
表4给出两种CP模式下,这些变量的取值.
表4:表5到表12中的变量取值格式0123变量000111222333NormalCP1411219127224292310ExtendedCP121101810622028208ZHCA53830在KeyStone器件上实现高效的LTE上行基带前端处理表5:PRACH分布与EDMA参数(FDD)0123456789012345678900Even11n+h01,0l0,t0+19n+h010Even414n+h01,0l0,t0+19n+h020Even717n+h01,0l0,t0+19n+h030Any11n+h01,0l0,t0+9n+h040Any414n+h01,0l0,t0+9n+h050Any717n+h01,0l0,t0+9n+h060Any1,61n+h01,0l0,t0+4n+h070Any2,712n+h01,0l0,t0+4n+h080Any3,813n+h01,0l0,t0+4n+h090Any1,4,71n+h01,0,1,0,1,0l0,t0+2n+h0,l0,t0+2n+h0,l0,t0+3n+h0100Any2,5,812n+h01,0,1,0,1,0l0,t0+2n+h0,l0,t0+2n+h0,l0,t0+3n+h0110Any3,6,913n+h01,0,1,0,1,0l0,t0+2n+h0,l0,t0+2n+h0,l0,t0+3n+h0120Any0,2,4,6,81h01,0l0,t0+n+h0130Any1,3,5,7,91n+h01,0l0,t0+n+h0140Any0,1,2,3,4,5,6,7,8,92h01,0,2,0l0,t0+h0,l0,t0+h0150Even919n+h01,0l0,t0+19n+h0161Even11n+h11,0l1,t1+18n+h1171Even414n+h11,0l1,t1+18n+h1181Even717n+h11,0l1,t1+18n+h1191Any11n+h11,0l1,t1+8n+h1201Any414n+h11,0l1,t1+8n+h1211Any717n+h11,0l1,t1+8n+h1221Any1,61n+h11,0l1,t1+3n+h1231Any2,712n+h11,0l1,t1+3n+h1241Any3,813n+h11,0l1,t1+3n+h1251Any1,4,71n+h11,0,1,0,1,0l1,t1+n+h1,l1,t1+n+h1,l1,t1+2n+h1261Any2,5,812n+h11,0,1,0,1,0l1,t1+n+h1,l1,t1+n+h1,l1,t1+2n+h1271Any3,6,913n+h11,0,1,0,1,0l1,t1+n+h1,l1,t1+n+h1,l1,t1+2n+h1281Any0,2,4,6,81h11,0l1,t1+h1291Any1,3,5,7,91n+h11,0l1,t1+h130N/AN/AN/A311Even919n+h11,0l1,t1+18n+h1322Even11'n+h21',0l2,t2+18n+h2332Even41'4n+h21',0l2,t2+18n+h2342Even71'7n+h21',0l2,t2+18n+h2352Any11'n+h21',0l2,t2+8n+h2362Any41'4n+h21',0l2,t2+8n+h2372Any71'7n+h21',0l2,t2+8n+h2382Any1,61'n+h21',0l2,t2+3n+h2392Any2,71'2n+h21',0l2,t2+3n+h2402Any3,81'3n+h21',0l2,t2+3n+h2412Any1,4,71'n+h21',0,1',0,1',0l2,t2+n+h2,l2,t2+n+h2,l2,t2+2n+h2422Any2,5,81'2n+h21',0,1',0,1',0l2,t2+n+h2,l2,t2+n+h2,l2,t2+2n+h2432Any3,6,91'3n+h21',0,1',0,1',0l2,t2+n+h2,l2,t2+n+h2,l2,t2+2n+h2442Any0,2,4,6,81'h21',0l2,t2+h2452Any1,3,5,7,91'n+h21',0l2,t2+h246N/AN/AN/A472Even91'9n+h21',0l2,t2+18n+h2483Even11'n+h31',0l3,t3+17n+h3493Even41'4n+h31',0l3,t3+17n+h3503Even71'7n+h31',0l3,t3+17n+h3513Any11'n+h31',0l3,t3+7n+h3523Any41'4n+h31',0l3,t3+7n+h3533Any71'7n+h31',0l3,t3+7n+h3543Any1,61'n+h31',0l3,t3+2n+h3553Any2,71'2n+h31',0l3,t3+2n+h3563Any3,81'3n+h31',0l3,t3+2n+h3573Any1,4,71'n+h31',0,1',0,1',0l3,t3+h3,l3,t3+h3,l3,t3+n+h3583Any2,5,81'2n+h31',0,1',0,1',0l3,t3+h3,l3,t3+h3,l3,t3+n+h3593Any3,6,91'3n+h31',0,1',0,1',0l3,t3+h3,l3,t3+h3,l3,t3+n+h360N/AN/AN/A61N/AN/AN/A62N/AN/AN/A633Even91'9n+h31',0l3,t3+17n+h3PRACH配置格式系统帧子帧缓存数初始Dummy符号数EDMA分段EDMA段内符号数偶数无线帧/无线帧奇数无线帧ZHCA538在KeyStone器件上实现高效的LTE上行基带前端处理31表6:PRACH分布与EDMA参数(TDDUL/DL配置0)01234567890123456789000.
50(0,1,0,2)12n+h01,0l0,t0+11n+h0100.
51(0,2,0,2)18n+h01,0l0,t0+11n+h0200.
52(0,1,1,2)15n+h01,0l0,t0+11n+h03010(0,0,0,2)12n+h01,0l0,t0+5n+h04011(0,0,1,2)15n+h01,0l0,t0+5n+h05012(0,0,0,1)1n+h01,0l0,t0+5n+h06020(0,0,0,2)(0,0,1,2)12n+h01,0l0,t0+2n+h07021(0,0,0,1)(0,0,1,1)1n+h01,0l0,t0+2n+h08022(0,0,0,0)(0,0,1,0)1h01,0l0,t0+2n+h09030(0,0,0,1)(0,0,0,2)(0,0,1,2)2n+h01,0,2,0,1,0l0,t0+h0,l0,t0+2n+h0,l0,t0+n+h010031(0,0,0,0)(0,0,1,0)(0,0,1,1)2h01,0,2,0,1,0l0,t0+2n+h0,l0,t0+h0,l0,t0+n+h011032N/A12040(0,0,0,1)(0,0,0,2)(0,0,1,1)(0,0,1,2)2n+h01,0,2,0l0,t0+h0,l0,t0+n+h013041(0,0,0,0)(0,0,0,2)(0,0,1,0)(0,0,1,2)1h01,0,2,0l0,t0+n+h0,l0,t0+h014042(0,0,0,0)(0,0,0,1)(0,0,1,0)(0,0,1,1)2h01,0,2,0l0,t0+h0,l0,t0+n+h015050(0,0,0,0)(0,0,0,1)(0,0,0,2)(0,0,1,1)(0,0,1,2)2h01,0,2,0,1,0,2,0,1,0l0,t0+h0,l0,t0+h0,l0,t0+n+h0,l0,t0+h0,l0,t0+h016051(0,0,0,1)(0,0,0,2)(0,0,1,0)(0,0,1,1)(0,0,1,2)2n+h01,0,2,0,1,0,2,0,1,0l0,t0+h0,l0,t0+h0,l0,t0+h0,l0,t0+h0,l0,t0+n+h017052(0,0,0,0)(0,0,0,1)(0,0,0,2)(0,0,1,0)(0,0,1,2)2h01,0,2,0,1,0,2,0,1,0l0,t0+h0,l0,t0+h0,l0,t0+h0,l0,t0+n+h0,l0,t0+h018060(0,0,0,0)(0,0,0,1)(0,0,0,2)(0,0,1,0)(0,0,1,1)(0,0,1,2)2h01,0,2,0l0,t0+h0,l0,t0+h019061N/A2010.
50(0,1,0,1)1n+h11,0l1,t1+10n+h12110.
51(0,2,0,1)17n+h11,0l1,t1+10n+h12210.
52(0,1,1,1)14n+h11,0l1,t1+10n+h123110(0,0,0,1)1n+h11,0l1,t1+4n+h124111(0,0,1,1)14n+h11,0l1,t1+4n+h125120(0,0,0,1)(0,0,1,1)1n+h11,0l1,t1+n+h126130(0,0,0,1)(0,0,1,1)(1,0,0,1)1n+h11,0l1,t1+n+h127140(0,0,0,1)(0,0,1,1)(1,0,0,1)(1,0,1,1)1n+h11,0l1,t1+n+h128150(0,0,0,1)(0,0,1,1)(1,0,0,1)(1,0,1,1)(2,0,0,1)1n+h11,0l1,t1+n+h129160(0,0,0,1)(0,0,1,1)(1,0,0,1)(1,0,1,1)(2,0,0,1)(2,0,1,1)1n+h11,0l1,t1+n+h13020.
50(0,1,0,1)1'n+h21',0l2,t2+10n+h23120.
51(0,2,0,1)1'7n+h21',0l2,t2+10n+h23220.
52(0,1,1,1)1'4n+h21',0l2,t2+10n+h233210(0,0,0,1)1'n+h21',0l2,t2+4n+h234211(0,0,1,1)1'4n+h21',0l2,t2+4n+h235220(0,0,0,1)(0,0,1,1)1'n+h21',0l2,t2+n+h236230(0,0,0,1)(0,0,1,1)(1,0,0,1)1'n+h21',0l2,t2+n+h237240(0,0,0,1)(0,0,1,1)(1,0,0,1)(1,0,1,1)1'n+h21',0l2,t2+n+h238250(0,0,0,1)(0,0,1,1)(1,0,0,1)(1,0,1,1)(2,0,0,1)1'n+h21',0l2,t2+n+h239260(0,0,0,1)(0,0,1,1)(1,0,0,1)(1,0,1,1)(2,0,0,1)(2,0,1,1)1'n+h21',0l2,t2+n+h24030.
50(0,1,0,0)1'h31',0l3,t3+9n+h34130.
51(0,2,0,0)1'6n+h31',0l3,t3+9n+h34230.
52(0,1,1,0)1'3n+h31',0l3,t3+9n+h343310(0,0,0,0)1'h31',0l3,t3+3n+h344311(0,0,1,0)1'3n+h31',0l3,t3+3n+h345320(0,0,0,0)(0,0,1,0)1'h31',0l3,t3+h346330(0,0,0,0)(0,0,1,0)(1,0,0,0)1'h31',0l3,t3+h347340(0,0,0,0)(0,0,1,0)(1,0,0,0)(1,0,1,0)1'h31',0l3,t3+h34840.
50(0,1,0,*)14940.
51(0,2,0,*)15040.
52(0,1,1,*)151410(0,0,0,*)152411(0,0,1,*)153420(0,0,0,*)(0,0,1,*)1154430(0,0,0,*)(0,0,1,*)(1,0,0,*)2155440(0,0,0,*)(0,0,1,*)(1,0,0,*)(1,0,1,*)2256450(0,0,0,*)(0,0,1,*)(1,0,0,*)(1,0,1,*)(2,0,0,*)3257460(0,0,0,*)(0,0,1,*)(1,0,0,*)(1,0,1,*)(2,0,0,*)(2,0,1,*)3358N/AN/AN/AN/A59N/AN/AN/AN/A60N/AN/AN/AN/A61N/AN/AN/AN/A62N/AN/AN/AN/A63N/AN/AN/AN/A偶数无线帧/无线帧奇数无线帧PRACH配置格式密度版本TDD配置0时频分布缓存数初始Dummy符号数EDMA分段EDMA段内符号数22222223332222333ZHCA53832在KeyStone器件上实现高效的LTE上行基带前端处理表7:PRACH分布与EDMA参数(TDDUL/DL配置1)01234567890123456789000.
50(0,1,0,1)1n+h01,0l0,t0+7n+h0100.
51(0,2,0,1)15n+h01,0l0,t0+7n+h0200.
52(0,1,1,1)13n+h01,0l0,t0+7n+h03010(0,0,0,1)1n+h01,0l0,t0+3n+h04011(0,0,1,1)13n+h01,0l0,t0+3n+h05012(0,0,0,0)1h01,0l0,t0+3n+h06020(0,0,0,1)(0,0,1,1)1n+h01,0l0,t0+n+h07021(0,0,0,0)(0,0,1,0)1h01,0l0,t0+n+h08022N/A9030(0,0,0,0)(0,0,0,1)(0,0,1,1)2h01,0,2,0,1,0l0,t0+h0,l0,t0+n+h0,l0,t0+h010031(0,0,0,1)(0,0,1,0)(0,0,1,1)2n+h01,0,2,0,1,0l0,t0+h0,l0,t0+h0,l0,t0+n+h011032(0,0,0,0)(0,0,0,1)(0,0,1,0)2h01,0,2,0,1,0l0,t0+h0,l0,t0+h0,l0,t0+n+h012040(0,0,0,0)(0,0,0,1)(0,0,1,0)(0,0,1,1)2h01,0,2,0l0,t0+h0,l0,t0+h013041N/A14042N/A15050(0,0,0,0)(0,0,0,1)(0,0,1,0)(0,0,1,1)(1,0,0,1)2h01,0,2,0l0,t0+h0,l0,t0+h0216051(0,0,0,0)(0,0,0,1)(0,0,1,0)(0,0,1,1)(1,0,1,1)2h01,0,2,0l0,t0+h0,l0,t0+h0217052(0,0,0,0)(0,0,0,1)(0,0,1,0)(0,0,1,1)(1,0,0,0)2h01,0,2,0l0,t0+h0,l0,t0+h0218060(0,0,0,0)(0,0,0,1)(0,0,1,0)(0,0,1,1)(1,0,0,1)(1,0,1,1)2h01,0,2,0l0,t0+h0,l0,t0+h02219061(0,0,0,0)(0,0,0,1)(0,0,1,0)(0,0,1,1)(1,0,0,0)(1,0,1,0)2h01,0,2,0l0,t0+h0,l0,t0+h0222010.
50(0,1,0,0)1h11,0l1,t1+6n+h12110.
51(0,2,0,0)14n+h11,0l1,t1+6n+h12210.
52(0,1,1,0)12n+h11,0l1,t1+6n+h123110(0,0,0,0)1h11,0l1,t1+2n+h124111(0,0,1,0)12n+h11,0l1,t1+2n+h125120(0,0,0,0)(0,0,1,0)1h11,0l1,t1+h126130(0,0,0,0)(0,0,1,0)(1,0,0,0)1h11,0l1,t1+h1227140(0,0,0,0)(0,0,1,0)(1,0,0,0)(1,0,1,0)1h11,0l1,t1+h12228150(0,0,0,0)(0,0,1,0)(1,0,0,0)(1,0,1,0)(2,0,0,0)1h11,0l1,t1+h13229160(0,0,0,0)(0,0,1,0)(1,0,0,0)(1,0,1,0)(2,0,0,0)(2,0,1,0)1h11,0l1,t1+h1333020.
50(0,1,0,0)1'h21',0l2,t2+6n+h23120.
51(0,2,0,0)1'4n+h21',0l2,t2+6n+h23220.
52(0,1,1,0)1'2n+h21',0l2,t2+6n+h233210(0,0,0,0)1'h21',0l2,t2+2n+h234211(0,0,1,0)1'2n+h21',0l2,t2+2n+h235220(0,0,0,0)(0,0,1,0)1'h21',0l2,t2+h236230(0,0,0,0)(0,0,1,0)(1,0,0,0)1'h21',0l2,t2+h2237240(0,0,0,0)(0,0,1,0)(1,0,0,0)(1,0,1,0)1'h21',0l2,t2+h22238250(0,0,0,0)(0,0,1,0)(1,0,0,0)(1,0,1,0)(2,0,0,0)1'h21',0l2,t2+h23239260(0,0,0,0)(0,0,1,0)(1,0,0,0)(1,0,1,0)(2,0,0,0)(2,0,1,0)1'h21',0l2,t2+h2334030.
50N/A4130.
51N/A4230.
52N/A43310N/A44311N/A45320N/A46330N/A47340N/A4840.
50(0,1,0,*)14940.
51(0,2,0,*)15040.
52(0,1,1,*)151410(0,0,0,*)152411(0,0,1,*)153420(0,0,0,*)(0,0,1,*)1154430(0,0,0,*)(0,0,1,*)(1,0,0,*)2155440(0,0,0,*)(0,0,1,*)(1,0,0,*)(1,0,1,*)2256450(0,0,0,*)(0,0,1,*)(1,0,0,*)(1,0,1,*)(2,0,0,*)3257460(0,0,0,*)(0,0,1,*)(1,0,0,*)(1,0,1,*)(2,0,0,*)(2,0,1,*)3358N/AN/AN/AN/A59N/AN/AN/AN/A60N/AN/AN/AN/A61N/AN/AN/AN/A62N/AN/AN/AN/A63N/AN/AN/AN/APRACH配置格式密度版本初始Dummy符号数EDMA分段EDMA段内符号数TDD配置1时频分布偶数无线帧/无线帧奇数无线帧缓存数33222233322223ZHCA538在KeyStone器件上实现高效的LTE上行基带前端处理33表8:PRACH分布与EDMA参数(TDDUL/DL配置2)01234567890123456789000.
50(0,1,0,0)1h01,0l0,t0+3n+h0100.
51(0,2,0,0)12n+h01,0l0,t0+3n+h0200.
52(0,1,1,0)1n+h01,0l0,t0+3n+h03010(0,0,0,0)1h01,0l0,t0+n+h04011(0,0,1,0)1n+h01,0l0,t0+n+h05012N/A6020(0,0,0,0)(0,0,1,0)1h01,0l0,t0+h07021N/A8022N/A9030(0,0,0,0)(0,0,1,0)(1,0,0,0)1h01,0l0,t0+h0210031(0,0,0,0)(0,0,1,0)(1,0,1,0)1h01,0l0,t0+h0211032N/A12040(0,0,0,0)(0,0,1,0)(1,0,0,0)(1,0,1,0)1h01,0l0,t0+h02213041N/A14042N/A15050(0,0,0,0)(0,0,1,0)(1,0,0,0)(1,0,1,0)(2,0,0,0)1h01,0l0,t0+h03216051(0,0,0,0)(0,0,1,0)(1,0,0,0)(1,0,1,0)(2,0,1,0)1h01,0l0,t0+h02317052N/A18060(0,0,0,0)(0,0,1,0)(1,0,0,0)(1,0,1,0)(2,0,0,0)(2,0,1,0)1h01,0l0,t0+h03319061N/A2010.
50N/A2110.
51N/A2210.
52N/A23110N/A24111N/A25120N/A26130N/A27140N/A28150N/A29160N/A3020.
50N/A3120.
51N/A3220.
52N/A33210N/A34211N/A35220N/A36230N/A37240N/A38250N/A39260N/A4030.
50N/A4130.
51N/A4230.
52N/A43310N/A44311N/A45320N/A46330N/A47340N/A4840.
50(0,1,0,*)14940.
51(0,2,0,*)15040.
52(0,1,1,*)151410(0,0,0,*)152411(0,0,1,*)153420(0,0,0,*)(0,0,1,*)1154430(0,0,0,*)(0,0,1,*)(1,0,0,*)2155440(0,0,0,*)(0,0,1,*)(1,0,0,*)(1,0,1,*)2256450(0,0,0,*)(0,0,1,*)(1,0,0,*)(1,0,1,*)(2,0,0,*)3257460(0,0,0,*)(0,0,1,*)(1,0,0,*)(1,0,1,*)(2,0,0,*)(2,0,1,*)3358N/AN/AN/AN/A59N/AN/AN/AN/A60N/AN/AN/AN/A61N/AN/AN/AN/A62N/AN/AN/AN/A63N/AN/AN/AN/APRACH配置格式密度版本EDMA段内符号数EDMA分段初始Dummy符号数缓存数TDD配置2时频分布偶数无线帧/无线帧奇数无线帧ZHCA53834在KeyStone器件上实现高效的LTE上行基带前端处理表9:PRACH分布与EDMA参数(TDDUL/DL配置3)01234567890123456789000.
50(0,1,0,2)12n+h01,0l0,t0+5n+h0100.
51(0,2,0,2)15n+h01,0l0,t0+5n+h0200.
52(0,1,0,1)1n+h01,0l0,t0+5n+h03010(0,0,0,2)12n+h01,0l0,t0+2n+h04011(0,0,0,1)1n+h01,0l0,t0+2n+h05012(0,0,0,0)1h01,0l0,t0+2n+h06020(0,0,0,1)(0,0,0,2)2n+h01,0,2,0l0,t0+h0,l0,t0+n+h07021(0,0,0,0)(0,0,0,2)1h01,0,1,0l0,t0+n+h0,l0,t0+h08022(0,0,0,0)(0,0,0,1)2h01,0,2,0l0,t0+h0,l0,t0+n+h09030(0,0,0,0)(0,0,0,1)(0,0,0,2)2h01,0,2,0,1,0l0,t0+h0,l0,t0+h0,l0,t0+h010031N/A11032N/A12040(0,0,0,0)(0,0,0,1)(0,0,0,2)(1,0,0,2)2h01,0,2,0,1,0l0,t0+h0,l0,t0+h0,l0,t0+h02213041(0,0,0,0)(0,0,0,1)(0,0,0,2)(1,0,0,1)2h01,0,2,0,1,0l0,t0+h0,l0,t0+h0,l0,t0+h0214042(0,0,0,0)(0,0,0,1)(0,0,0,2)(1,0,0,0)2h01,0,2,0,1,0l0,t0+h0,l0,t0+h0,l0,t0+h0215050(0,0,0,0)(0,0,0,1)(0,0,0,2)(1,0,0,1)(1,0,0,2)2h01,0,2,0,1,0l0,t0+h0,l0,t0+h0,l0,t0+h022216051(0,0,0,0)(0,0,0,1)(0,0,0,2)(1,0,0,0)(1,0,0,2)2h01,0,2,0,1,0l0,t0+h0,l0,t0+h0,l0,t0+h022317052(0,0,0,0)(0,0,0,1)(0,0,0,2)(1,0,0,0)(1,0,0,1)2h01,0,2,0,1,0l0,t0+h0,l0,t0+h0,l0,t0+h02218060(0,0,0,0)(0,0,0,1)(0,0,0,2)(1,0,0,0)(1,0,0,1)(1,0,0,2)2h01,0,2,0,1,0l0,t0+h0,l0,t0+h0,l0,t0+h0222319061N/A2010.
50(0,1,0,1)1n+h11,0l1,t1+4n+h12110.
51(0,2,0,1)14n+h11,0l1,t1+4n+h12210.
52N/A23110(0,0,0,1)1n+h11,0l1,t1+n+h124111N/A25120(0,0,0,1)(1,0,0,1)1n+h11,0l1,t1+n+h126130(0,0,0,1)(1,0,0,1)(2,0,0,1)1n+h11,0l1,t1+n+h127140(0,0,0,1)(1,0,0,1)(2,0,0,1)(3,0,0,1)1n+h11,0l1,t1+n+h128150(0,0,0,1)(1,0,0,1)(2,0,0,1)(3,0,0,1)(4,0,0,1)1n+h11,0l1,t1+n+h129160(0,0,0,1)(1,0,0,1)(2,0,0,1)(3,0,0,1)(4,0,0,1)(5,0,0,1)1n+h11,0l1,t1+n+h13020.
50(0,1,0,1)1'n+h21,0l2,t2+4n+h23120.
51(0,2,0,1)1'4n+h21,0l2,t2+4n+h23220.
52N/A33210(0,0,0,1)1'n+h21,0l2,t2+n+h234211N/A35220(0,0,0,1)(1,0,0,1)1'n+h21,0l2,t2+n+h236230(0,0,0,1)(1,0,0,1)(2,0,0,1)1'n+h21,0l2,t2+n+h237240(0,0,0,1)(1,0,0,1)(2,0,0,1)(3,0,0,1)1'n+h21,0l2,t2+n+h238250(0,0,0,1)(1,0,0,1)(2,0,0,1)(3,0,0,1)(4,0,0,1)1'n+h21,0l2,t2+n+h239260(0,0,0,1)(1,0,0,1)(2,0,0,1)(3,0,0,1)(4,0,0,1)(5,0,0,1)1'n+h21,0l2,t2+n+h24030.
50(0,1,0,0)1'h31,0l3,t3+3n+h34130.
51(0,2,0,0)1'3n+h31,0l3,t3+3n+h34230.
52N/A43310(0,0,0,0)1'h31,0l3,t3+h344311N/A45320(0,0,0,0)(1,0,0,0)1'h31,0l3,t3+h346330(0,0,0,0)(1,0,0,0)(2,0,0,0)1'h31,0l3,t3+h347340(0,0,0,0)(1,0,0,0)(2,0,0,0)(3,0,0,0)1'h31,0l3,t3+h34840.
50(0,1,0,*)14940.
51(0,2,0,*)15040.
52N/A51410(0,0,0,*)152411N/A53420(0,0,0,*)(1,0,0,*)2154430(0,0,0,*)(1,0,0,*)(2,0,0,*)3155440(0,0,0,*)(1,0,0,*)(2,0,0,*)(3,0,0,*)4256450(0,0,0,*)(1,0,0,*)(2,0,0,*)(3,0,0,*)(4,0,0,*)5257460(0,0,0,*)(1,0,0,*)(2,0,0,*)(3,0,0,*)(4,0,0,*)(5,0,0,*)6358N/AN/AN/AN/A59N/AN/AN/AN/A60N/AN/AN/AN/A61N/AN/AN/AN/A62N/AN/AN/AN/A63N/AN/AN/AN/APRACH配置格式密度版本TDD配置3时频分布缓存数初始Dummy符号数EDMA分段EDMA段内符号数偶数无线帧/无线帧奇数无线帧2342343456562ZHCA538在KeyStone器件上实现高效的LTE上行基带前端处理35表10:PRACH分布与EDMA参数(TDDUL/DL配置4)01234567890123456789000.
50(0,1,0,1)1n+h01,0l0,t0+3n+h0100.
51(0,2,0,1)13n+h01,0l0,t0+3n+h0200.
52(0,1,0,0)1h01,0l0,t0+3n+h03010(0,0,0,1)1n+h01,0l0,t0+n+h04011(0,0,0,0)1h01,0l0,t0+n+h05012N/A6020(0,0,0,0)(0,0,0,1)2h01,0,2,0l0,t0+h0,l0,t0+h07021N/A8022N/A9030(0,0,0,0)(0,0,0,1)(1,0,0,1)2h01,0,2,0l0,t0+h0,l0,t0+h0210031(0,0,0,0)(0,0,0,1)(1,0,0,0)2h01,0,2,0l0,t0+h0,l0,t0+h0211032N/A12040(0,0,0,0)(0,0,0,1)(1,0,0,0)(1,0,0,1)2h01,0,2,0l0,t0+h0,l0,t0+h022213041N/A14042N/A15050(0,0,0,0)(0,0,0,1)(1,0,0,0)(1,0,0,1)(2,0,0,1)2h01,0,2,0l0,t0+h0,l0,t0+h023216051(0,0,0,0)(0,0,0,1)(1,0,0,0)(1,0,0,1)(2,0,0,0)2h01,0,2,0l0,t0+h0,l0,t0+h032317052N/A18060(0,0,0,0)(0,0,0,1)(1,0,0,0)(1,0,0,1)(2,0,0,0)(2,0,0,1)2h01,0,2,0l0,t0+h0,l0,t0+h033319061N/A2010.
50(0,1,0,0)1h11,0l1,t1+2n+h12110.
51(0,2,0,0)12n+h11,0l1,t1+2n+h12210.
52N/A23110(0,0,0,0)1h11,0l1,t1+h124111N/A25120(0,0,0,0)(1,0,0,0)1h11,0l1,t1+h126130(0,0,0,0)(1,0,0,0)(2,0,0,0)1h11,0l1,t1+h127140(0,0,0,0)(1,0,0,0)(2,0,0,0)(3,0,0,0)1h11,0l1,t1+h128150(0,0,0,0)(1,0,0,0)(2,0,0,0)(3,0,0,0)(4,0,0,0)1h11,0l1,t1+h129160(0,0,0,0)(1,0,0,0)(2,0,0,0)(3,0,0,0)(4,0,0,0)(5,0,0,0)1h11,0l1,t1+h13020.
50(0,1,0,0)1'h21,0l2,t2+2n+h23120.
51(0,2,0,0)1'2n+h21,0l2,t2+2n+h23220.
52N/A33210(0,0,0,0)1'h21,0l2,t2+h234211N/A35220(0,0,0,0)(1,0,0,0)1'h21,0l2,t2+h236230(0,0,0,0)(1,0,0,0)(2,0,0,0)1'h21,0l2,t2+h237240(0,0,0,0)(1,0,0,0)(2,0,0,0)(3,0,0,0)1'h21,0l2,t2+h238250(0,0,0,0)(1,0,0,0)(2,0,0,0)(3,0,0,0)(4,0,0,0)1'h21,0l2,t2+h239260(0,0,0,0)(1,0,0,0)(2,0,0,0)(3,0,0,0)(4,0,0,0)(5,0,0,0)1'h21,0l2,t2+h24030.
50N/A4130.
51N/A4230.
52N/A43310N/A44311N/A45320N/A46330N/A47340N/A4840.
50(0,1,0,*)14940.
51(0,2,0,*)15040.
52N/A51410(0,0,0,*)152411N/A53420(0,0,0,*)(1,0,0,*)2154430(0,0,0,*)(1,0,0,*)(2,0,0,*)3155440(0,0,0,*)(1,0,0,*)(2,0,0,*)(3,0,0,*)4256450(0,0,0,*)(1,0,0,*)(2,0,0,*)(3,0,0,*)(4,0,0,*)5257460(0,0,0,*)(1,0,0,*)(2,0,0,*)(3,0,0,*)(4,0,0,*)(5,0,0,*)6358N/AN/AN/AN/A59N/AN/AN/AN/A60N/AN/AN/AN/A61N/AN/AN/AN/A62N/AN/AN/AN/A63N/AN/AN/AN/APRACH配置格式密度版本TDD配置4时频分布缓存数初始Dummy符号数EDMA分段EDMA段内符号数偶数无线帧/无线帧奇数无线帧2345656234ZHCA53836在KeyStone器件上实现高效的LTE上行基带前端处理表11:PRACH分布与EDMA参数(TDDUL/DL配置5)01234567890123456789000.
50(0,1,0,0)1h01,0l0,t0+n+h0100.
51(0,2,0,0)1n+h01,0l0,t0+n+h0200.
52N/A3010(0,0,0,0)1h01,0l0,t0+h04011N/A5012N/A6020(0,0,0,0)(1,0,0,0)1h01,0l0,t0+h027021N/A8022N/A9030(0,0,0,0)(1,0,0,0)(2,0,0,0)1h01,0l0,t0+h0310031N/A11032N/A12040(0,0,0,0)(1,0,0,0)(2,0,0,0)(3,0,0,0)1h01,0l0,t0+h04213041N/A14042N/A15050(0,0,0,0)(1,0,0,0)(2,0,0,0)(3,0,0,0)(4,0,0,0)1h01,0l0,t0+h05216051N/A17052N/A18060(0,0,0,0)(1,0,0,0)(2,0,0,0)(3,0,0,0)(4,0,0,0)(5,0,0,0)1h01,0l0,t0+h06319061N/A2010.
50N/A2110.
51N/A2210.
52N/A23110N/A24111N/A25120N/A26130N/A27140N/A28150N/A29160N/A3020.
50N/A3120.
51N/A3220.
52N/A33210N/A34211N/A35220N/A36230N/A37240N/A38250N/A39260N/A4030.
50N/A4130.
51N/A4230.
52N/A43310N/A44311N/A45320N/A46330N/A47340N/A4840.
50(0,1,0,*)14940.
51(0,2,0,*)15040.
52N/A51410(0,0,0,*)152411N/A53420(0,0,0,*)(1,0,0,*)2154430(0,0,0,*)(1,0,0,*)(2,0,0,*)3155440(0,0,0,*)(1,0,0,*)(2,0,0,*)(3,0,0,*)4256450(0,0,0,*)(1,0,0,*)(2,0,0,*)(3,0,0,*)(4,0,0,*)5257460(0,0,0,*)(1,0,0,*)(2,0,0,*)(3,0,0,*)(4,0,0,*)(5,0,0,*)6358N/AN/AN/AN/A59N/AN/AN/AN/A60N/AN/AN/AN/A61N/AN/AN/AN/A62N/AN/AN/AN/A63N/AN/AN/AN/APRACH配置格式密度版本TDD配置5时频分布缓存数初始Dummy符号数EDMA分段EDMA段内符号数偶数无线帧/无线帧奇数无线帧ZHCA538在KeyStone器件上实现高效的LTE上行基带前端处理37表12:PRACH分布与EDMA参数(TDDUL/DL配置6)01234567890123456789000.
50(0,1,0,2)12n+h01,0l0,t0+9n+h0100.
51(0,2,0,2)17n+h01,0l0,t0+9n+h0200.
52(0,1,1,1)14n+h01,0l0,t0+9n+h03010(0,0,0,2)12n+h01,0l0,t0+4n+h04011(0,0,1,1)14n+h01,0l0,t0+4n+h05012(0,0,0,1)1n+h01,0l0,t0+4n+h06020(0,0,0,2)(0,0,1,1)12n+h01,0,1,0l0,t0+n+h0,l0,t0+2n+h07021(0,0,0,1)(0,0,1,0)1n+h01,0,1,0l0,t0+n+h0,l0,t0+2n+h08022(0,0,0,0)(0,0,1,1)1h01,0,1,0l0,t0+3n+h0,l0,t0+h09030(0,0,0,1)(0,0,0,2)(0,0,1,1)2n+h01,0,2,0,1,0l0,t0+h0,l0,t0+n+h0,l0,t0+n+h010031(0,0,0,0)(0,0,0,2)(0,0,1,0)1h01,0,1,0,1,0l0,t0+n+h0,l0,t0+h0,l0,t0+n+h011032(0,0,0,1)(0,0,1,0)(0,0,1,1)2n+h01,0,2,0,1,0l0,t0+n+h0,l0,t0+h0,l0,t0+n+h012040(0,0,0,1)(0,0,0,2)(0,0,1,0)(0,0,1,1)2n+h01,0,2,0,1,0,2,0l0,t0+h0,l0,t0+h0,l0,t0+h0,l0,t0+n+h013041(0,0,0,0)(0,0,0,1)(0,0,0,2)(0,0,1,1)2h01,0,2,0,1,0,2,0l0,t0+h0,l0,t0+h0,l0,t0+n+h0,l0,t0+h014042(0,0,0,0)(0,0,0,2)(0,0,1,0)(0,0,1,1)2h01,0,2,0,1,0,2,0l0,t0+n+h0,l0,t0+h0,l0,t0+h0,l0,t0+h015050(0,0,0,0)(0,0,0,1)(0,0,0,2)(0,0,1,0)(0,0,1,1)2h01,0,2,0l0,t0+h0,l0,t0+h016051N/A17052N/A18060(0,0,0,0)(0,0,0,1)(0,0,0,2)(0,0,1,0)(0,0,1,1)(1,0,0,2)2h01,0,2,0l0,t0+h0,l0,t0+h0219061(0,0,0,0)(0,0,0,1)(0,0,0,2)(0,0,1,0)(0,0,1,1)(1,0,1,1)2h01,0,2,0l0,t0+h0,l0,t0+h022010.
50(0,1,0,1)1n+h11,0l1,t1+8n+h12110.
51(0,2,0,1)16n+h11,0l1,t1+8n+h12210.
52(0,1,1,0)13n+h11,0l1,t1+8n+h123110(0,0,0,1)1n+h11,0l1,t1+3n+h124111(0,0,1,0)13n+h11,0l1,t1+3n+h125120(0,0,0,1)(0,0,1,0)1n+h11,0,1,0l1,t1+h1,l1,t1+n+h126130(0,0,0,1)(0,0,1,0)(1,0,0,1)1n+h11,0,1,0l1,t1+h1,l1,t1+n+h127140(0,0,0,1)(0,0,1,0)(1,0,0,1)(1,0,1,0)1n+h11,0,1,0l1,t1+h1,l1,t1+n+h1228150(0,0,0,1)(0,0,1,0)(1,0,0,1)(1,0,1,0)(2,0,0,1)1n+h11,0,1,0l1,t1+h1,l1,t1+n+h1229160(0,0,0,1)(0,0,1,0)(1,0,0,1)(1,0,1,0)(2,0,0,1)(2,0,1,0)1n+h11,0,1,0l1,t1+h1,l1,t1+n+h133020.
50(0,1,0,1)1'n+h21',0l2,t2+8n+h23120.
51(0,2,0,1)1'6n+h21',0l2,t2+8n+h23220.
52(0,1,1,0)1'3n+h21',0l2,t2+8n+h233210(0,0,0,1)1'n+h21',0l2,t2+3n+h234211(0,0,1,0)1'3n+h21',0l2,t2+3n+h235220(0,0,0,1)(0,0,1,0)1'n+h21',0,1',0l2,t2+h2,l2,t2+n+h236230(0,0,0,1)(0,0,1,0)(1,0,0,1)1'n+h21',0,1',0l2,t2+h2,l2,t2+n+h237240(0,0,0,1)(0,0,1,0)(1,0,0,1)(1,0,1,0)1'n+h21',0,1',0l2,t2+h2,l2,t2+n+h2238250(0,0,0,1)(0,0,1,0)(1,0,0,1)(1,0,1,0)(2,0,0,1)1'n+h21',0,1',0l2,t2+h2,l2,t2+n+h2239260(0,0,0,1)(0,0,1,0)(1,0,0,1)(1,0,1,0)(2,0,0,1)(2,0,1,0)1'n+h21',0,1',0l2,t2+h2,l2,t2+n+h234030.
50(0,1,0,0)1'h31',0l3,t3+7n+h34130.
51(0,2,0,0)1'5n+h31',0l3,t3+7n+h34230.
52N/A43310(0,0,0,0)1'h31',0l3,t3+2n+h344311N/A45320(0,0,0,0)(1,0,0,0)1'h31',0l3,t3+2n+h346330(0,0,0,0)(1,0,0,0)(2,0,0,0)1'h31',0l3,t3+2n+h347340(0,0,0,0)(1,0,0,0)(2,0,0,0)(3,0,0,0)1'h31',0l3,t3+2n+h324840.
50(0,1,0,*)14940.
51(0,2,0,*)15040.
52(0,1,1,*)151410(0,0,0,*)152411(0,0,1,*)153420(0,0,0,*)(0,0,1,*)1154430(0,0,0,*)(0,0,1,*)(1,0,0,*)2155440(0,0,0,*)(0,0,1,*)(1,0,0,*)(1,0,1,*)2256450(0,0,0,*)(0,0,1,*)(1,0,0,*)(1,0,1,*)(2,0,0,*)3257460(0,0,0,*)(0,0,1,*)(1,0,0,*)(1,0,1,*)(2,0,0,*)(2,0,1,*)3358N/AN/AN/AN/A59N/AN/AN/AN/A60N/AN/AN/AN/A61N/AN/AN/AN/A62N/AN/AN/AN/A63N/AN/AN/AN/APRACH配置格式密度版本TDD配置6时频分布缓存数初始Dummy符号数EDMA分段EDMA段内符号数偶数无线帧/无线帧奇数无线帧22223222332342333重重要要声声明明德州仪器(TI)及其下属子公司有权根据JESD46最新标准,对所提供的产品和服务进行更正、修改、增强、改进或其它更改,并有权根据JESD48最新标准中止提供任何产品和服务.
客户在下订单前应获取最新的相关信息,并验证这些信息是否完整且是最新的.
所有产品的销售都遵循在订单确认时所提供的TI销售条款与条件.
TI保证其所销售的组件的性能符合产品销售时TI半导体产品销售条件与条款的适用规范.
仅在TI保证的范围内,且TI认为有必要时才会使用测试或其它质量控制技术.
除非适用法律做出了硬性规定,否则没有必要对每种组件的所有参数进行测试.

TI对应用帮助或客户产品设计不承担任何义务.
客户应对其使用TI组件的产品和应用自行负责.
为尽量减小与客户产品和应用相关的风险,客户应提供充分的设计与操作安全措施.
TI不对任何TI专利权、版权、屏蔽作品权或其它与使用了TI组件或服务的组合设备、机器或流程相关的TI知识产权中授予的直接或隐含权限作出任何保证或解释.
TI所发布的与第三方产品或服务有关的信息,不能构成从TI获得使用这些产品或服务的许可、授权、或认可.
使用此类信息可能需要获得第三方的专利权或其它知识产权方面的许可,或是TI的专利权或其它知识产权方面的许可.
对于TI的产品手册或数据表中TI信息的重要部分,仅在没有对内容进行任何篡改且带有相关授权、条件、限制和声明的情况下才允许进行复制.
TI对此类篡改过的文件不承担任何责任或义务.
复制第三方的信息可能需要服从额外的限制条件.

在转售TI组件或服务时,如果对该组件或服务参数的陈述与TI标明的参数相比存在差异或虚假成分,则会失去相关TI组件或服务的所有明示或暗示授权,且这是不正当的、欺诈性商业行为.
TI对任何此类虚假陈述均不承担任何责任或义务.
客户认可并同意,尽管任何应用相关信息或支持仍可能由TI提供,但他们将独力负责满足与其产品及在其应用中使用TI产品相关的所有法律、法规和安全相关要求.
客户声明并同意,他们具备制定与实施安全措施所需的全部专业技术和知识,可预见故障的危险后果、监测故障及其后果、降低有可能造成人身伤害的故障的发生机率并采取适当的补救措施.
客户将全额赔偿因在此类安全关键应用中使用任何TI组件而对TI及其代理造成的任何损失.
在某些场合中,为了推进安全相关应用有可能对TI组件进行特别的促销.
TI的目标是利用此类组件帮助客户设计和创立其特有的可满足适用的功能安全性标准和要求的终端产品解决方案.
尽管如此,此类组件仍然服从这些条款.

易探云2核2G5M仅330元/年起,国内挂机宝云服务器,独立ip

易探云怎么样?易探云是国内一家云计算服务商家,致力香港服务器、国内外服务器租用及托管等互联网业务,目前主要地区为运作香港BGP、香港CN2、广东、北京、深圳等地区。目前,易探云推出深圳或北京地区的适合挂机和建站的云服务器,国内挂机宝云服务器(可选深圳或北京地区),独立ip;2核2G5M挂机云服务器仅330元/年起!点击进入:易探云官方网站地址易探云国内挂机宝云服务器推荐:1、国内入门型挂机云服务器...

Boomer.Host(年付3.5美)休斯敦便宜VPS

Boomer.Host是一家比较新的国外主机商,虽然LEB自述 we’re now more than 2 year old,商家提供虚拟主机和VPS,其中VPS主机基于OpenVZ架构,数据中心为美国得克萨斯州休斯敦。目前,商家在LET发了两款特别促销套餐,年付最低3.5美元起,特别提醒:低价低配,且必须年付,请务必自行斟酌确定需求再入手。下面列出几款促销套餐的配置信息。CPU:1core内存:...

6元虚拟主机是否值得购买

6元虚拟主机是否值得购买?近期各商家都纷纷推出了优质便宜的虚拟主机产品,其中不少6元的虚拟主机,这种主机是否值得购买,下面我们一起来看看。1、百度云6元体验三个月(活动时间有限抓紧体验)体验地址:https://cloud.baidu.com/campaign/experience/index.html?from=bchPromotion20182、Ucloud 10元云主机体验地址:https:...

ai内存不足为你推荐
php虚拟主机求php虚拟主机提供商。。。哪里的 好,价格也优惠的vpsvps和服务器哪个比较划算vps主机vps主机是什么?ip代理地址ip代理有什么用?有图片..个人虚拟主机个人网站该购买什么类型虚拟主机?国外主机空间可以购买国外主机(空间一样吗?)来做私服吗?香港虚拟空间请大哥帮个忙,介绍可靠的香港虚拟主机?虚拟空间哪个好哪个网络服务商的虚拟空间服务比较好呢?国外网站空间怎么样把网站空间放到国外去?网站空间免备案哪有不用备案的网站空间?
美国服务器租用 广东vps vps.net 台湾服务器 vpsio 香港cdn 南昌服务器托管 php空间申请 域名和空间 广州服务器 空间合租 电信虚拟主机 ftp免费空间 hkt 彩虹云 web服务器搭建 web服务器是什么 沈阳主机托管 中国linux 免费php空间 更多