前言
矢量脱靶量测量系统中,信号处理电路模块的主要任务是完成目标检测、数据存储以及给其它单元控制信号。系统所进行的目标检测需要计算信号的功率谱,所以先要对采集到的多通道(8路)数据按512点为一帧,作FFT处理,得到其频谱。为了监测接收机工作状态,需要在频域用恒虚警的方法,判断各路接收通道是否正常。除此之外,还需要对数据进行去直流、加窗的初始化处理,FFT结果再进行求模平方、累加运算,结果以FIFO输出。
选择用FPGA完成上述功能有诸多优点。首先,FPGA实现FFT运算是硬件处理,采用多个硬件乘法器、加法器,运算周期短,加上内部集成的大量块RAM可高速访问,所以速度大大提高。其次,FPGA片内逻辑资源丰富,可用的寄存器、锁存器、查找表和多路数据选择器等,能够实现硬件流水结构。这样多种运算可同时流水进行,减少了中间等待时间,整体速度大幅提高。再次,用硬件处理数据时延固定,可准确预测。
当然,FPGA也有不足。在FPGA内设定的数据长度相对固定,不够灵活,如果为实现高而采用浮点运算,则设计复杂,速度会降低,而且硬件开销大。用“块浮点”算法,可以很好地兼顾高速和高,并且硬件实现和控制相对简单,弥补了FPGA这一不足。
各运算单元算法和实现
如图1所示,信号处理器共包括4大部分:去直流、加窗的预处理单元,FFT运算单元,模平方累加与检测单元,FIFO输出单元。每个单元都分配有存储器来存储中间结果,它们是由FPGA中的块RAM生成的,不占用逻辑资源,而且访问快速。
预处理单元
如图2所示,预处理单元首先读入控制单元,在收到启动信号后,产生读信号和读地址,读取外部数据到内部存储器R、I,同时数据送入累加单元求和,移位后得到平均值,也就是直流分量。然后,在读取数据完毕时,读入控制单元启动加窗运算控制单元,读取原始数据和窗函数,这时原始数据减掉直流分量后,与窗函数相乘,就得到去直流和加窗后的结果,为FFT单元作好准备。
FFT运算单元
如图3所示,FFT运算单元主要包括蝶形运算、读写控制、块浮点运算、数据存储R、I和旋转因子存储单元。以下分别介绍。
蝶形运算单元
时域抽样(DIT)的基-2蝶型运算算法可以表示为:
其中复乘运算可表示为:
由蝶形运算算法公式可以看出一个基-2蝶形运算要进行一个复乘、两个复加。由复乘运算公式可知:若在一个时钟周期内实现复乘,需4个实数乘法器和2个实数加法器。因为这里采用的是Xilinx公司的VirtexII系列FPGA,内部有硬件乘法器,不占用逻辑资源,因此为了简化结构和提高系统的稳定性,采用4乘法器的直接实现结构(见图4)。
读写控制
FFT读写控制单元负责产生FFT运算过程、各个阶段RAM的读写信号和地址信号,以保证各级运算数据的正确调用和存储。此外,还需要协调各部分的时序关系。因为按时间抽取的FFT是混序,在实际运算中,直接将输入数据按原位运算要求的“乱序”存放是很不方便的。因此总是按自然顺序将输入序列存入存储单元,再通过变址运算将自然顺序变换成按时间抽取的FFT算法要求的顺序。变址过程可以用程序安排加以实现。计数器顺序计数(0~511),将计数器的位(第‘0’位)取反后,对应位进行交换,就能产生每的数据读取地址。同样的,旋转因子的地址是由计数器地址交换后,特定位置零产生的。由于采用原位运算,每级蝶形运算的写地址和抽取地址完全相同。
块浮点
块浮点由“溢出检测”和“指数累加器”组成。如果输入蝶形单元中的数据的实部和虚部是16比特,那么输出数据实部和虚部溢出是2比特。所以,每蝶形运算中,“溢出检测”根据输出数据的高三位(位是符号位)就可以判断溢出情况,由此决定下蝶形运算时,如何选择上18位结果数据中的16位进入蝶形单元。溢出的位数由指数累加器累加,决定FFT运算结果的指数位。
数据存储
FFT运算单元先读取预处理结果的实部、虚部,送入蝶形运算单元。级结果也会分成实部、虚部存储在本单元的数据存储器中。此后每都进行原位操作,终的结果也存于这两片RAM中。旋转因子事先单独存储在一片512×16bit的RAM中,由控制单元读取。
模平方累加和检测单元
FFT运算结束后,会启动模平方累加和检测单元。这部分主要由模平方累加控制、接收状态检测、累加单元和存储器构成,如图5所示。
控制单元负责协调各部分工作,包括读取FFT结果,送给两个乘法器和一个加法器进行模平方运算,然后把结果送到累加存储器;在参考频点到达时刻启动状态检测单元。在每一路FFT结果出现时,锁存当前的指数位和累加单元的指数位。需要注意的是,FFT的结果是逆序存储,所以读取的时候需要变换地址。
接收状态检测单元的功能是根据模平方结果,在频域用恒虚警的算法来判断各个通道中相位参考信号是否正常接收。因为接收的相位参考信号是实正弦,所以每个通道的512点FFT结果中信号频点是对称分布的。因此恒虚警检测选择用对称频点的模平方均值作为信号功率,信号频点前后各64个噪声点的模平方均值作为噪声功率,信噪比(SNR)门限定为18dB(64倍)。即
和 (X(n) +X(512-n))/2比较,其中n=n1,n2,n3,是三个信号频点。如果其中有两个都超过门限,则认为接收机的这一通道正常工作。判断得到的每一通道的状态,都锁存在寄存器中。一方面从I/O输出,另一方面作为模平方累加的使能信号。如果通道正常,则累加这一通道的值,否则不累加。因为一旦通道出现问题,接收噪声会被大幅放大,这将严重影响模平方累加总的检测信噪比性能,会造成整个数据采集的失败。
完成上述功能,用到四个累加器和一个比较器。累加器分别累加3个频点信号和1个噪声信号,使能端由模平方控制单元给出,保证正确频点的数据被累加。比较器同时比较三个频点的信号和门限,给出终比较结果。
模平方累加单元是求多通道的模平方和。由于采用了块浮点,每一通道512点FFT的指数位都可能不相同,所以需要将FFT结果的指数位和累加单元的指数位比较,以大的一个作为基准,右移另一个,对齐后相加,并且保存大的指数位,作为累加结果的指数位。
FIFO输出单元
用异步FIFO作为结果输出,使用简单,而且可以节省地址线,减少PCB板的难度。Xilinx的集成工具ISE中的Corgen IP可以把FPGA内部的块RAM生成异步FIFO。这里采用宽度32位,深度1023的FIFO。当512点模平方累加结果存入FIFO时,FIFO产生半满信号,通知外部读取。需要注意的是,这里的FIFO是用读时钟和输出使能控制,如果外接读信号和片选,那么在个读周期,FIFO输出的是缓冲区里的数据,而不是实际个数据。之后的一个周期才会输出实际个数据。
性能测试
用实际采集到的8通道数据做测试。所加的窗函数是汉明窗,“X”号代表的点是在MATLAB中用双浮点运算得到的结果,实线描绘的是用处理器运算得到的结果。由图6可以看出,采用块浮点的算法可以保证足够的运算。
用ISE综合布线后,系统的工作频率可达到70MHz,完成8路512点复数FFT、模平方累加以及结果输入到FIFO的运算执行总时间为732ms。达到了高速处理的要求。
结语
本文将雷达信号处理中常用的多种运算,FFT、求模平方累加和恒虚警处理集成在一片FPGA中,是有实际意义的。■
参考文献
1 祝裕斌. 超高速FFT芯片设计的理论和实现. 学位论文. 中国科学院声学研究所,1994.
2 刘振宇. 基于ASIC的数字脉压及HDLC芯片设计的研究. 学位论文. 北京理工大学,2002.
3 Xinlinx Inc. VirtexII Platform FPGA User Guide,2002.
4 侯伯宁,顾新.VHDL硬件描述语言与数字逻辑电路设计.西安电子科技大学出版社,1999.
5 PCB datasheet https://www.dzsc.com/datasheet/PCB_1201640.html.
免责声明: 凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处。非本网作品均来自互联网,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。