TMS320DM642是TI公司推出的一款针对多媒体处理领域应用的芯片。文中简要介绍了TMS320DM642芯片的性能特点和在其上编写视频采集驱动的原理。
结合TMS320DM642芯片类/微型驱动模型,提供了按帧采集ITU-R BT.656数据驱动的实现方法,并详细讨论视频采集驱动的硬件配置及软件设计中的帧缓存管理、同步及数据搬运等关键技术。
TMS320DM642 是一款针对视频和图像解决方案的高性能数字多媒体处理器,具有极强的处理性能" 高度的灵活性和可编程性。因此主要用于视频信号处理和通信。结合合适的编码器控制算法,具有较高运算速度的TMS320DM642DSP 芯片可以作新一带视频压缩标准H.264编、解码器的硬件平台,实现满足应用需求的H.264 编码器。
驱动程序位于计算机软件的层(HAL 为硬件抽象层) , 直接与硬件设备的特性联系在一起。编写驱动程序不仅要了解设备的特性, 而且还要了解操作系统的结构难度较大。本文结合TMS320DM642芯片特点详细介绍了视频采集驱动开发。并详细讨论了驱动中帧缓存管理、同步及数据搬运等关键技术的实现。
1 TMS320DM642DSP芯片性能特点
DM642[3]是TI公司推出的一款针对多媒体处理领域应用的DSP,它是在C64x的基础上,增加了很多外围设备和接口。主要的片上外设有:三个可配置的视频接口,可以和视频输入,输出或传输流输入无缝连接,VCXO 内插控制端口(VIC), I2C总线模块等。这些接口和外设使得DM642比C6416更适合处理视频码流。
TI针对C64x系列的DSP提出了一种类/微型驱动模型[4],这种模型在功能上将设备驱动程序分为依赖硬件层(微型驱动)和不依赖硬件层(类驱动两层),两层之间使用标准的接口进行通信。类驱动为设备驱动的顶层,向应用程序提供统一的API接口,是应用程序与微驱动之间的接口。微驱动为设备驱动的底层,它直接处理所有外部设备的控制和初始化工作。类、微驱动程序的模型如图1所示。
2 视频采集驱动硬件配置
本文采用类/微驱动模型编写DM642芯片视频端口的视频采集驱动程序,充分利用片上的VP视频端口[5]和EDMA。经过A/D转换后的视频数据首先缓存到视频端口的FIFO中,FIFO写满之后通知EDMA将这些数据按照一定的规则搬运到SDRAM中。应用程序通过类驱动向微型驱动提交I/O请求,类驱动根据微型驱动的返回参数实现同步I/O请求。本文详细讨论按帧采集8 bit ITU-R BT.656视频数据驱动的实现方法。
2.1视频端口配置
TMS320DM642有三个可配置的视频端口:VP0、VP1和VP2,与视频采集芯片连接,无需外加逻辑控制电路和FIFO缓存,只需编程者编写相关驱动程序,就可实现图像采集或显示。每个视频端口各有20根数据输入输出管脚;每个端口又可以分为A和B两个通道,分别处理一路视频的采集或显示;各端口又可以配置为8/10-bit ITU-R BT.656模式、8/10-bit Raw 模式、8/10-bit Y/C模式、16/20-bit Raw模式和TSI模式等。
8bit量化,所以仅使用每个通道的后8个管脚,即将VPxD2~9,VPxD12~19(x对应三个端口0,1,2)直接与A/D芯片的8根输出管脚相连。输入的PAL/NTSC模拟信号经过视频解码芯片A/D后形成的数字视频信号直接进入相应的视频端口中。
当采集8 bit ITU-R BT.656数据时,视频端口接收A/D的亮度与色度的复合数据流(YUV422,称为packet格式:Cb,Y,Cr,Y,Cb,Y,Cr ),然后将它分解成三个单独的数据流(planar格式),分别是Y,U,V,再将分离后的数据打包存放到各自的FIFO中。
将FIFO分成3部分,其中为亮度数据分量分配的FIFO为1280B,为每个色度数据分量分配FIFO为640B;每个FIFO都有相关的存储器映射地址:YSRC,CBSRC和CRSRC;EDMA将使用这些地址作为数据搬运操作的源地址。每个视频端口多可以使用六个EDMA通道,当某个FIFO的计数器到达VCTHRLDn寄存器设置的数值时,就可以触发相应的EDMA(增强的直接存储器存取控制器)事件。
图1 驱动程序模型
图2 EDMA配置
2.2 EDMA配置
EDMA配置是为了从FIFO搬运数据到SDRAM中,采用1D/2D传输,即源地址不变,而目的地址则在每次传输后按索引值自动更新。我们为每一场设置一个EDMA参数,并将这些参数连接起来,传输任务的结束会自动从参数RAM中装载下传输需要的参数,从而实现某些复杂数据流的传输。
设置时首先打开与VP口相关的三个EDMA通道并申请12组参数RAM(hRld[0]~ hRld[11]),同时为每个通道申请一个中断号,留给EDMA中断服务程序使用;然后依次配置12个EDMA参数,并用hRld[0]、hRld[4]、hRld[8]三个参数初始化三个EDMA通道,准备数据搬运。
初始EDMA参数设置:数据源地址:YSRC;数据目的地址:一行起始地址;数据单元计数:一行的采样点数;阵列计数:一场的采样行数;阵列索引:一场采样点数的两倍(两场按行交叉存放);参数连接地址:下一组EDMA参数,各组参数连接关系如图2所示。
可选参数设置:优先级:用户设置;数据单元子长:32bit;1D/2D源/目的地址传输;源/目的地址更新模式:源地址不更新,目的地址按阵列索引更新;传输结束中断:使能每帧的底场结束中断,并设置中断码;顶场禁止;EDMA事件连接:使能所有EDMA参数的连接。
通过以上参数设置后三个EDMA通道分别负责从视频端口FIFO中搬运Y、Cb和Cr三个分量到SDRAM中;EDMA每启动,从FIFO中搬运一行的采集数据到SDRAM中,并在搬运完毕后自动更新目的地址;EDMA阵列计数值到0后启动参数连接,从参数RAM中装载下传输需要的参数,若使用了传输结束中断,则执行EDMA中断服务程序。
3 视频采集驱动的关键技术
在视频采集过程中,重要的是对视频数据进行实时控制和有效的传输,因此在程序设计中需要使用硬件中断,应用程序之间要同步,在中断服务程序中,根据视频端口内部FIFO的状态通过EDMA完成视频数据的读入SDRAM,并要考虑读入的数据的缓存管理。
3.1中断设置
中断服务函数用来处理外部设备的触发事件。对于视频采集应用, 每采集完一帧数据将触发EDMA中断。
EDMA中断设置:在中断服务表(IST)中添加EDMA_intDispatcher(),作为EDMA中断服务取指包(ISTP),然后使用EDMA_intHook()将两个亮度底场EDMA的传输结束代码与中断服务程序建立连接。
设置64个EDMA通道共享一个中断号,中断发生时,EDMA_intDispatcher()首先检测CIER和CIPR寄存器中的被置位的位,然后再调用由EDMA_intHook()连接的中断服务程序。中断发生后,通过传输结束代码进行区分当前中断是哪个EDMA通道触发的。
一帧数据采集完毕后,EDMA启动其中断服务程序。中断服务程序首先检查目前有无被挂起的请求任务,如果有,则微型驱动将当前帧的首地址等信息打包,并调用GIO模块的回调函数,回调函数唤醒被挂起的任务同时将该包传递给应用程序,实现应用程序与微型驱动之间的同步;更新下一帧的EDMA目的地址,准备采集下一帧。
3.2缓存管理
微驱动在中断服务函数中管理帧缓冲区,视频数据的读入SDRAM在SDRAM中申请两块缓存A和B,采样乒乓缓存的方式进行管理。
模拟视频输入PAL或NTSC都是按场隔行扫描,因此数据可以按照场模式进行存储,即先存储顶场再存储底场,在存储器中是单独的两场图像;或者按帧模式进行存储,即顶场和底场按行交叉存储,将两场图像拼成一帧图像。
按帧模式存储时,在SDRAM中申请两帧缓存,得到两帧的首地址;然后为每一帧中的每一场的亮度和色度分量指定存储地址,两场地址相差一个象素行,如图3所示:首先采集顶场,然后采集底场,两场按行交叉存放形成完整的一帧。
3.3同步
类驱动使用DSP/BIOS的GIO模块,该模块需提供必要的同步读写API函数及其扩展函数,同时需简化代码和使用数据缓存的大小。
应用程序通过调用GIO的API函数直接与微型驱动交换数据。应用程序与微型驱动同时对乒乓缓存A和B进行处理,即应用程序对A进行处理的同时微型驱动将当前采集到的数据保存到B;而微型驱动只有在采集完一帧之后才能将本缓存的控制权交给应用程序,因此应用程序与微型驱动之间必须实现同步。应用程序、类驱动程序、微型驱动程序之间的关系如图4所示。
图4应用程序、类驱动与微型驱动
程序通过调用SEM旗语模块实现同步。在DSP/BIOS配置工具中使用SEM_pend、SEM_post等函数配置GIO模块的pend和post函数。应用程序通过调用GIO的API向微型驱动申请缓存,GIO模块将应用程序的请求信息打包并传递给微型驱动,微型驱动首先检查当前帧是否采集完,若当前帧即将采集完毕,则微型驱动将当前帧的地址返回给GIO模块,否则向GIO模块返回一个挂起信号,通过调用GIO的pend函数,将应用程序的当前任务挂起,强制其进入阻塞状态,等待EDMA中断服务程序将其唤醒。
在应用程序中为了更方便的调用驱动程序,可以将GIO的API重新封装成更易使用的形式。对数据采集程序来说用的多的操作就是放弃当前帧,并从驱动程序中获取另一帧的控制权,同时调用此函数实现视频同步,这些操作封装后可以用简单的一个函数调用实现。
4 结论
在某些工程应用中仅要求对亮度分量进行处理,此中情况下可以去掉后两个EDMA通道,为应用程序节省更多的RAM空间。
本文作者创新点:充分利用TMS320DM642的硬件资源及开发工具,结合视频采集驱动的特点,利用类、微驱动模型降低系统中软件和硬件间的耦合性。本文设计的驱动程序可以接口不同的设备,当更换设备时,应用程序只需做很小的修改。提高了程序的可重用性和可移植性。
按此方法设计的视频采集驱动已用到实际的视频压缩编码的工程项目中,实践证明,采用这些方法编写的驱动程序运行稳定,与应用程序可以实现无缝连接,可以为各种视频处理算法提供了稳定的底层支持。
欲知详情,请登录维库电子市场网(www.dzsc.com)
[1]. TMS320DM642 datasheet https://www.dzsc.com/datasheet/TMS320DM642_14462.html.
[2]. TSI datasheet https://www.dzsc.com/datasheet/TSI_1093552.html.
[3]. 640B datasheet https://www.dzsc.com/datasheet/640B_1806164.html.
免责声明: 凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处。非本网作品均来自互联网,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。