1 问题的提出
1.1 硬件技术背景
单片机的频率越来越高,RAM的访问速度也来也快,但单片机系统的效率并不一定成比例的提高。
目前,使用的主流单片机有80386EX(50MHz,外部地址/数据总线16位)、MPC860T(66MHz,外部地址/数据总线32位)以及DS80C32(25MHz,外部地址/数据总线8位);使用的SDRAM有HY57系列、K416系列(访问速度100MHz或133MHz);使用的SRAM 如IDT71024、IDT7256(50MHz);使用的Flash有AT29C512、SST39VF040、AT29C010(8MHz或15MHz)等。可见,SDRAM,SRAM的速度和单片机是匹配的,甚至比单片机的速度更快一点,不需要单片机插入等待状态。而Flash的访问频率则比单片机慢2~6倍,单片机往往要通过插入多个等待状态来和它相匹配,况且Flash多为8位,而当前单片机多为16,32位,更多的降低了单片机的工作性能。
根据上述分析,如果提高Flash的访问速度,扩展Flash为16位或32位,那么程序执行的速度就快了,单片机的性能也就提高了。如果能够将这一想法变成事实,而且成本低廉的话,那是不过的事情。事实上,可以将8位的Flash扩展为16位、甚至32位,但要付出2~4倍的成本。由于Flash结构及工艺原因,在目前不可能有高达66MHz的商用化且价格低廉的Flash。所以,只能通过其它方式来提升单片机的运行速度。
1.2 软件技术背景
首先,看看传统单片机程序的运行原理,为了便于说明,假定硬件平台为860T,时钟为50MHz;SDRAM空间4M×32bit,地址范围从0x00000000~0x00FFFFFF,访问时间10ns;Flash空间512K×8bit,访问时间为100ns,地址范围从0x02800000~0x0287FFFF(至于其它单片机,运行原理大致相同,可以类推)。860T在上电后,PC(Program Counter)=0x2800100,程序从PC指定的地方执行,首先执行初始化代码(BootCode),再执行主程序(AppCode)。程序从Flash中读取指令(code),来完成数据的传输——可能是SDRAM和内部寄存器的传输,SDRAM之间的传输,SDRAM和外设的传输,中断处理等各项工作。可见在程序运行时,很大一部分时间是从Flash中读取指令,而这个过程是很费时间的。以假定的860T硬件平台为例,因为Flash访问时间为100ns,所以读一条指令的时间至少是100ns,也就是说860T读一条指令的时候要等待100ns。(指令cache通过预取指令的方式,可以使实际取指令时间短一些,但这种方法的效果并不明显,况且很多单片机还没有指令cache。)
860T平台的内存分配如图1所示。
2 将代码从Flash搬运到SDRAM中的原理
通过上述分析,初始化代码BootCode只在程序启动的时候执行,就是慢一点,也可以接受。真正影响性能的是主程序(AppCode),因为这里的代码在不停的重复执行,如果可以缩短它的取指令时间,则单片机的空闲时间将大大减少,性能也就提高了很多。SDRAM的速度比较快,如果将代码搬运到SDRAM中,取指令时间就减少了很多;而且SDRAM空间大,不会因为代码占用了一部分空间而影响性能。但这不仅仅是简单的搬运过程,有物理存储器地址的变化牵涉在这个过程中。将软件源代码转换成可执行的二进制映像包括三个步骤:首先,每一个源文件都必须被编译或汇编到一个目标文件(object file);第二步,所有的目标文件要连接成一个目标文件,它叫可重定位程序(relocation program);,在一个称为重定址(relocation)的过程中,要把物理存储器地址指定给可重定位程序里的每个相对偏移处,生成一个可执行的二进制映像文件。如果在Flash中运行,则所有的物理存储器地址应该在Flash的地址空间中。如果要在RAM中运行,则所有的物理存储器地址应该在Flash的地址空间之中。也就是说,如果要使从Flash中搬运到SDRAM中的代码可用,则必须改变被搬运代码的物理存储器地址。
3 搬运代码的实现方法
下面结合假定的硬件平台,详细描述物理存储器地址重定位,代码搬运的原理及过程。我们编写两个c文件——RomTool.c、RAMapp.c。
RomTool.c完成860T初始化,SDRAM的刷新,中断及外设的初始化;Flash到SDRAM的代码搬运驱动模块及跳转模块。对应的二进制映像文件为RomTool.bin。
RAMapp.c是实际的应用程序, 对应的二进制映像文件为RAMapp .bin。RAMapp.bin被搬运后在SDRAM中运行。
3.1 物理存储器地址映射规则
RomTool.c的物理地址映射规则为:数据放在起始为0x3000,大小为0xf0000的SDRAM空间里;代码被烧结在起始为0x02800000,大小为0x10000的Flash空间里,不会被搬运,也在该空间里运行。
所以在RomTool.lnx中指定的定位规则也应该是这个地址范围,如下:
MEMORY
{
ram1: ORIGIN = 0x00003000, LENGTH = 0xf000
flash: ORIGIN = 0x02800000, LENGTH = 0x1000
}
SECTIONS
{
.data : {} > ram1
.text : {} > flash
}
RamApp.c的物理地址映射规则为:
数据放在起始为0x3000,大小为0xf0000的空间里;代码被烧结在起始为0x02810000,大小为0x70000的Flash中,它要被搬运到起始为0x00F00000,大小为0x70000的SDRAM空间里,即RamApp.Bin实际在SDRAM中运行。
所以,在RamApp.lnx中指定的定位规则应该在SDRAM中,如下:
MEMORY
{
ram1: ORIGIN = 0x00003000, LENGTH = 0xf000
ram: ORIGIN = 0x00F00000, LENGTH = 0x7000
}
SECTIONS
{
.data : {} > ram1
.text : {} > ram
}
,在860单片机系统的地址映射规则如图2所示。对照图1,可以观察到这和传统的程序地址映射有很大不同。
3.2 搬运的过程
860T上电复位,RomTool.bin首先被执行,完成初始化工作后,运行代码搬运函数,将RAMapp.bin搬运到SDRAM中,随后改变PC(Program Counter)的值,无条件转移到SDRAM中运行RAMapp.bin,如图3所示。
3.3 搬运代码的驱动模块及跳转模块源代码
(1)搬运代码驱动模块的代码
void MoveCodeF_to_RAM(UWORD *FlashCode_Add, UWORD *RamCode_Add,UWORD CodeLen) {
do{
*RamCode_Add++ = *FlashCode_Add++;
CodeLen?
} while ( CodeLen!=0)
}
该段代码是将开始地址为FlashCode_Add,长度为CodeLen的Flash代码搬运到开始地址为RamCode_Add,长度为CodeLen的SDRAM 中。
(2)主函数及跳转模块
#define FlashCode_Add_V 0x02810000
#define RamCode_Add_V 0x00f00000
#define CodeLen_V 0x00070000/4
void main(){
UWORD *I=(UWORD *) FlashCode_Add_v;
UWORD *j= (UWORD *) RamCode_Add_v;
UWORD *k= (UWORD *) CodeLen_V;
MoveCodeF_to_RAM( (UWORD *) i, (UWORD *) j, (UWORD *)k );
# 跳转模块
asm(“addis r2,0,0x00f0”);
asm(“ori r2,r2,0x0000”); # 代码起始地址0x00f00000
asm(“mtspr LR,r2”);
asm(“bclr 20,0”); # 无条件转跳到链接寄存器
# (LR)中的地址
}
FlashCode_Add_V:被搬运代码的首地址,在Flash中。
RamCode_Add_V:被搬运代码的目标地址,在RAM中。
CodeLen_V:被搬运代码的长度,按32位计算。
该函数在调用代码搬运MoveCodeF_to_RAM函数,将代码从Flash搬运到SDRAM中后,将程序指针转移到SDRAM中。注意跳转的地址一定要和RamCode_Add_V一致。
4 小 结
可见,正确完成代码搬运的关键在于:
① 确定被搬运代码的物理地址映射规则, 物理地址一定是在SDRAM中;
② 被搬运代码是被烧结在Flash中,后来又被搬运到SDRAM中;
③ 无条件转移到SDRAM中,运行被搬运代码(应用程序代码)。
对于其它型号的单片机,可以根据该原理类推,方法是一样的,只是具体的代码不同而已。相信你的单片机系统在经过这样的处理后,效率一定会高很多。
免责声明: 凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处。非本网作品均来自互联网,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。