解析基于ELF的嵌入式软件源码级交叉调试技术

时间：2009-09-02

　　开发任何一个软件都不可避免地存在各种错误，要修正错误必须找出其错误原因。通常程序员利用调试器来跟踪程序执行情况，快速有效地定位错误产生的位置从而找到引起错误的原因，并改正错误。

　　调试器为用户提供的主要功能包括：在目标程序中设置、删除断点；以单步执行或连续执行等方式控制目标程序运行；浏览程序中的变量或表达式的值；查看、修改目标机寄存器的内容；查看、修改目标机内存的内容。源码级调试器是面向语言的符号调试工具，它基于源代码的语句和符号跟踪观察目标程序，同时提供基于汇编级的程序跟踪功能以满足用户底层的调试需要。通用计算机软件一般在同一台机器上进行编辑、编译、调试；而嵌入式软件的目标系统多为特殊的专用系统，通常采用宿主机/目标机开发环境，借助通用计算机作为编辑源文件的宿主机，利用交叉编译器在宿主机上编译生成目标机的可执行代码，调试时通过通讯介质（串线或网络）将目标代码到目标系统上运行，利用交叉调试器进行跟踪调试。

　　一、源码级交叉调试器的实现途径

　　程序运行过程中目标程序的指令代码和数据都映射到目标机上相应的内存内容，为了实现源码级调试，利用目标文件中在程序编译链接时生成的调试信息来实现目标程序与源程序之间的映射，从而在源码级实现对程序执行情况的控制和观察。其关键在于找到调试控制点和数据在源程序与目标程序之间的映射关系。

　　任何数据都有名和值两个侧面，数据名与数据值之间的映射关系为：根据数据名得到存放该数据值的内存地址，再从目标机的内存地址取出其内容即为数据值：

　　调试中的程序控制点通常为源程序中的函数、语句行等，它们对应于装载到目标内存中的相应目标代码，要实现程序的运行控制关键在于得到源代码与目标代码之间的映射关系：由源码定位信息得到相应的目标码信息；由目标码地址得到相应的源码定位信息。源码定位信息为源文件名+行号或函数名；目标码信息为目标指令在目标机内存中的起始和终止地址。

　　嵌入式软件以宿主机/目标机模式开发，其交叉调试器分为宿主机部分和目标机部分，两者以统一的通讯协议进行通信，宿主机向目标机发送命令，目标机接收、执行命令并将结果返回宿主机，从而实现两机之间的交互控制。软件基金会FSF提供的调试工具gdb具有一套比较成熟的通讯协议----remote通讯协议，该协议作为开放软件被广为采用，在此我们选择了rmote协议作为交叉调试器的远程通讯协议。

　　二、ELF格式目标文件

　　目标文件是实现源码级调试的基础，需要详细分析文件的格式及内容以从中获取有用的调试信息。在设计调试器时采用可执行连接格式――ELF格式目标文件作为开发基础，ELF（Executable and Linking Format）是UNIX系统实验室(USL)作为应用程序二进制接口（Application Binary Interface（ABI））而开发和发布的，已被软件业广泛采用，在Linux系统中ELF格式是其默认的目标文件格式，许多嵌入式软件都采用ELF格式作为目标文件格式。

　　ELF目标文件主要有三种类型：可重定位文件，可执行文件，共享的目标文件，我们以可执行文件为分析对象。

　　ELF头固定在文件的起始位置，其它各部分的位置由ELF头及其它相关信息获得。

　　1、ELF头

　　ELF头是整个文件的入口，具有固定的长度，52个字节，包含14个值。包括ELF文件标识，程序头表和节头表的位置、长度，文件中段的数目和节的数目等信息。

　　2、程序头表与段

　　程序头表中有多个表项，每个表项是一个程序段的信息，固定长度为32个字节，包含8个值，包括段在文件中的位置，段在内存中的起始虚拟地址，段的长度及其它属性等。调试器根据程序头表中的信息来确定需要到目标机上的目标文件内容(指令与数据)及其在目标机中的内存地址。

　　3、节头表与节

　　节头表中也有多个表项，每个表项是一个节的信息，固定长度为40个字节，包含10个值，包括节名、节的类型、该节在文件中的位置、该节在内存中的起始地址（如果该节出现在内存映象中）、节的长度等信息。某些节是程序段的组成部分，如包含程序二进制指令代码的正文节.text和数据节.rodata,.hash等，某些节不作为段的组成部分，只提供其它的额外信息。为源码调试服务的有 .debug，.line，.symtab，.debug_ pubname，.debug_range等节，其中.debug, .line节包含了源码调试信息的基本内容。

　　.debug节中有多种类型的记录，可分为几大类：

　　（1）、编译模块信息：包含组成该文件的各个模块的源文件名，路径，及该模块的代码地址范围等。

　　（2）、子程序信息：包含程序名，程序类型，起始终止地址，程序返回结果存放地址等。

　　（3）、变量信息：包含变量名、变量类型、变量存放地址信息等，变量有多种类型，简单变量、结构变量等类型的变量其信息内容各有不同。

　　将.debug节中各项内容的结构关系抽象为家族关系。以节的起始为根，首先是一个编译单元的信息，它给出下一个编译单元（兄弟关系）在文件中的相对位置。紧跟着编译单元的是该编译单元中的子程序与公共变量信息（父子关系），同样的，编译单元中头一个函数记录或变量记录将给出它的兄弟的位置信息。紧随该函数记录的是该函数内部的子程序与局部变量信息。相邻层次成员是父子关系，同一层次上的成员是兄弟关系，如图4所示：

　　.line节中包含目标代码地址与源代码行号之间的对应关系。对每个编译单元给出其行记录信息的长度和目标码的起始基地址，以及该编译单元中所有的行记录，每条记录以固定的格式表示：“该行目标码相对于基地址的偏移，列号（保留，暂未使用），行号”。

　　综合上述程序段和节的内容，即可确定源码与目标码的映射关系。如给定一个文件名及行号，确定其目标代码的信息。首先根据文件名确定其在.debug节中的编译模块信息，从中可得该文件模块的起始终止地址；再由其起始地址找到该编译模块的行记录信息在.line节中的位置，根据行号找到行记录，得到该行目标码的地址范围；由这些地址信息，可直接从目标机内存中取得目标代码，也可结合程序段信息从目标文件的程序段中取得该行所对应的目标代码指令内容。调试器利用地址与指令信息就可以查看、修改、执行相应目标代码，供用户进行调试。

　　三、源码级交叉调试器实现的技术要点

　　在设计交叉调试器JDBG时，首先完成与目标文件无关的部分：连接目标机，查看修改目标机寄存器和内存；然后实现与目标文件有关的部分：目标文件到目标机，源码级调试功能，包括断点控制、执行控制、变量观察等，以下重点讨论各项功能的设计与实现。

　　1、目标文件

　　目标文件中包含多种类型的内容，目标程序在目标机上运行时只需要程序的二进制指令代码与相关数据，这些内容包含在文件中的可执行程序段中。目标文件时在宿主机上提取目标文件中的代码与数据段，根据其地址映射关系利用remote协议中写内存的功能在目标机上建立程序的远程映像。

　　2、断点

　　断点是调试器控制程序执行的基本手段。各种机器有其特殊的断点指令(如X86的int3指令)，设置断点就是将机器断点指令替换所指定程序单元中的指令，使得程序运行到断点指令处时，产生“断点异常”，用户程序不再继续执行下去，目标机向宿主机返回断点停止信号，由宿主机调试器接管对用户程序的控制。

　　断点分为逻辑断点与物理断点，两者是多对一的关系。逻辑断点与源代码对应，提供源级断点信息(源文件名+行号或物理地址等)；物理断点与目标码对应，提供断点的目标码地址及断点处的指令内容。插入一个断点即根据逻辑断点信息确定物理断点地址，将该地址对应指令用机器断点指令替代；删除断点即恢复断点指令处预先保存的原指令，使得程序可继续执行。

　　检查点是一种条件断点，使程序在条件满足时停止执行。通常条件都涉及表达式的值变化，利用写内存保护来检查表达式的值是常用的方法，但这种方法不适用于不具备MMU功能的处理器。某些处理器(如i386)提供了专门的调试控制寄存器，通过在调试控制寄存器中设置相应线性地址及中止条件(读或写)即可中止程序的运行。通过查询方式检查表达式的值也是一种可行的方法，其效率相对较低。当检查点的条件满足时，检查点的操作与普通断点类似。

　　对一个断点应具有基本的插入、删除、使能、使不能等基本操作功能。在设计中采用双向链表结构作为断点的数据结构，使得断点控制更加方便高效。

　　3、启动程序运行

　　启动程序运行首先从目标文件的ELF头中得到应用程序的入口，将目标机的PC寄存器置为该入口地址，从入口处开始执行程序指令。如果程序中没有设置任何断点或检查点，则程序一直运行到结束；如果程序中有断点，则程序运行到个断点处停止并返回其停止位置。

　　4、源码级单步调试

　　源码级单步以行为单位，一行源代码对应多条机器指令，因此一个源语句的单步执行需要多个机器指令的单步执行。简单的实现方法就是从源语句对应目标代码的起始地址开始逐条单步执行机器指令。显然这种方法效率很低，尤其调试嵌入式软件需要大量宿主机/目标机间的通讯，而且有的处理器自身并不提供机器单步执行指令。因此，更有效的方法是用“内部临时断点＋连续执行”的方式来实现。

　　用机器单步执行时，每执行完一条机器指令立即读取当前PC，判断程序停止位置。调试器对程序的控制是即时交互的，当单步执行结束、跳转或进入函数调用时，调试器都会即时得知。不采用机器单步，则不具有这种即时掌握程序运行状态的便利，需要在运行前反汇编目标代码，通过分析汇编指令预测程序单步执行可能的出口位置，并在该处设上断点。可能的出口位置包括该行指令的终止地址、跳转、分枝跳转、函数调用等指令。对于跳转指令，能得到地址则直接在跳转地址处设断点，不能得到跳转地址则在指令处设断点，再执行跳转指令由当前PC值确定程序停止的位置。对于函数调用指令，如果采用单步跳过（stepover）方式，则将其作为普通指令看待，直接执行调用函数；如果采用单步进入（stepinto）方式，则需在指令处设断点，再执行调用指令，以进入函数内部让用户继续跟踪程序的执行。

　　以单步跳出方式（stepout）执行程序时，以子程序为单位，需执行完当前子程序的所有代码，在调用该子程序的下一条语句处停止。通过反汇编当前子程序的所有指令，可得到该子程序所有可能的函数返回出口，在这些函数返回指令处设临时断点，程序运行到断点处再执行该返回指令跳出当前子程序，处理调用该子程序的语句行的后继信息，终确定程序停止位置。

　　5、数据浏览

　　数据与指令同样是构成程序的根本。数据类型繁多，不同的类型处理起来有所不同，其基本原理是由数据名找到存放该数据的地址，再从地址中取出数据的值。关键在于找到名与地址的映射关系。这些信息可从.debug，.symtab等节中得到。全局变量一般可得到直接的地址信息，而局部变量采用堆栈方式存放在内存中，需根据从.debug中得到的该变量在堆栈中的位置信息来确定地址。采用表结构来管理变量，将每个变量的名、地址等信息登记在表中，将对数据值的操作转化为对相应地址的内存单元操作，如查看变量即为读取该变量所在内存单元的内容。

　　四、交叉调试器JDBG简述

　　JDBG采用图形用户界面，相应的命令提供图形按钮或菜单，并提供快捷键。进入调试之前，先连接目标机，在连接时设置连接参数并保存，在以后的连接中可直接使用已保存的设置参数。当宿主机/目标机处于连接状态时，目标文件，启动调试器。调试器启动后，用户可在打开的源文件中设置断点，运行的目标程序，查看/修改寄存器、内存的内容。当运行的目标程序停止后，返回停止点源码信息，用户可以观察数据，添加新的断点或删除已设断点，控制程序的单步执行或连续执行，或退出调试状态。

上一篇：基于嵌入式系统及其平台下学科分工的系统研究

下一篇：新型配电自动化远方终端设计方案