摘要:嵌入式浏览器可以广泛应用于各种信息电器和便携式网络终端中,在工业控制领域也有着非常广阔的应用前景。 本文提出了一种基于LINUX的嵌入式浏览器,介绍了实现方法和主要功能特点。该浏览器基于现有的嵌入式GUI,利用系统的HTEP函数库实现网络访问,根据文档类型定义和层叠式样式表规范,解析HTML文件和排版显示。此系统在MiniGUI下已成功实现。
0 引言
随着Intemet 普及率的迅猛增长,浏览器成为获取信息的标准工具,并且已经为广大Intemet 用户所接受。与浏览器相配合的各类软件,如视频、音频的Plug-in,都十分丰富。Intemet 上产生了大量的可浏览资源,也证明了浏览器这种方式的正确性,浏览器将成为网络生活中的。另一方面,消费电子、计算机、通信(3C)一体化趋势日趋明显,嵌入式技术成为研究热点,机顶盒、信息家电等新产品的出现让人们开始关注嵌入式系统,嵌入式浏览器也随之浮出水面。嵌入式浏览器可以广泛应用于Intenet-Tv、iDVD、Web 终端、数字电视机顶盒、掌上电脑等各种信息电器和便携式网络终端中,在工业控制领域也有着非常广阔的应用前景。
本文提出了一种基于I 肿D(系统的嵌入式浏览器,并介绍了该浏览器的设计实现方法。
1 系统基本原理
1.1 嵌入式浏览器的基本工作流程
输入 URL,通过网络读取对应HTML 文件:交给HTML 的解析器进行解析,在解析的过程中如果发现新的URL(主要是图片、样式单以及Jscript. 外部代码),提交给网络部分去读取;在解析的过程中形成DOM 树和Render 树;利用解析结果生成对应控件并排版显示。层次关系如图 1 所示。
1.2 嵌入式LINUX 系统
对嵌入式应用环境下的LINUX 系统,要求代码空间小,运行速度快,资源需求少。可以通过对通用I 删JX 系统的配置和功能代码精简得到,也可采用商业的嵌入式LINUX。
1.3 嵌入式GUI
GUI(图形用户接口)是浏览器的运行平台,并提供了窗口编程的接口函数。嵌入式GUI必须运行效率高,功能精干。常用的嵌入式GUI 有MicroWindows、OpenGUI、QT/Enbedded、MiniGui 等。
1.4 网络访问
网络访问通过HTTP(超文本传输协议)实现浏览器与Web 服务器之间的通信,H'ITP 规定了发送和处理请求的标准方式,规定了浏览器和服务器之间传输的消息格式及各种控制信息。
1.5 DTD
DTD(文档类型定义)定义了HTML 文件中所有的标签和属性,及标签的嵌套关系和属性的取值范围。它是解析HTML 文件的基础。
1.6 DOM
DOM(文档对象模型)是HTML,文件解析的结果。它的内容包括了当前HTML 文件中所有的元素、元素的子元素、元素的属性、元素的样式、元素的事件等。
1.7 RENDER 树
RENDER 树供排版输出程序使用。RENDER.树结构与DOM 树类似,HTML 解析器生成DOM 树的同时生成RENDER 树。RENDER 树的内容定义了实际显示区域的嵌套关系。
2 系统设计概要
2.1 HTML 解析
HTML 解析主要功能是分析取得的HTML 文件,辨认出标签、属性和内容,并根据DTD定义校验元素结构关系。解析结果形成DOM 树和RENDER 树,供输出引擎排版显示。如图2 所示。
图2 浏览器基本工作流程
HTML 解析可分为以下几个子模块:
2.1.1 DTD 构建 。
DTD 定义了HTMl。的语法规范。根据应用需要可选择Transitional DTD、FIarIleset DTD及Strict DTD。依据DTD 规范说明,可以建立啪表格,每一个DTD 表格记录定义一种标签的基本信息,包括元素ID、元素名、子元素列表、属性列表等。解析HTML.必须首先构建DTD 表格。
2.1.2 语法分析HTML 文件
语法分析的主要思路是:读HTMI。缓存区。如是起始标签,分析标签内的标签名、属性和属性值,根据[riD 定义判断此标签是否能被栈顶标签包容(为判断元素的嵌套关系。建立的一个栈表),如合法,生成DOM 节点,如果此标签需有结束标签,此标签入栈;如包含关系不正确,放弃此标签,继续读缓存。如是结束标签,从栈顶向下查找有否对应起始标签,如有,将对应起始标签以上的栈元素出栈;如没有,放弃此标签,继续读缓存。如是标签间的文本,则放至文本缓冲区,直到读到标签时,生成文本DOM 节点,插入到DOM 树中。在生成DOM 节点时,生成对应的RENDER 节点(DOM 节点与RENDER 节点不一定对应)。每个RENDER 节点代表一矩形区域,RENDER 类型指明该矩形区域的特性,可分为:BlockBOX、InlineBOX、LineBOX、Anonymous BlockBOX 等。在后面排版显示中将介绍各类RENDER 的使用。
2.1.3 CSS 的应用
作用于标签的CSS 可分为三类:标签的缺省样式、从上层标签继承的样式、标签属性中定义的样式。它们从小到大的应用优先级是:缺省样式、继承上层标签的样式、标签属性中定义的样式。在生成DOM 节点时,分析以上三类样式定义.得到当前元素的应用样式单。样式的数据结构与属性类似。
2.2 排版显示
排版输出模块利用对HTML 文件解析的结果DOM 树和RENDER 树,生成浏览器窗口及相应的控件,并在屏幕上排版显示。排版是基于CSS2 的规范进行的。
排版显示基本原理:所有的HTML 元素在屏幕上都表示为矩形区域(Box)。排版实际上就是把这些Box 摆到正确的位置上。Box 主要可分为InlineBox、BlockBox。BlockBox 代表一个矩形容器框,Linline box 表现为文字、图片等具体内容形成的矩形区域。一个Block Box的直系儿子要么全是Block,要么全是Inline。若一个Block Box 的儿子中,既有Block 又有Inline,就要包装一层.即把inline box 用一个Block Box 包起来。这个自动产生的Block Box就是所谓的Anonymous Block Box。若一个Lnline:Box 有Block Leve 的儿子,那么它自己也应转为Block level。即Inline Box 不可能有Block Box 做儿子。(Block box 和Inline box 的包含关系要求的实现在前面生成RENDER 节点时解决)
一个Box 可以在三种定位方式下进行排版:常规定位、定位、浮动定位。通过元索的属性position 和float 可以设置定位方式。
2.3 网络访问
利用 LINUX 系统的HTTP 函数库,实现浏览器与WEB 服务器的通讯。为了管理多个通讯请求,需要建立任务队列。请求得到响应后,响应结果放在缓冲区,发送消息回对应控件,由控件的处理函数分析响应内容。原理如图3 所示。
图3 网络访问原理
主要接口函数:
AddJobTbQueue(struct Job*Job):加入新任务到任务队列
GetHTMLFile();利用HTTP 函数实现任务队列的头个任务
NetworkContml():任务调度
3 系统功能特点及实现情况
此系统设计实现了浏览器的基本功能,能够满足一般嵌入式环境的需要。在的嵌入式GUI 上开发项目,可以借用的科研成果,加快开发进度。系统结构简单,易于实现。代码量较小,资源占用较少。在国产自由软件MiniGUI 下已成功实现。
4 结语
本文的创新点是基于现有的嵌入式 GUI,利用系统的HTEP 函数库实现网络访问,根据文档类型定义和层叠式样式表规范,解析HTML 文件和排版显示。设计与实现了基于LINUX系统的嵌入式浏览器的基本功能,满足一般嵌入式环境的需要。其次,本系统简单,易于实现,代码较小,资源占有较少。
免责声明: 凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处。非本网作品均来自互联网,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。