语义Web发展很重要的目的就是要建立人与机器都可以理解的知识系统,将信息用语义Web本体论的思想来表达可以部分解决机器无法理解人类所描述知识的问题。在语义Web本体论的基础上建立机器进行自动推理的方法,将所描述的知识进行推理并重新组织加工。目前,具有通用性的推理系统主要是系统,在系统中所使用的知识呈现多元化,其中包含语义网络、框架、法则、逻辑等。虽然这些知识的表示方法各有其优点,但在建立推理系统时都存在各种各样的缺点和不足。传统的框架表示知识无法表现的交集、合集等概念;语意网络表示的知识由于表现方式不是结构化,所以带来了运算不便的问题;法则表示知识通常很难表现类的层次关系,存在知识表现不紧凑的问题;逻辑的方式表示知识存在的问题是无法将类别与实例分开,使得在推理时无法单独从类别中推导公理性的知识,使推理的效率难以提高。
语义Web本体层能够解决机器推理存在的知识表示问题,并且基于本体描述的知识可以多次重复利用于相关领域的推理,充分利用所建立的知识库。本文主要就是依据这两点来探究关于语义Web本体论应用于传统的系统进行推理时需要解决的问题。
1 语义Web的技术
为了实现语义Web信息服务智能化与自动化的目的,语义Web研究者们开发了许多新技术并提出了一系列的技术标准。Web是一种典型的分布式应用结构。Web应用中的每信息交换都要涉及客户端和服务端。因此,Web开发技术大体上也可以被分为客户端技术和服务端技术两大类。与Web客户端技术从静态向动态的演进过程类似,Web服务端的开发技术也是由静态向动态逐渐发展、完善起来的。Web服务器技术主要包括服务器、CGI、PHP、ASP、ASP。NET、Servlet和JSP技术。这里对这些技术作简要介绍,以使读者对Web技术有一个总体的认识。从某种程度上讲,语义Web的发展就是建立在一定逻辑基础上的信息表示语言和标准的发展。由于语义Web的知识表示具有创建上的分散性;同时又具有应用上的通用性,所以需要一个统一的框架,这个框架应该能够满足这种分散性,以满足知识跨应用、跨领域的可互操作性。Berners Lee在XML2000大会上描述了这个体系结构,如图1所示。
在这个层式结构中,上层将下层的语言机制作为本层的支撑语言,如表1所示。通过分析器,从合法有效的下层描述中抽取出本层所能理解的模型,实现更多的语义处理功能。因此,语义Web是向下兼容的,比如,当用RDF/XML表达OWL时,如果只有RDF分析器,虽然仅仅可以部分解释该本体内的类结构,但能完全解释该本体内的所有实例。因为这只与RDF(S)语法相关。由于Web的海量信息不可能在短时间内全部建立语义标记,而且语义的标记方法也将不断发展,将会提供更广泛的语义支持能力。这种上层兼容下层的方式,为语义Web的发展提供了良好的基础。RDF(Resource Description Framework), 一种用于描述Web资源的标记语言。RDF是一个处理元数据的XML应用,所谓元数据,就是“描述数据的数据”或者“描述信息的信息”。也许这样解释元数据有些令人难以理解,举个简单的例子,书的内容是书的数据,而作者的名字、出版社的地址或版权信息就是书的元数据。数据和元数据的划分不是的,有些数据既可以作为数据处理,也可以作为元数据处理,例如可以将作者的名字作为数据而不是元数据处理。
2 基于语义Web的推理系统设计
传统的语义Web推理形式本身虽然具有很多优点,但其自身也存在相应不足,主要是由描述逻辑本身的不足造成的,因此采用描述逻辑结合SWRL规则来表示知识和规则。本设计中采用的推理方式包括2种:(1)基于描述逻辑的本体推理,应用描述逻辑产生推理的目的是为了使建立的本体有更好的层次结构,同时不产生冲突定义,(2)基于系统的推理,主要目的是实现本体与基于本体的规则相结合产生推理。
在语义Web中,目前对于本体的表示多采用OWL DL进行描述,采用OWL DL建立起来的本体完全具有描述逻辑的推理能力,OWL(Web Ontology Language)是W3C开发的一种网络本体语言,用于对本体进行语义描述。由于OWL是针对各方面的需求在DAML+0IL 的基础上改进而开发的,所以一方面要保持对DAML+0IL/RDFS的兼容性,另一方面又要保证更加强大的语义表达能力,同时还要保证描述逻辑(DL,Description Logic)的可判定推理,因此,W3C的设计人员针对各类特征的需求制定了三种相应的OWL的子语言,即OWL Lite、OWL DL和OWL Full,而且各子语言的表达能力递增。 因此可以采用Tableaux算法推理机对所建立的本体进行推理,发现其隐藏知识,并且发现知识中的矛盾之处,方便对本体进行修改和完善;另外从语义Web引入本体论的目的来看,采用本体论的观点,可以使人与机器都完全理解人类所建立起来的本体知识,便于知识的共享和再次利用。以OWL DL建立起来的本体具有丰富的表达能力,所以在此基础上寻找相应的规则表示方法来进行基于系统的推理,本文采用的规则表示方法是语义Web规则描述语言SWRL,其优点是SWRL能够很好地结合OWL DL本体知识。因为SWRL自身的建立就是基于OWL本体之上,在定义规则时,可以充分结合OWL本体中丰富的表达能力达到推理目的。在用OWL DL建立本体基础上,采用Tableaux算法推理机对所建立的本体进行推理。,将转换后的Jess格式的知识和规则导入到Jess推理引擎进行基于系统的推理。
根据以上分析,建立一种基于语义Web的推理系统模型,如图2所示。其中,“推理1”使用RACER,表示具有描述逻辑推理功能的推理机。因为基于Tableaux算法的RACER不仅可以与Protégé很好地进行描述逻辑的推理,而且可以使用系统Jess通常的推理引擎,很方便地进行以OWL DL描述的本体推理。推理系统中的知识库使用语义Web的本体描述语言OWL DL进行表示;使用语义Web规则语言SWRL进行定义。图2中,“本体1”表示根据领域知识建立起来的本体;“本体2”经过“推理1”进行基于描述逻辑的推理后建立的层次化更加良好,并且满足一致性要求,没有冲突发生的本体。其中,SWRL规则的定义使用“本体2”中的TBox和ABox,也就是“本体2”的概念、属性或者实例,在这些OWL DL基本元素的基础上,根据相应的推理要求结合SWRL语法格式可以产生与本体具有良好结合的SWRL规则。
将该推理系统分为3个步骤进行设计:
(1)采用OWL进行领域本体的设计以及在领域本体基础上的SWRL规则设计。
本体的建立可以结合应用,根据具体的本体论工程模型进行本体的设计,通常使用的工具是Protégé。Protégé是一个开放的开发环境,可提供多种插件进行功能的扩充。建立SWRL规则时要充分考虑并且结合已经设计好的本体进行相关规则的设计,避免出现规则冲突。SWRL(Semantic WebRule Language)是以语意的方式呈现规则的一种语言,SWRL规则部分的概念是由RuleML演变而来,再结合OWL本体形成,目前SWRL已经成为W3C的规范之一。SWRL在OWL DL 和 OWL Lite 子语言中包括类Horn规则的高层次的抽象语法。它提出一个语义理论模型给OWL本体提供正式的意义,其中包括利用抽象的语法写成的规则。领域本体建立后,通过将本体知识导入到描述逻辑推理机上进行推理,可以对本体进行分类整理,发现其中的隐含知识,建立一套基于语义Web本体论的知识库和规则。OWL DL知识库具有描述逻辑的特性,可以更好地表现知识、进行推理。SWRL规则可以充分地结合本体进行规则设计,使得在设计规则的时候更方便。
(2)将OWL知识和SWRL规则转化为推理引擎可以接受的格式。
现在的系统通常不接受OWL和SWRL表示的规则,因此需要进行格式的转化。本体知识库格式的转换,首先将本体导入到描述逻辑的推理机,通过描述逻辑的推理机将本体进行推理。因为ObjectTypeProperty属性实例是对象关系的实例,通常需要推理机首先将其客体连接到具体的DataTypeProperty,这样就可以在推理机中形成具体的三元组,将三元组导入格式转换程序进行格式转化,转换后的格式推理引擎可以接受。因为SWRL文件本身就是XML文件,并且具有固定的语法格式规范。所以可以通过XSLT的方式来进行格式的转化,从而使推理引擎可以接受规则。在计算机科学中,XSLT是扩展样式表转换语言(Extensible Stylesheet Language Transformations)的简称,这是一种对XML文档进行转化的语言,XSLT中的T代表英语中的“转换”(transformation)。它是XSL(Extensiblestylesheetlanguage)规范的一部分。XSLT用于将一种XML文档转换为另外一种XML文档,或者可被浏览器识别的其他类型的文档,比如HTML和XHTML。通常,XSLT是通过把每个XML元素转换为(X)HTML元素来 XSLT完成这项工作的。通过XSLT,您可以向或者从输出文件添加或移除元素和属性。您也可重新排列元素,执行测试并决定隐藏或显示哪个元素。描述转化过程的一种通常的说法是,XSLT把XML源树转换为XML结果树。
(3)系统的推理。
将知识和规则导入到系统的推理引擎,进行模式匹配运算。终将运算的结果通过系统的API和用户应用程序进行交互。推理引擎的选择种类很多,可以根据具体情况进行选择。
语义Web的知识表达形式性,是在传统的描述逻辑基础上建立起来的,因此继承了描述逻辑的一些优点。但由于受描述逻辑的限制,也存在一些描述逻辑的自身逻辑缺陷,本文使用OWL DL结合SWRL可以对相关推理进行必要的扩充,从而形成一个较完整的推理系统。语义Web作为一项新的信息表达形式,在目前的研究中出现了许多分支,表达方式出发点是更好地进行信息描述,使人与机器都可以理解信息。而针对目前Web的信息量十分庞大的情况,语义Web的重点是要解决机器对语义理解的问题。
该推理系统主要基于OWL本体和SWRL规则。本体的建立只是在描述逻辑的基础上建立了一个知识库,虽然这种知识库改进了传统知识表示方法的一些缺点和不足,但这种知识库并不能充分表达推理层面上的复杂规则,这主要是由于描述逻辑的缺陷所造成的,这同样体现在本体中。所以,在定义一些限制规则的时候,往往无法完全地应用本体表示。为了能够充分地表达这些规则,采用SWRL作为规则的表现形式,因为SWRL规则的建立是在所建立的本体基础之上的,所以SWRL作为规则的表现形式可以充分与本体知识库结合。当需要对本体所建立的知识进行某种推理的时候,可以根据本体建立SWRL法则,实现本体的描述和规则的分离,另外,基于OWL的知识本身采用XML的形式,从而为知识库的共享和重复使用带来了极大的便利。
免责声明: 凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处。非本网作品均来自互联网,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。