首页范文大全地理信息系统基本概念十篇地理信息系统基本概念十篇

地理信息系统基本概念十篇

发布时间:2024-04-25 20:35:05

地理信息系统基本概念篇1

关键词:本体信息检索搜索引擎

中图分类号:tp391文献标识码:a文章编号:1007-9416(2013)07-0043-01

1引言

随着信息技术发展与应用的不断深入,网络已经成为世界范围的信息源。与之相伴的是信息检索问题,怎样实现在海量网络信息中获取符合用户需求的信息,是信息检索界亟待解决的课题。本文以图书信息的查询为例,从而极大地提升图书查询的准确性和效率,使图书馆能够为用户提供更高品质的服务打下基础,本文的成果具有比较好的理论价值与实践意义。

2本体技术概述

本体是以系统化的方法来描述客观世界的事物,从而能够实现事物中所包含元素的集成和重用,从而将信息抽象为知识。在对事物的描述中,本体将所有的事物分解为不同的概念,并准确地定义概念之间的逻辑联系。当前,作为一种信息技术的实现方法,本体论在计算机领域中具有比较重要的价值与意义,正在一些领域有着比较广泛应用,包括语义网络的实现、智能搜索的设计、异构数据的整合、以及GiS系统和图书馆的数字化等。在这其中,语义网络的研究和应用是一个热点。

3基于本体的信息检索设计与实现

3.1系统框架设计

结合目前应用比较广泛的B/S的结构体系,本研究所涉及的信息检索结构分为三个层次,下面分别进行阐述:(1)应用层的设计。在基于本体的检索系统中,应用层的功能是处理用户需求,实现用户和系统的交互。在应用层中,通过用户界面的表单来处理用户所输入或者选择的查询请求,对请求的格式进行初步处理之后传输至逻辑层进行进一步的处理,并将由逻辑层传输到本层的检索处理结果向用户显示。(2)逻辑层的设计。逻辑层是检索系统对查询和检索结果进行处理的核心部分,主要功能有:用户查询的生成、用户查询条件的表达、用户查询的执行。逻辑层的设计成股份考虑到了检索内容的本体模型与查询处理之间的匹配。(3)数据层的设计。数据层的功能是对系统的数据进行存储,针对本文所研究的图书信息而言,将会为所有的图书数据构建一个基于本体的数据库,本研究选择的是sqlserver数据库。在数据库中,结合本体库知识对所存储的信息以及信息之间的联系进行标注,从而使图书信息能够以本体的规范进行存储,以便查询。

3.2检索方法的设计

当前,无论是基于哪一种搜索引擎,具体的检索结果往往难以保证足够的查全率和查准率。其核心原因在于:首先对没能准确地表达用户的查询需求,导致信息系统难以精确地把握查询需求;其次是系统是以机械匹配的方式来处理用户所输入的检索关键词,因此没能对所查询的语句进行必要的扩展。所以本研究所涉及的基于本体的检索方式的设计基本思路为:(1)基于本体对于事物的描述,首先对用户所输入的查询条件进行整理和优化,把其查询条件进行转换,使之能够体现为本体的概念以及本体元素之间的联系。(2)结合本体的信息处理模式,对转换之后的查询条件进行概念上的扩展,最终形成符合本体属性和特点的查询式,开始查找,并得到结果。

3.2.1基于本体的检索优化方案设计

此处将用户查询条件所属的原始概念空间定义为{C,R},在该空间中,C的涵义是查询条件所包含的全部概念项,R的涵义是全部概念项之间所拥有的逻辑关系。在本体的设计理念下,本研究把检索优化的步骤定义为(1)把概念项空间C里用户的查询概念进行转化,使之成为本体类型的概念,从而构建基于本体的概念;(2)结合查询概念之间的逻辑关系R,对查询条件进行逻辑转换,从而构建符合本体模式的优化概念空间。

在(1)中,首先设概念项空间C里所包含的概念项是(C1,C2,C3,C4,C5……),针对里面的所有概念项,在已经构建的本体知识库里搜索与这些概念项匹配的概念,所有的同义词以及词性变换均能够生成新的记录,以(Ci,oi)表示。记录中,Ci的涵义是概念项(C1,C2,C3,C4,C5……)中的一个元素,oi则表示图书信息本体里和Ci匹配的概念,可知在这样的模式之下,每一个概念项均可能有多个与之匹配的概念,而所有的匹配概念最终形成新的概念集o。当前概念相的匹配完成之后,则进行针对查询条件的逻辑转换,最终通过一套逻辑转换规则形成新的逻辑关系。

3.2.2检索的语义扩展

在对用户的查询条件进行本体话处理之后,有可能会出现无法找到与之匹配的概念的情况,这时候需要对检索进行语义的扩展。扩展的目的是从一个概念延伸到其他概念,以及从一个属性眼神至其他的属性,从而实现查询的准确率。语义扩展包含三个方面,分别是同义词的扩展、子概念的扩展以及父概念的扩展。下面进行详细的阐述:(1)同义词的概念扩展。在中文的表述中,同义词的普遍存在的。相同的检索条件可能有多种不同表述方法,此时需要以同义词的扩展来达到检索的准确率。在本体库的构建中,将属于同一概念的所有表达方式进行标记,当收到用户的检索请求以,系统执行“或”运算,得到所有的同义词并集,提高查全率。(2)子概念的扩展。通过以更加贴近用户查询条件的子概念看来表达检索,从而将检索结果定位在更加精确的领域。举例来讲,用户搜索图书信息时,如果输入“通信介质”作为查询条件,未能看到满足要求的检索结果,此时根据本体知识的架构,通讯介质又可以包含以下的子概念:如光纤、同轴电缆、微波等,通过子概念的扩展,实现信息检索的查准率。(3)父概念的扩展。与子概念相反,父概念的扩展指的是将查询条件的上层概念来替换用户所输入的查询条件,从而实现结果的扩展。举例来讲,如果输入“工作站”作为查询条件,未能看到满足要求的检索结果,此时根据本体知识的架构,工作站的父概念包括网络硬件、局域网节点等,从而达到更好的查准率。

4结语

本文结合当前信息检索所存在的不足之处,以图书馆信息检索为例,引入本体技术来构建数据检测和索引优化的科学方法,通过构建图书信息的本体属性架构,实现了复杂语义信息的表达和识别,从而在很大程度上提升了图书馆信息查询的效率。

参考文献

地理信息系统基本概念篇2

(中信银行唐山分行 063000)

【摘要】目前,与会计信息化有关的研究课题多种多样,究其原因是随着社会的不断发展,人们对会计信息化的认识程度、研究视角和方法产生了一些变化,这些都推动了会计信息化的深入发展,并对其产生了深远影响。本文在“三论”的基础上对涉及会计信息化在发展中相应的定义进行了解析,以期对会计信息化的教学、研究以及会计信息化的发展起到进一步的推进作用。

【关键词】会计电算化 会计信息系统 会计信息化

一、研究背景

目前,与会计信息化有关的研究课题多种多样,主要有“计算机会计”“会计电算化”“会计信息系统”“电子商务会计”“会计信息化”等。究其原因是随着社会的不断发展,人们对会计信息化的认识程度、研究视角和方法产生了一些变化,这些都推动了会计信息化的深入发展,并对其产生了深远影响。

1978年,我国开始会计电算化;1981年,于长春召开的“财务、会计、成本应用电子计算机问题讨论会”标志着会计电算化理论与实践的起点。这次会议是财政部、中国会计学会和第一机械工业部一同召开,第一次使用“会计电算化”这一名称并替换了之前的“电子计算机在会计中的应用”。因此,大家从会计电算化的概念开始认识会计信息化。2005年,专家在中国会计学会会计电算化专业委员会年会上发表了“会计电算化”发展为“会计信息化”的观点,认为“会计信息化”是对“会计电算化”进一步发展的总结,对“会计电算化”的应用水平也起到了进一步加强的作用。

学术和教学领域目前对“会计电算化”和“会计信息化”这两个概念同时使用。目前,学者们对会计电算化和会计信息化有两种主要的观念,一种观念是会计电算化是会计信息化发展的必经过程,另一种观念是会计信息化是会计电算化的进一步的发展阶段。这两种观念的模棱两可使得人们对其定义与关系疑惑丛生,由于搞不清这两者之间的概念和关系,只能盲从于现有的文献和教材,这一现象不仅导致企业对其自身的信息化程度定位不确切、教学概念不清晰、学术机构的研究和工作方向不明确,而且对我国会计信息化的健康发展产生了不利的影响。为了明确会计信息化教学、研究以及使会计信息化向着健康的方向发展,对与会计信息化相关的概念进行认真的剖析意义重大。

二、什么是“三论”

“三论”即系统论、控制论、信息论。“三论”推动了科学技术和思维的发展,对现代很多新兴学科的产生都起着不可忽视的作用,是其坚实的理论基础。系统论着重研究各种系统的共同特征,因此需要用整体的眼光看待事物,并用数学方法定量地描述其功能。控制论是跨及各类学科的一个交叉学科,主要研究控制与通信共同的一般规律,是综合各类科学系统的控制、信息交换、反馈调节的科学技术。信息论运用概率论与数理统计的方法从量的方面对信息进行研究,其研究的两大方面是信息传输和信息压缩。系统论、控制论、信息论相互作用又相互联系,三者是独立的学科,分别产生于现代科学的生物学、通讯和计算机这三个领域。系统论用整体的眼光揭示事物的一般规律,对系统概念进行界定;控制论对系统演变过程的规律性进行研究;信息论主要研究控制是如何实现的。因此,系统论的研究方法是信息论和控制论,而后两者是研究的基础。

我国从20世纪80年代至今对“三论”在会计中的应用的观点比较一致。吴水澎教授对会计中“信息系统论”与“管理活动论”进行了深入的研究,并认为这两者的概念及作用极为相似可以“合二为一”。李树林指出会计信息系统在实践上对“三论”的实施条件全部符合,会计信息系统是管理系统的重要子系统并兼具管理系统所具有的全部特点。中南财经大学的郭道扬教授运用“三论”的理念,在其会计控制论一文中指出会计是为人类实现控制社会经济而进行的一项基本活动。2008年,杨时展教授对会计信息控制论和反映论相互关系的评论被《会计之友》杂志转载。李端生等(2006)分析了现代会计信息系统与信息需求内容之间的矛盾,建议在会计信息系统的理念中建立“需求决定型”概念。程宏伟等(2007)基于系统模块角度研究价值链会计,深刻探讨了价值链会计。厦门大学管理学院的曾爱民和南星恒(2009)从广义的角度对会计信息系统的构架进行探讨。

综上所述,会计信息系统是现代化的管理信息系统中的重要子系统,它集“三论”中系统论、控制论和信息论的所有特点于一身,有利于人们研究会计信息系统,并统一了会计信息系统和会计信息化的相关概念,减少了不确定性和争论。

三、基于“三论”的会计信息化相关概念

我们要对会计信息化的自身含义和外延含义都进行深入的了解才能分析其相关概念,一般概念的思维形式反映了其对象的本质属性。以哲学的观点看,概念即为人类把所能感知的事物的共同本质特征抽象出来的概括。概念都具内涵和外延,并且随着主观、客观世界的发展而变化。概念一般用简明的语句说明其内涵。概念的逻辑方法是对其反映对象的特点或本质进行揭示。用一般定义概念的公式进行如下概念定义:被定义概念=种差+邻近属概念。其中,“种差”即与同属性范围下的其他概念之间的区别,也就是差异性;“邻近属概念”即对被定义对象所属的最小属性范围所界定的概念。

(一)基于“三论”的会计信息系统及其构成要素

会计把系统论、控制论和信息论结为一体,是管理信息系统的重要子系统之一,因此也称为会计信息系统(accountinginformationsystems,简称aiS)。会计信息系统的主要目的是系统论的整体最优,会计信息系统按模块讨论其集成性,集成业务处理、信息处理、实时控制和各模块间的层次结构等;将物流、资金流、人员流、控制流等一些重要的信息流联合在一起就形成了信息流的网,它们肩负着各自的任务存在于组织的全部活动中,通过i(input)-p(process)-o(output)〔o=p(i)〕模型可以分析会计信息的来源、会计信息的提供、会计数据的处理及利用过程;控制论主要实现会计信息的并进行反馈,基于i(input)-C(control)-o(output)〔o=C(i)〕模型对会计信息系统的运行进行反映,必要时还要进行有效的控制和调节,对会计信息系统的运行规律进行动态的控制和调节。

会计信息系统的广义信息加工和控制处理器的五大要素是m,t,o,S,i,由p和C构成。其中,m(management)确定了会计信息系统的运行规则和规范,是指会计方面的管理制度和法律,包括会计法、会计准则、会计制度、内部控制和审计等方面。

t(technology)反映了会计信息收集、加工、传输、利用和共享的手段和方法,是指会计信息处理及控制器依赖的基础和工具,包括珠算,钻孔机,计算机系统,其构成了会计信息系统的狭义的信息加工和控制处理器,会计信息系统在t发展的不同阶段分别被分为手工、机械和计算机会计信息系统。

o(organization)主要包括信息收集者、信息的处理加工者、信息者、信息使用者以及开发监审会计信息系统者等会计的利益相关者。

S(surrounding)是会计信息系统发展的环境基础,主要指会计信息系统所依赖的宏微观环境,如社会经济、技术等。

i(information)因素与以上四个因素共同称为会计信息系统的五大要素。

会计信息系统是以相关的会计准则、会计制度和会计法规为规范是管理信息系统的一个子系统,被企事业单位用来处理会计业务,对各类会计数据进行收集、传输、存储以及加工,对会计利益相关者输出会计信息并实时反馈,指导企业的经营、投资活动以及管理决策的信息系统。杨周南主编的《会计信息系统》一书中对计算机会计是这样定义的,计算机会计信息系统是组织对数据用信息技术的方法处理会计业务,为企业提供财务会计信息并管理控制企业经济活动的系统,因此是会计信息系统的发展阶段。以上对会计信息系统和计算机会计信息系统在符合定义公式和演绎推理逻辑思维的基础上进行了概念定义。

(二)基于“三论”的会计信息化

会计信息化是基于“三论”角度的计算机会计信息系统的会计信息化,包括会计信息化的过程、会计信息化的水平、会计信息化的作用和地位以及会计信息化的目的这四个方面,是计算机会计信息系统的构成过程。首先,会计与信息技术结合的过程即为会计信息化的过程,由于信息技术在会计中的运用使得会计的各要素都产生了影响,对会计模式进行了重建。其次,会计信息化水平是指对计算机会计信息系统的应用程度,会计软件的核心是计算机会计信息系统,综合反映了会计信息系统五大要素,体现了会计信息化发展水平。再次,会计信息通过会计信息的收集、加工、存储、提供和利用对经济活动进行影响,对企业决策和管理提供辅助建议,以此来反映、控制以及对会计信息系统的监审等会计功能。会计信息的作用和地位在会计信息化发展的前提下不断扩展、提高。最后,不断开发的信息技术和会计信息资源的充分利用是会计信息化的主要目的,其还有加强信息和知识的交流共享,实现最大的组织经济利息等目的。所以笔者认为,会计信息系统体现了会计信息化的程度,通过会计信息提高其在优化资源配置中的作用。由于信息技术在会计信息系统不同层次都有应用,会计信息一般被我们划分为会计电算化、会计管理信息化以及会计决策信息化三个方面。

1.会计电算化。会计电算化也被人们称为会计核算信息化,指在会计工作中使用以计算机为主体的信息技术,之前人们一直手工进行的是会计核算工作和会计信息的提供工作,而会计电算化产生后这些工作可用计算机代替,体现了会计的反映职能,操作计算机完成会计工作中的记账、算账和报账等程序。因此会计电算化把电子计算机和现代数据处理技术应用到会计工作当中,是会计核算信息系统对信息技术的应用过程。其目的是提高企业财会管理水平和经济效益,从而实现现代化的会计工作。

2.会计管理信息化。会计管理信息化主要体现了信息论的特点,会计工作不仅是生成、供应信息,而且也是利用信息并参与企业管理的一项活动。会计管理具有对自动提供的信息进行进一步加工,反映和控制组织的财务状况、经营成果,使利益相关者参与组织活动的预测和决策等职能。因为会计电算化是会计管理信息化的数据基础,所以会计核算层的信息化是会计管理信息化的重点。会计管理信息化主要指运用计算机、网络和通讯等信息技术重新建造会计管理模式,使现代会计管理信息系统成为技术和会计高度融合的、开放的信息系统。为了使会计利益相关者对信息资源的充分利用和研究开发,以会计信息优化资源配置,以此促进企业的长远发展和社会的不断进步。

3.会计决策信息化。会计决策的信息化主要是对会计决策和预测的信息化,把信息技术运用到会计决策信息系统中。会计决策信息化的基础是会计核算和会计管理信息化,主要体现在管理层运用会计核算数据参与企业决策并综合分析企业所在领域内其他企业经营和竞争状况、相关行业的经营数据、国内外大环境的经营数据,可以使企业明确自身的竞争优势,认清其核心竞争力,预测企业的发展并进行决策功能的信息化。

(三)电子商务会计

目前,学术界没有统一明确的概念来界定电子商务会计,笔者通过中国知网(cnki.net)检索了包含电子商务会计为主题的论文并查阅相关书本及资料,发现涉及电子商务会计概念的论文少之又少。宿静和苏亚民在《论电子商务会计的理论框架》一文中描述电子商务会计是关于电子商务与会计学彼此交叉作用的一种边缘学科。这种学科充分利用计算机硬件设备以及网络等现代工具和技术,将电子商务作为会计核算对象,利用远程数据进行在线报账,通过电子货币实现交易目的,同时对相关事项的监督和审计非常及时,是为在线理财和电子商务事项提供服务的会计信息系统。下一步,我们从被定义概念的科学性以及合理性方面来对上述概念进行分析。

根据普通意义上对概念进行定义的公式为:被定义概念=种差+邻近属概念。该公式中的“种差”即与同属性范围下的其他概念之间的区别,也就是差异性;“邻近属概念”即对被定义对象所属的最小属性范围所界定的概念。所以本文中的被定义概念为电子商务会计,而本文中对电子商务会计所应用到的邻近属概念即为会计学。也就是说,电子商务会计的属性还是会计学,可以说是会计学大类的一个细分学科;而电子商务就是上述公式中所言的种差,以区别于会计学大类下的其他细分学科。所以,我们可以认为,电子商务会计就是为电子商务活动服务的会计。但是倘若从另外一种角度剖析被定义概念,即从演绎推理逻辑思维方面来看,上述的被定义概念没有科学性,如何对上述的被定义概念进行界定有待继续深入探讨。比如从以下这种角度出发,假设电子商务会计是一种对会计信息通过电子商务模式进行采集和加工以及处理,则电子商务按理来说是临近属概念。也就是说,电子商务会计的本质属性还是电子商务,那么会计就成了上述被定义概念公式中的种差。如果电子商务会计的本质属性是电子商务,而会计是种差,则对应的会计信息以及提供与会计信息相关的服务即是商品以及提供的劳务。供应商以及消费者则分别与信息提供者以及信息使用者相对应,供应商和消费者通过买卖信息来进行交易,即利用电子商务系统来进行会计信息的交易。根据汉语的主语以及定语的语法规则,会计电子商务可以被认为是一种恰当的被定义概念。但是该被定义概念还有待从其他角度进行深入的研究讨论。根据宿静和苏亚民对电子商务会计的定义,我们不难看出,其先定义技术基础,即“计算机硬件设备以及网络等现代工具和技术”;接着定义基本内容,即“将电子商务作为会计核算对象,利用远程数据进行在线报账,通过电子货币实现交易目的,同时对相关事项进行实时的审计和监督”;最后定义目的,属于一种为电子商务事项以及在线理财提供服务的会计信息系统。虽然宿静和苏亚民关于对电子商务会计的定义从演绎推理逻辑思维角度来看是比较合理的,可是该定义仍然没有将基本内容以及目的方面涉及的逻辑思维要素表达清楚,不能够清楚地界定被定义概念的种差和临近属概念。同时,笔者也对其他关键词为电子商务会计的文献认真研读,从中得知大部分文献是基于电子商务对会计的影响进行研究,只有极少部分的文献研究电子商务会计的内涵和外延。因此电子商务会计这一概念还有待继续深入探讨。

四、结论

从上文的分析我们可以看出,目前大家对“会计电算化”“会计信息化”及“会计信息系统”等概念的界定都很清晰,而电子商务会计由于是新产生的学科,目前对于其概念的定义尚不明确,需进一步研究分析。从教学的视角来看,现在市面上有很多会计信息化方面的教材,各自的命名也多种多样,比较为大家熟知的有会计信息系统、会计信息化、会计电算化等一些名称,可谓百花齐放、百家争鸣。但是在教学的过程中,名称和概念太多会使得教师和学生双方无法适应,会产生教学概念模糊,缺乏说服力等问题,在学术研究领域无法统一大家的思想。通过分析笔者认为,与会计信息化相关教材名称的第一选择是“会计信息系统”,因为其从“三论”的角度结合了信息论、系统论和控制论的思想,符合会计信息化的概念。此外,若以电算化作为会计信息化教材的主要内容,则可以命名为会计电算化,如果把以电算化为主的教材一味地命名为会计信息化,会使教材有名无实。

参考文献

[1]杨周南.论会计管理信息化的iSCa模型[J].会计研究,2003(10).

地理信息系统基本概念篇3

遍布全世界的主机和服务器,错综相联的超媒体资源,这是互联网为我们所构建的一个巨大而丰富的电子信息空间。它无疑是现代社会最重要的信息获取手段,但是它的开放性、分布性、无序性以及惊人的发展速度也为人们对信息资源的利用带来了困难。正如在大海中行驶的船只需要导航系统确定方位一样,要想在茫茫的信息海洋中有效获取有用信息,也必须拥有便捷有效的信息导航技术。一般来说,www网络中常用的信息导航方式有三种:一是利用门户网站的分类索引;二是利用网络搜索引擎;三是利用网站的相关链接。但是目前这三种信息导航方式的效果都不尽如人意。分类索引所覆盖的网络站点范围太小,更新较慢,难以适应网络的快速增长,而且分类标准的不统一和不规范常常影响到用户对站点所属的判断,造成导航失败。搜索引擎虽然是目前主要的网络信息检索工具,但是通过简单的逻辑运算检索到的结果往往是数量庞大且鱼目龙杂,充斥着大量的无用和重复信息。网站的相关链接是指符合当前网站内容主题的内部和外部信息资源的超链接,这种导航方式虽然简单直接,但是信息量非常有限,而且对外部信息的链接常常出现错链和假链,即使是内部信息,也常常因为组织和描述方式的影响,造成用户的“资源迷向”。

用户在信息空间中的“迷航”会使他们感到厌倦而丧失获取信息的信心,分析其原因,主要包括以下几个方面[1,2]:

(1)网络的巨大信息量使人们必须依赖于自动化的处理技术。但是目前因特网的各个网端的技术支持环境比较复杂,信息资源的内容范围、组织结构和存储方式各不相同,呈现出分散、无序、变幻多端的特点,这使自动信息处理技术的应用困难重重。因此要提高信息导航的效率和质量,必须先解决资源异构的问题。

(2)网络信息空间中的数据大多以半结构化和非结构化的形式存在,对信息资源的内容缺乏形式化的语义描述,而且大部分资源间的链接也没有反映语义关系,这使得机器很难对网络信息空间进行深层次的理解和处理,对信息的自动导航也无法像人工操作那样准确有效。

(3)目前的网络导航系统缺乏个性化的信息服务。由于知识背景的差异和一词多义等方面的原因,不同的网络用户之间、用户与系统设计者之间对于问题和信息内容可能会具有不同的理解与认识,当用户按照自己的思路查找信息时,他所选择的导航路径可能是错误的或者低效的。因此信息导航必须考虑具体用户的特殊性,有针对性地提供导航服务。

(4)网络导航系统的设计缺乏规范。门户网站各自依据不同的标准建立自身的分类导航系统,网站的划分随意性较大,常常引起用户的困惑。一些著名的信息搜索引擎也各自采用不同的检索规则,有些系统不能利用历史信息或者不提供二次检索,给用户的使用带来不便。另外,在网站内部的导航系统设计上,也存在着导航结构不合理,导航要素不完整,导航界面不统一等问题。这些都可能造成用户的导航障碍。

由此可见,造成信息“迷航”问题的主要原因在于缺乏信息空间的合理组织和有效的导航机制,这也是第二代web网络技术难以克服的困难。为此,人们正在研制第二代web网络——Semanticweb,它以结构化信息表示为主,为网络导航研究开辟了新天地。

2 Semanticweb技术

timBernersLee在1998年提出了Semanticweb的概念。2001年2月,w3C组织正式推出Semanticwebactivity,使网络环境下的语义处理技术研究渐入佳境。Semanticweb研究活动的目标是开发一系列可由计算机理解和处理的语义表示语言和技术,通过显式的语义表示和领域本体将网络信息空间编织成为一个巨大的机器可读的知识网络,以支持自动化的信息访问和知识管理,实现高质量的网络信息服务。目前关于Semanticweb的研究主要集中在网络信息资源及其内容的语义和语义关系表征,基于语义的数据自动分析、理解和处理,不同应用领域和系统间的数据自动交换、转换和复用[3]。Semanticweb虽然是现有web网络的延续,但在信息导航方面具有许多普通web没有的优势。Semanticweb中的节点既可以代表物理页面,也可以代表知识实体;Semanticweb中网页的内容不但可以被人理解,而且可以被机器理解;Semafiticweb中的链接不再是任意的,而是遵循一定的语义关系。通过Semanticweb技术,可以改变现有网络松散的数据结构,将信息资源结构化并赋予含义,使网络信息的整合和自动处理都变得更加容易[4]。

2.1 本体

所谓本体(ontology),实质上是描述特定应用领域知识的公认的术语集。关于奉体的定义,比较著名的观点是“本体是概念模型的一个显式的规格说明”和“本体是共享概念的一个形式化的规格说明”,其中,“概念模型(Conceptualization)”是指通过对某个客观现象的相关概念进行辨析和提取而获得的关于该现象的抽象摸型;“显式(explicit)”是指对所使用的概念的类型,以及这些概念在应用上的约束都给予明确的说明;“形式化(Formal)”表示本体以计算机可读的形式存在;“共享(Share)”表示本体中反映的是共同认可的知识”[5]。

本体通常表达为一组对象(概念)、关系、函数、定理和实例。本体中的对象类按照等级关系组织成基本的结构体系。等级关系包括例化(is-a)关系、类属(kind-of)关系和整部关系(part-of)。上层的对象类为父类,下层的对象类为子类。对象类具有各自的属性,并可依据父子关系继承。对属性的取值对象、取值范围、取值基数等都可以加以限制,还可以对属性的交换性、对称性、传递性、唯一性等进行定义。除了等级关系,本体中的对象类间还可以具有其他语义关系,形成语义网络形式的概念模型。本体是机器自动推理和智能化高级信息服务的基础,对网络而言,一个简单的本体的典型例子就是网络的分类索引(如Yahoo!的分类目录)。本体的应用对于提高网络导航的精度和效率具有重要的意义[1,4)。

2.2RDF和RDFS

RDF是由w3C开发的元数据描述机制,其目的主要是为元数据在网络上的编码、交换和重用提供一个基础。它允许在XmL的基础上以一种标准化的、互操作的方式对数据语义进行定义[4],提供了一个描述web资源的数据模型。RDF包含描述资源的属性和关系的声明。资源是任何用URl(UniformResourceidentifier)唯一标识的实体对象。资源具有属性,属性则具有一定的值,该值可能是简单的字符串或数字,也可能是自身也具有属性的其他资源。这样,资源、资源属性和属性值构成了RDF声明中的三元关系模式,任何本体或描述性元数据都是这种三元关系模式的具体体现”[1,7]。

为了描述元数据元素间的复杂语义关系,w3C进一步定义了RDFS(RDFSchema)。它可以看成是一个本体定义语言,用来建立概念类体系结构、属性层次和类关系。

3 基于Semanticweb的智能导航机制

Semanticweb的出现为网络信息导航提供了新的研究思路,Semanticweb技术是解决无序网络空间中“迷航”问题的关键技术。基于Semanticweb的智能导航是一种以结构化、语义化的概念知识网络为基础,自动形成个性化导航结构的方法。它分为两个方面,一是基于Semanticweb的信息组织,即利用参考本体对各信息源进行语义描述和整合;二是基于Semanticweb的个性化导航结构模型的构建,即在有序语义组织的基础上,构造用户语义模型,并据此建立导航结构。图1显示了基于Semanticweb的智能导航机制的概念结构[8]。

3.1 基于Semanticweb的信息组织

基于Semanticweb的信息组织的基本思想是,将来自于多个异构信息源中的数据整合到一个语义统一的参考本体中。参考本体是通过分析领域中的各个信息资源集合,提取公共概念、属性和关系而构建的本体,它为所有信息资源提供统一的概念集合和通用语义。

信息整合的方法是先分别将各个信息源中的数据转换为通用的数据模型,然后建立各个数据模型和参考本体之间的映射关系。网络中的信息源具有各种各样的数据格式,其中大部分是HtmL页面,有的包含表格和列表。另外还有XmL文档、RDF文档以及关系数据库文档等。为了解决分布式异构信息源的语法相异问题,需要将数据转换为公用的数据模型格式,例如RDF。对于非RDF格式的信息数据,可以利用外覆包(wrapper)技术将其自动地转换为基于RDF的数据模型。外覆包对特定格式的数据文档进行解析,并采用RDF声明对其内容进行标注。下面是三种常用的外覆包:

(1)HtmL外覆包。由于HtmL页面属于半结构化的信息数据,因此HtmL外覆包采用的是半指导性的标注方法。即预先手工标注一组HtmL页面,然后对新的HtmL页面进行结构分析,将新页面与标注页面进行比较,从中提取相关信息。HtmL外覆包还可以处理异构的XmL文件[1]。

(2)XmL外覆包。根据DtD和Schema所定义的XmL文档的内容结构和内容元素,建立概念集与DtD Schema之间的映射关系,从而自动地将XmL文献中的DtD内容元素标记转换为对应的概念集元数据标记。

(3)关系数据库外覆包。将关系数据库中的数据元素和二维数据关系映射到概念集中,形成语义基础,以便从关系数据库中自动创建RDF声明。

由于不同的信息提供者可能会使用不同的词表来标注数据,因此在建立通用数据模型后,还必须在信息数据源和参考本体之间建立概念和关系的映射,以消除语义差别。根据RDF声明,在参考本体中注册相关内容的来源,使参考本体成为一个知识内容的集成文件。另外,采用基于本体的元数据发现和漫游技术,探测相关的RDF声明,可以自动地添加新的信息资源[8]。

3.2 基于Semantic web的个性化导航

通过建立参考本体以及进行信息整合,无序异构的网络信息数据通过语义概念及语义关系被组织到一起,形成一个有序的公共语义知识模型。但是对于具体网络用户的信息导航,并不直接在全部公共语义模型上进行,而是依据用户语义模型有针对性地进行。

3.2.1 用户语义模型

用户语义模型是反映用户观点的概念集合和概念关系。概念集合的确定可以由用户直接提交或者根据用户的注册信息(用户的兴趣、爱好和知识背景等)按照一定的规则计算选择。而构建用户语义模型的关键步骤在于建立用户概念集合与参考本体间的语义映射,寻找参考本体中与用户相匹配的概念和关系。

为了将参考本体映射到用户语义模型,需要预先对参考奉体和用户概念集合进行数据训练,方法是为每个本体概念和用户概念各标注一定的相关资源作为训练数据,然后利用向量空间模型为每个概念生成向量,并计算其标准权重。

建立语义映射的过程通过计算用户概念集合中的概念向量uc与参考奉体中的每个概念向量间的匹配度来完成。假设在n维向量空间中,用户概念向量uc中第i项的权重为的匹配度为[9]:

首先将计算结果中匹配度高于阀值的若干概念向量与uc建立映射,形成从用户概念集合到参考本体的一对多的对应关系。如果参考本体的一些概念被重复映射,则需要选择其中匹配度最高的映射,以保证从参考本体到用户概念集合的一对一关系,即一个本体概念只能和一个用户概念相关,但一个用户概念可以和多个参考概念相关。在建立用户概念集合与参考奉体对应关系的同时,用户概念也继承了本体中的概念层次结构和其他语义关系,成为一个独立的语义模型。

原则上应该将参考本体中的所有概念都映射到用户语义模型中,但是由于用户语义模型是范围相对较小的概念集合,因此参考奉体中的概念实际上不可能被完全映射。为了保持映射的完整性,可以在用户语义模型中设立一个“其他”概念类,参考本体中的所有没有被映射的概念将成为它的子概念[9]。

举例来说,假设用户提供的信息表明其在体育领域感兴趣的概念为“足球”、“足球世界杯”、“足球亚洲杯”、“nBa”、“围棋”、“奥运会”,图2显示了这些用户相关概念经过映射后形成用户语义模型的过程。

用户概念集合中的每一个概念都在参考本体中找到了与之相对应的一个或多个概念,将这些概念从参考本体中提取出来,并根据其语义关系重新组合,就形成了用户语义模型的结构。例如:用户概念“nBa”的对应概念为“篮球”、“篮球赛事”和“美国篮球职业联赛(nBa)”,因此这三个概念都被包含在用户语义模型中,且它们之间的父子关系(即等级关系)保持不变。又如,虽然参考本体中的“其他赛事”概念和用户概念集合没有直接对应关系,但由于该概念和“足球赛事”与“篮球赛事”两个概念间有语义关系,且这两个概念均与用户相关,因此该概念也被包含在用户语义模型中。另外,“世界杯足球赛”概念实际上与“足球”和“足球世界杯”两个概念间都具有对应关系。但由于它与后者的匹配度比前者高,因此将它映射到后者。

3.2.2 个性化导航结构模型

导航结构模型显示了导航系统组织、关联和显示信息内容的方式。站点地图就是一种最简单直接的导航结构模型。个性化导航结构模型是基于用户语义模型创建的针对特定用户的导航结构,是个性化导航服务的实现。

导航结构的设计需要考虑三个基本要素:卡片、页面和链接。一张卡片只包含一种类型的信息内容,是导航结构模型中的最小组成单元。页面与物理的web页面相对应,一个页面上可以包含若干个卡片。链接则用于连接各个页面中的卡片以形成整体结构[8]。通常,导航结构模型总是从一个缺省的根页面开始,每一级页面都包含了到下一级页面的链接,信息内容通过卡片和页面进行分类和聚合,导航通过链接来进行。在个性化的导航结构建模中,导航结构是根据用户语义模型来确定内容和链接关系的。图3显示了一个导航结构的部分示例,它是在图2中的用户语义模型的基础上建立的。

导航结构的建模过程就是对各级贞面中的卡片的内容、类型和表示样式的确定过程。卡片的内容根据触发点和用户语义模型来选择,不同的用户将获得不同的信息内容。

导航结构中的卡片被分为两种类型:静态卡片和动态卡片。静态卡片的内容独立于数据源,主要包含静态文本、图片等。导航结构中的根页面通常都包含静态卡片,具有预先定义的锚点,指向下一级的页面。动态卡片的内容视数据源而定,如果数据源改变,则卡片的内容必须重新计算生成。动态卡片还可以细分为四种类型,每一种都代表了对信息进行结构化的一种典型方法:

(1)列表型(List)卡片:显示实体的实例列表,每一条实例都可具有指向该实例具体内容的链接入口。列表中的实例可以按照某种属性排序或索引。图3中的页面p2、p3、p4、p5都包含了列表型卡片。

(2)事实型(Fact)卡片:详细地显示一个实例的具体内容,如图3中的页面p4包含的“新闻内容”卡片和页面p5包含的“赛事内容”卡片。

(3)幻灯片型(Slide)卡片:顺序显示一组实例的具体内容,每次一个实例,且具有浏览附近实例的超链接,待显示的实例可以按照某种属性排序或索引。图3中的页面p6包含该类型的卡片,其中每个足球俱乐部的相关信息将被依次显示。

(4)查询型(Query)卡片:要求用户先填写一组实体属性的值,然后查询符合该值的实例并显示,通常该类型的卡片用于导航系统中的信息检索,如图3中的页面p7包含的卡片[8]。

另外,不同的卡片具有不同的表示样式,表示样式描述各种表示元素的属性,例如字体、颜色、布局等。表示样式可以根据用户喜好确定。

个性化导航机制的导航方法采用用户语义模型的查找与语义链的触发相结合的方式。当导航结构中的一个链接被触发时,该链接将被赋予一个查询式Q(C,t,S),式中三个变量的含义分别代表卡片的内容、类型和表示样式,在用适当的值填充变量后,即可利用查询式计算生成链接末端的卡片。例如在图3中,当链接L1被触发后,L1的查询式为:Q(“体育”,List,Stylel),其计算结果为页面p2中的卡片。Q中的变量C的值为L1的触发端点的概念“体育”,Q在计算时将检索用户语义模型,获取此概念的相关概念或相关资源作为卡片的内容。Q中变量t的值为List,因此Q生成的卡片将具有列表型的信息结构。同时,由于Q中变量S的值为Stylel,因此Q还要读取样式表中名称为Stylel的表示样式,并据此决定卡片的外观。同理,链接L2的查询式为Q(“足球俱乐部”,Slide,Stylel),其结果是生成一个信息结构为幻灯片类型,表示样式为Stylel,内容与足球俱乐部相关的卡片”[11,12]。

导航机制采用Semanticweb技术,揭示和整合网络信息资源的深层语义知识模型,能有效解决无序、异构网络信息空间中的“迷航”问题。它利用映射方法建立用户语义模型,可以充分表达用户需求的语义知识,以提高个性化导航的效率。

4 结束语

网络信息的利用状况不容乐观,迫使人们努力探索更为先进更为成熟的导航理论、方法和技术。第二代web技术——Semanticweb在信息服务中的应用,促进了网络导航新技术的发展。它作为导航系统的信息组织框架,能够使复杂的信息空间变得有序、清晰和直观,它采用机器可读的形式化的知识表示方式,有利于知识内容的自动获取。目前,Semanticweb技术正获得越来越多的应用,相信经过不断地研究和优化,以Semanticweb为基础的高级网络信息服务将逐步成熟,智能、高效、个性化的导航系统将成为开发网络信息资源的主流工具。

参考文献

1 丛敬军,阎辉.数字图书馆的知识信息导航技术研究.中国图书馆学报,2003,29(145):51~53

2 马瑞民,衣治安.web上超文本数据导航方法的研究.情报学报,2001,20(5):538~544

3 张晓林.Semanticweb与基于语义的网络信息检索.情报学报,2002,21(4):413~420

4 刘柏嵩.基于知识的语义网:概念、技术及挑战.中国图书馆学报,2003,29(144):18~21

5 mikeUschold,michaelGruninger.ontologies:principles,methodsandapplications.KnowledgeengineeringReview,1996,11(2):93~155

6 JeffHeflinetal.Requirementsforawebontologylanguage.w3.org/tR/webont-req/

7 张平,郭金庚.语义网描述语言分析.电脑开发与应用,2003,16(4):31~33

8 ontowebbermodel-Drivenontology-BasedwebSitemanagement.www-db.stanford.edu/pub/gio/2001/ontowebber01.pdf

9 ontology-BasedpersonalizedSearchandBrowsing.ittc.ku.edu/~sgauch/selectedpapera/wLaS2003.pdf

10 毕强,刘早学.QUiC——一个智能超文本导航系统.情报学报,2002,20(12):1277~1281

地理信息系统基本概念篇4

关键词 语义检索 语义网 本体 信息检索

分类号 tp391

1 网络信息检索的局限与语义检索

目前网络检索的实现技术主要有两种:一种是依赖于编码处理,通过分类模式来描述信息资源,从而实现检索;另一种是通过全文检索,查找文本中含有用户指定词语的信息源。其应用的体现分别为基于分类目录的搜索引擎和全文搜索引擎。前者虽然基于人工处理,准确性较高,但它更适合用于网络信息资源的浏览和导航;后者实现较为方便,适应了对迅速增长的海量网络信息资源进行自动处理的需要,成为网络信息检索的主要途径。但是用户在检索中始终面临不少困难,如:检索结果的过载和低查准率,用户负担重;检索结果及其排序不一致,且与用户使用的查询词汇形式及其组合形式高度相关等。究其原因,统计意义上的词型匹配难以支持对网络信息资源的有效检索利用。因此研究者们将目光投向了对词形背后的意义的挖掘上,探索实现基于概念匹配的检索技术和方法。

早在上世纪80年代对语义检索的讨论就出现在SiGiR会议论文中,但语义检索研究始终受制于语义信息处理发展水平的局限。随着自然语言处理、人工智能的发展,尤其是语义网技术的兴起与发展,语义检索研究自上世纪末以来得以迅速发展。尽管到目前为止对语义检索在概念上仍没有统一的界定,但不同的研究却有着共同之处,就是基于对信息资源的语义处理实现效率更高的检索。语义信息的提取和处理可以是基于语义网方法与技术的,也可以是基于自然语言处理技术的。目前,前者在语义检索研究中相对更为普遍。事实上,正是由于语义网的出现与发展,才使语义检索的研究更加得以明确并发展如此迅速。

2 基于本体的信息资源检索

本体是语义网技术的核心部分,承担着语义表达的关键任务。本体在传统信息检索中的应用可促进从词型匹配到概念匹配的转变。从处理环节来看,它体现在两个方面:查询处理与文档标注及索引。

2.1 基于本体的查询处理

基于本体的查询处理包括查询消歧与查询扩展。通过消歧,明确查询的确切所指,准确反映用户的信息意图,继而通过加入与其语义相关的其他概念来实施扩展。许多研究中利用了语言本体(如wordnet),通过其所提供的词的不同义项来实现查询消歧,通过其所蕴含的同义、整分、上下位等词汇关系来实现查询扩展。支持两种处理模式:查询消歧和扩展、检索结果后分类控制。前者是系统在查询消歧的基础上将某义项的上位词或下位词加入以扩展查询;后者则是系统先以常规方式处理用户查询,再对检索结果基于用户指定的查询义项进行分析和加权。则在词义消歧的基础上,利用wordnet根据查询词义抽取子概念图来实现查询扩展。子概念图作为查询的上下文信息用于支持对由普通搜索引擎返回的初次结果的过滤,以选出相关文档。提出的查询消歧方法包括三步:首先用wordnet中的义项及同义词簇,对查询用词进行两两配对,即在固定其中一词的情况下,与另一词的所有义项进行组合,得到若干种不同的组合情况,反之亦然其次将这些组合作为提问通过altaVista进行搜索,并根据命中数对它们进行排序;最后,以wordnet中对相关义项的注释为上下文,计算排序在前的配对词间不同义项组合的语义密度,从而决定查询用词所指的确切概念。国内基于wordnet汉化而建设的中文概念词典(CCD)也在信息检索研究中得到了应用。

此外,各种自建的领域本体也被应用于查询处理。以一个有关人、地、事件、组织等的本体为基础来实现查询消歧,为每一个初始查询结果提供一个特别链接,用户通过点击这些链接来向系统确认该结果代表的概念符合其查询意图。构建了一个三层本体模型,分别为概念层(即按等级层次组织起来的概念)、语言层(即与概念对应的表达形式)、出现层(即对应于表达形式的具体字串)。在其可视化本体浏览提问接口中,用户可在本体层级体系中点击选择合适的概念。系统会自动执行查询扩展,将用户指定层级范围内的下位概念以及相关关联概念增加进来。扩展后的查询通过上述三层本体模型从抽象到具体被依次转换,最终变为由文档中实际出现的具体词汇构成的查询式。

2.2 语义标注文档的检索

语义标注文档检索的一种普遍思路是在对文档进行语义标注与索引的基础上,先进行实例检索,再据此返回所有以检出实例标注的文档信息。此外,也有其他不同方案。引入了向量空间模型,采用了基于概念级的向量空间文档表达,还设计了文档排序算法。在进行标注时以文档为单位,将其作为一个概念类的实例来进行处理。它设计了一种独特的索引和检索方法,以从文档全文和其语义标注数据中抽出的内容描述符(词)来代表文档,并建立索引记录。这样的索引可支持基于关键词或语义标注信息的检索。根据自建的历史领域本体对文档进行实例标注以构成其语义上下文信息(含概念与时间信息),并认为用户浏览的当前资源的上下文信息可代表其真实查询意图。检索时,用户首先通过传统的全文检索获得一个初始资源或自行提供一个初始资源。然后系统据此反馈该资源的上下文信息,并以嵌入文档中的链接供用户选择。当用户点击链接时,系统即将当前上下文信息作为新的查询,对其进行基于本体和规则的查询扩展,在对系统全部文档先进行过滤之后,再进行最终的检索匹配。

3 语义网资源检索

语义网是一个基于某种知识表达语言(如RFD(S)、owL等)的、机器可处理的语义网文档集合。从逻辑上看,它不再仅是一个普通文档的网络,而是一个资源(可以是各种媒介资源和现实世界中的其实对象,如人、地方、组织、事件等)及其语义关系的网络,表现为本体文档,实例数据和各种语义关系。

3.1 本体文档检索

本体文档检索旨在找到含有特定类或属性的本体文档。普通搜索引擎,如Google,可以通过指定文档类型为RDF等方法来搜索本体文档,但其根本问题是不能识别本体文档中的结构化语义标注信息,因而也无法将它们与普通文本信息区别对待。所以在检索的过程中无法将真正符合需要的本体文档与那些只是含有检索词的本体文档区分开来。这正是对本体文档进行检索需要解决的问题。

解决问题的一种思路就是对本体文档进行适用于普通搜索引擎的改造处理。就是基于这种思路,通过对RDF文档进行一定处理使其可被普通搜索引擎索引和检索,而同时又能在某种意义上发挥其语义信息的作用。它的关键技术Swangling能将语义信息编码成普通文本,并将其作为新的陈

述加入到原RDF文档中(对于以三元组表示的查询,也以相同编码方法处理,将其变为普通文本)。这样提问与文档的匹配就可以按传统的方式进行。

另一种思路则是探索新的本体搜索方法和技术。使用了本体注册的方法。注册服务器并不实际存储任何本体文档,只保存由本体服务器提供的元数据信息。同时,系统通过将本体中的元素与wordnet中的词进行匹配来构建本体摘要,并将其也放入元数据信息。这样,用户就可以从wordnet中选词来对注册服务器进行检索。采用基于GooglewebService构建的Googlecrawler来进行本体搜索。在此基础上,基于向量空间模型,采用一种概念一权重向量匹配方法来进行本体索引与匹配。也进行基于Googlecrawler的本体搜索,不同的是,系统没有独立的索引和匹配过程,而是将Google搜索与本地仓库结合起来,后者专门用于存储已搜索到的本体文档,并保存检索历史。对于已经执行过的同类查询,系统直接从本地仓库中提供查询结果,只有当一定时间内无相同查询被执行过时,才启动新的一次Google搜索。还另开发了针对某个特定网站的搜索器以及基于Jena2的搜索器。系统将从搜集到的语义网文档中抽取的元数据与原结构信息一起存入数据库。它们支持对含有某一特定类或属性的本体的查询。同时还通过定制的索引与检索引擎Sire对语义文档进行基于传统检索技术的处理。提出了另一种匹配方法,它通过Google搜索获取一批与用户查询域相关的文档,然后从这些文档中抽取一批词,并用这个词集合取代原始查询与本体文档进行检索匹配。在结果排序方面,主要有两种方法:一种是跨本体链接分析方法(cross-ontologylink-analysis);另一种则是图分析方法(graph-analysismethod)。从效果上看,前者是让更流行的本体文档排序在前,而后者则是让更相关的本体文档排序在前。

3.2 实例检索

除了本体文档外,语义网资源还有表征各类对象的实例数据。对于大多数一般用户来说,对实例数据检索的需求更为普遍。实例检索的目的是在基于本体的知识库中发现和搜集关于某一指定类的所有实例信息。尽管传统检索技术在其中也有不同应用,但实例检索主要是基于结构化查询与推理的。基于RDF(S)、owL等底层知识模型的图遍历(graph-traversal)与图模式(graphpatterns)得到了广泛的应用。用语义网数据来补充传统检索结果的这一部分就属于实例检索。其“语义网”资源包括正式的语义网文档和语义标注信息。在执行传统检索的同时,系统会针对查询概念在RDF知识库中通过图遍历搜索所有相关的数据信息。相对复杂的是将一种认知模型加入到搜索过程中,它支持用户用自然语言输入一段文字,从中抽出概念并将其作为关键词概念的上下文信息以用于检索过程。在传统关键词检索的基础上,结合了扩展激活算法,通过图遍历进一步扩展搜索与初始结果相关的更多实例信息(即使其不含查询中的关键词甚至与初始结果不是直接相关联)。在此基础上还提出了一个特别的实例相似性计算方法,并将其用于扩展激活过程中。提出了一种面向RDF(S)仓库的可视的语义检索途径。系统为用户提供可视的语义检索与语义浏览服务,其基础是底层的本体及基于本体映射得到的概念分面。在多分面视图中,用户可对系统资源有一个概括的了解,并通过点击各分面中的不同范畴概念来提交查询。语义搜索引擎通过图遍历等方法来进行查询构建与查询扩展。系统接受用户的自然语言提问,并将其解析为一组元素(包括类、属性、实例等),构建基于这些元素的图模式以作为复杂提问。隐式查询扩展也是基于类层次关系与规则而实现的。为了更好地结合传统信息检索技术与结构化查询及推理,充分利用普通文本信息与语义标注信息,一种增强的语义检索模型,基于自由文本的关键词搜索与基于语义信息的结构化查询与推理被紧密地融合在一起来实现检索目标,这种检索有利于解决集中了模糊关键词概念与结构化查询要素的混合查询问题,如“请查找由研究语义网检索的教授撰写的论文”。

3.3 语义关系检索

尽管在上述本体文档检索与实例检索中运用了各种语义关系,但毕竟没有直接以这些语义关系为检索处理对象。而概念、文档等之间的语义关系也应是语义网资源检索的重要内容之一。目前,一些研究已开始关注针对语义关系的检索问题,进行的有关语义关联检索(Semanticassociationsearch)的研究。它所关注的不仅是简单的属性链关系,更是概念间的各种复杂关联关系。研究的主要贡献是分析了语义关系检索所面临的三大主要挑战(即对关系的理解不够通用和全面、缺少以关系而非概念为对象的查询语言和系统、检索结果排序问题),并提出了相应的解决方法(将关系分为语义关联和语义相似性两类并形式化、设计了p-query以支持关系查询、基于用户指定的上下文来进行结果排序)。为检验这些解决思路,在相关研究的基础上,还在国家安全领域实现了一个名为SemDiS的检索系统。

4 结语

地理信息系统基本概念篇5

关键词:形式;关系;意义;信息;形上之思

中图分类号:B08 文献标识码:a 文章编号:1000-2731(2012)02-0028-04

在信息论创立之初,对于是否选择“信息”一词来称谓他所发现的一个新函数,香农曾感到颇为犹豫,因为这个词令人困惑,在英语中,它已经有了太多的含义,当前学界也极易将形式、关系与意义等与信息概念混为一谈。然而,从哲学传统的角度思考,现代信息论及其哲学观念中的“信息”一词确然契合了诸多深刻的思想渊源。从词源学上说,英文“information”一词的词根“form”,首字母大写时(Form)指称柏拉图哲学的“理念”,小写时指称亚里士多德哲学的“形式”,都是西方哲学传统中的重要概念,而且“information”的动态形式是“inform”,它常取“赋予某对象以形式或特征”之意。由此概念分析处人手,我们便可开启信息哲学的形上之思。一、从“形式”概念看信息哲学中的形上问题

在信息哲学中,关于形式概念的哲学思考乃是隐而不显的,因其可谓信息哲学的根基之思,其内容本身本不纳入信息哲学的理论框架之中,却又时时处处贯穿于信息哲学的诸论之内。因此,在一定意义上,将形式之思的理路阐述清晰化、在场化,或许既是一种哲学形而上学沉思中的必然,又是一种信息元哲学探究中的可能。

在柏拉图哲学中,理念(Form)是一种绝对的、永恒的和超验的实存之物,世间万物因分有或者模仿理念而成其为自身,获得其本质,成为理念的一个摹本。分有物或者模仿物显然只能部分地具有理念的“完美性”,而永远不能成为它。因此,现实世界是虚假的,是杂多,而唯有理念世界是真实的,是完美的“一”。形象地说,柏拉图为我们描述了一幅由上而下的形式分有的运动图像,即形式作为内容由理念散发而流动到世间万物之处,进而塑造出万物之显像,而这也正是“inform”一词的本义。或许我们可以说信息(information)作为“inform”的名词化,正是表达这一形式分有之流动过程的描述性概念,正是由它描述了柏拉图哲学中世间万物形成的动力源泉、内在机理和时空构式。由此,我们便可看出信息在哲学中的存在论意蕴,即信息虽不能直接被看作万物形成的实体性本原,但它作为形式分有、流动的显像仍然是万物“形――成”的过程性本原,由此,我们便也重新理解了赫拉克利特的流变之说。

亚里士多德关于形式(form)的思想是对柏拉图理念论的继承和转换。在柏拉图那里,理念高于世间万物,而亚里士多德则说形式蕴含于万物之中,它与万物须臾不可分离,甚至形式就是第一实体。在四因说中,亚里士多德指出,形式因乃是第一因,动力因和目的因都可以归于形式因,即使是质料也离不开形式,因为我们在任何地方都不可能发现“原初质料”这样的东西,即没有无形式的质料,形式就是一切事物的“是其所是”,质料只是潜在性,而形式则是现实性,甚至自然的过程就是质料从一种形式到另一种形式的连续转换的过程。由此我们可以看出形式概念在亚里士多德哲学中的核心地位,而如果将此思想延展开来,我们便会发现亚里士多德的形式与信息哲学中的信息之间有着一条可以明确沟通的纽带。

在柏拉图哲学中,形式乃是被给予物质的,而亚里士多德将其转换为形式内在于物质的问题,这便形成西方哲学传统中的一个重要分歧。17和18世纪的欧洲经验论哲学认为知识所赖以构成的形式寓于知觉之中,而休谟则怀疑离开了客观的形式,经验只能是散乱无序的,后来,知觉被笛卡儿的主观理性所代替。走出独断论迷梦的康德又将质料(matter)和形式(form)纳入到先验范畴之中,指出心灵本就是形式之家,知觉的形式乃是由先验心灵所赋予的,由此我们才能认识世间万物。然而20世纪的哲学则更倾向于形式与质料内在不可分离的观点。向来少谈客观实在问题的现象学家海德格尔也说:“我们对这个物的概念,即把物当作具有形式的质料的概念,也是有怀疑的。……质料与形式的区分,而且以各种不同的变式,绝对是所有艺术理论和美学的概念图式。不过,这一无可争辩的事实却并不能证明形式与质料的区分是有充足的根据的”。

如果我们返回到亚里士多德的形式之思中去,便可以发现这样一种扩展,即世间万物的运动,体现为由潜在性向现实性的转换,实质上亦是形式显示的过程,是事物之本质生成的过程。如果相对于柏拉图的形式分有思想,我们将亚里士多德的运动理论称之为形式显示,那么信息(information)便可具有如下含义,即事物生成和存在的过程性显示。这一思想在当代信息哲学中得到了鲜明地回应。关于信息本质的研究指出:“信息是标志间接存在的哲学范畴,它是物质(直接存在)存在方式和状态的自身显示。”由此不仅承接了古代哲学的哲思,而且扩展了其思想内涵。这主要体现在信息哲学作为20世纪的哲学思潮,作为时代精神的精华,坚持摒弃二元分立,将形式与质料内在的统一起来,认为在形式显示之中,质料乃是始终作为一个不可分割的基底起作用的。“潜能当它还未曾转化为现实的时候,它是关于将要产生的现实的信息的载体;由潜能转化而来的现实则是它由以转化而来的在它之先的潜能的信息载体,同时,它又作为一种新的潜能而潜在规定着更新形式的现实的信息。”。由此,信息哲学以一种崭新的方式回答了古老形而上学的基础性发问,即“究竟为什么在者在而无反倒不在?”。信息哲学认为信息乃是在者在之根据,曾经在、现在在和将来在之根据,而无,即无信息,因而无形式显示,无本质生成,无成其自身之过程和根据,因而不在。

二、信息哲学中形上问题的“关系”维度

在学界关于信息哲学的论辩中,形式和关系概念往往处于核心地位,也往往被赋予浅薄化、平面化和实体化的解释。如同上述关于形式概念的研究旨在深刻化、立体化和过程化信息哲学的形上之思,关系概念在其中也应体现更加丰富的意义。如果说形式是信息哲学中的奠基性概念,那么关系概念则将信息哲学的形上架构铺展开来。

在信息哲学中,人、自然与社会,以及身与心的关系得到了崭新的诠释。在信息哲学关于存在领域分割的逻辑推演中,存在领域被划分为四个面相:客观实在、客观不实在、主观实在与主观不实在。从唯物主义的实在观出发,我们可以认为客观实在=物质,客观不实在+主观不实在(精神)=信息,由此,整个世界在其基础的关系层面便获得了一

个新奇的诠释视角:人,作为身心的统一体,便包含着客观实在(物质)与主观不实在(主观信息)的双重因素;非人化的自然,便是客观实在(物质)与客观不实在(客观信息)的统一;社会,具有人化与化人的统一性,便更是客观实在(物质)、客观不实在(客观信息)与主观不实在(主观信息)的三元一体。

基于上述论断,可以认为信息作为不实在,贯穿于人、自然与社会的构成之中,实际上,它也同样处于三者间的关系之中。

一方面,在人与自然及其相互关系中,信息构成二者,并作为“显示”与“意向”的统一将二者联结起来。在坚持“世界统一于物质”原则的基础上,我们认为自然,尤其是非人化的自然乃是以物质为其基质的,同时又由下而上地将自身在客观信息层面上显示出来,而这种基质与显示的统一才是完整的自然本身。任何将信息排除于自然的构成之外的思想,都无一例外地沉陷于实体思维的樊笼之中了。人,作为“一切社会关系的总和”,乃“是一个多维的存在:自然的、社会的(文化的);肉体的、灵魂的;生理的、心理的、行为的。”人,体现着自然、社会、心灵、身体等因素相互作用的复杂性关系,或者说,在信息哲学的视角中,人是多重信息综合建构的产物。在此意义上,人是世界上具有最为复杂维度的存在者,因此,无法对其进行简单还原性的分析。然而,就人与自然的关系而言,“意向”却构成了其中最基本的联结模式。“意向”,在当代哲学研究中,其内涵并不局限于在胡塞尔哲学中的原初意义,具有更为丰富内涵的“下向相关”或“指向”应该成为“意向”一词的深化意义。在信息哲学中,对“意向”一词的使用,便是赋予了其如此更深刻的意义:在广义上,它表征着信息作为原发点,以一种指向的姿态,将其自身相关于物质的动态关系;在狭义上,它意指着主观信息作为原发点,通过多重中介,指向并将其自身下向相关于客观存在物的动态关系。由此而言,具有主观能动性的人正是通过“意向”模式,与物质的自身“显示”相“冲撞”,进而建立起其与自然的密切关系,于是,诸多相互作用产生于其中。

另一方面,在人与社会及其相互关系中,信息亦构成二者,并作为“突现”与“还原”的统一将二者联结起来。“能动地把握、利用、开发、创造和实现信息是人类社会的本质。”这是信息哲学从人与社会的关系出发,对社会概念高度抽象的概括。建基于物质――信息世界的双重演化观念,从社会的内在生成视角出发,认为社会乃是人与自然、人与人之间的相互关系在物质层面与信息层面双重演化的动态过程。社会中人与自然之间相互关系的主要内容已经在前文中简单论述,这里仅指出,其中的“意向”在社会中突现为“集体意向”的复杂状态,而“显示”则更具有了间接性的、多维度的中介机制,从而使得人与自然的关系更趋复杂化。就社会中人与人之间的关系而言,“人之所以展示为人是因为人通过了以社会为中介的生理、心理和行为的二维结构的建构。”并且,正是通过这二维结构的进化发展,将人与社会的关系建构成为一个“突现”和“还原”双向作用的动态过程。“一方面,人的个体集合形成的类构成了人的社会,另一方面,人的类的存在形式社会又规定和影响着人的个体的存在;一方面,社会的活动必须以人的个体的活动为基础,并且,社会的活动又只能存在于一个个的个体的活动之中;另一方面,个体的活动又必然会自觉或不自觉地以与社会整体的活动模式相一致的方式来塑造自身,并且个体的活动又一定会被整合到社会整体的活动模式之中。”

由此可见,“显示”与“意向”“突现”与“还原”乃是信息哲学中关系问题的具体双向维度,它们两两相合,协同整体架构起信息哲学中世界如其所是的复杂性图景。

三、形式生成和关系构成:信息哲学中的意义忖度

在信息哲学诞生之前,信息概念远没有意义概念那么深厚的哲学意蕴。亚里士多德在《范畴篇》中便已经涉及到意义理论的诸多面相。然而,意义问题却仍然是西方哲学传统的―个盲点,因为“意义这个‘东西’太原本了,它很难被完全对象化,但是这不是说它跟对象没关系,对象恰恰因为它而可能。”在20世纪哲学中,受摒弃二元分立的思维方式影响,哲学传统中的意义层面被重新“捕捉”到了。信息哲学将意义问题纳入其研究视域中既是自身研究发展的需要,也是20世纪哲学研究日益走向深化的产物。当前国际信息哲学研究主要表现出两种路径,一是信息的形而上学路径,二是语言和逻辑分析的路径。在第一条路径中,意义问题往往被淡化,而没有形成主题研究,而在第二条路径中,由于相关术语的误用则造成一种“可悲的混乱”。实际上,在信息论创立之初,韦弗就指出:“信息一词在该理论中是在特殊意义上使用的,不应与日常用法混为一谈,尤其是不应与意义混为一谈。”许多信息语义学者持有意义实在论的立场,而将主体的因素排除在外,从而未能给信息哲学中的意义问题提供合理的解答。在20世纪80年代以后,随着以英美哲学家为主体的日常语言哲学传统和以欧洲大陆哲学家为主体的诠释学、普遍语用学及超验语用学日益走向融合,哲学研究也出现了从意义主题到信息主题的转向,其中,信息与意义的关系凸现出来,而对这一问题的思考体现在信息哲学领域中,便形成了信息哲学中的意义问题。

在分析哲学中,意义问题并不处于形而上学的,研究域中,然而信息哲学中的意义思考却与形式、关系等形而上学基本概念相关紧密,甚至可以说,“形式生成”与“关系构成”共同呈现了研究意义问题的出发点和前进方向。

一方面,从形式之思来看,作为物质(直接存在)存在方式和状态的自身显示的信息,从其原初的生成来看,乃是与人无涉的、纯粹自然的物理学现象,由此而呈现的信息,即为客观信息,或称自在信息。“在这个阶段里,信息还只是以其纯自然的方式,自身造就自身、自身规定自身、自身演化自身,从而展开其自身纯自然起源、运动、发展的历程。”这里的“自身”二字表明了将某种类似于主体的自主性赋予信息,从而为客观信息中意义的生成架设了理论基础。从传统形而上学的视角来看,物理事物之间最根本的相互关系便是以形式为动力的相互流动和以形式为目的的相互转换,而在物理学中,它是以“相互作用”为量纲的。“从现代科学的理论来看,事物间的相互作用是通过物质(包括质量和能量)和信息交换来实现的,……就相互作用必然引起参与相互作用之事物的物质和信息结构的改变这一隋景来看,凡是相互作用过程都必然会伴有价值关系之发生。”在这里的价值关系便是客观信息中原初生成的意义内容。这里的意义乃是“表示在价值和地位含义上的意义(Bedeu-tung)。”

另一方面,“在一种另外的含义上,意义所表示的就恰如一个语词的意义、语词组合所能够具有的意义。而意义的这一含义以某种方式是与那种我们称之为意蕴的东西联系在一起的,并且,此含义要比意义和意蕴的上述那种所谓‘价值’含义远为源本。”由此看来,由于信息哲学不容许将其自身仅仅作为科学哲学的一个分支,而且具有一种元哲学的宏大视域,因而探究意义的源本结构便更是题中之义。

地理信息系统基本概念篇6

[关键词]概念模型 信息系统 用户 理解 沟通 实验室研究

[分类号]n945.12

概念模型通过一套正规化的符号语言描述现实世界,是信息系统开发中记录系统需求的重要工具,如e-R图、数据流程图、UmL等。记录的系统需求成为项目中各方沟通的媒介:系统分析员与用户沟通以确认系统需求;系统开发人员间沟通开发细节。显然,两方面沟通均有效才能保证开发出符合用户需求的应用系统。而以往研究多关注系统开发人员间的沟通,忽视了与用户的沟通。

当前,用户参与需求分析愈加被重视,有效的用户参与被认为是系统成功和用户满意的有力保障。Davies等人的调查表明,与用户的沟通有效性超出其他技术和管理因素,成为概念模型使用中最重要的问题。然而还缺乏直接的研究和证据解释概念模型在与用户沟通中的作用机理。

鉴于此,本文将以概念模型与用户沟通过程中的认知特点为基础,分析和解释概念模型影响沟通效果的作用机理,并通过实验室研究方法获得数据支持。

1 文献回顾

1.1 概念模型的沟通有效性

基于概念模型的沟通效果本质是阅读者正确理解模型中信息的程度,可以定义为阅读者正确掌握的信息量与模型全部信息量的比率。但信息本身具有不同的类别,近年来研究中多依信息类别将理解效果划分为不同的维度,以深入分析模型对沟通有效性的影响。如agarwal等根据信息组成分为简单信息(仅包含基于结构的或基于过程的信息)与复杂信息(包含两类型信息),研究发现开发人员使用面向过程的概念模型理解复杂信息显著优于面向对象的概念模型。而在简单信息理解方面无显著差异。

理解效果的维度,即信息类别的划分不存在统一的标准,主要依研究目的而定,如上述研究中的信息分类是为了寻求信息结构与模型结构的匹配。

1.2 概念模型理解效果研究

阅读者理解模型中信息的过程是概念模型与阅读者个人交互的过程,因此分别受到模型特点及个人特点两方面因素的影响,如图1所示:

对于模型因素,以往研究发现了一些好的品质,如信息完整性、清晰性等。满足好品质的模型能够提升理解效果,如Gemino等通过实证研究验证了本体论语义更清晰的模型更利于理解。

个人特点中的因素关注较多的如个人经验、知识。经验越丰富,知识储备越充足,个人理解效果必然越好。如Khatri等的实验室研究验证了开发人员所具有的模型技术知识以及应用领域知识对阅读效果的影响作用。

然而,这些研究能够回答的现实问题很有限。首先,用户具有高的应用领域知识水平及低专业技术知识和实践经验,现有研究对这样的复合因素组合的情况难以解释。此外,除了模型特点中的“好品质”,不同的模型仍然存在其他差异影响阅读者理解过程,但作用效果可能因人而异。如有研究发现相对于面向对象的建模方法,面向过程的模型更利于开发专家全面识别信息,而对开发新手不存在这样的差异。因此,本文将根据用户整体的认知特点分析其与概念模型特征的交互关系。

2 理论与假设

2.1 用户阅读的认知过程

概念模型主要的呈现形式是图形,为了更深入认识用户阅读概念模型时的认知特点,可以借鉴图形理解的相关理论:感知理论与认知理论。

感知理论解释了阅读者将所看到的图形信息放入短期记忆的感知过程,包括三步:辨识图形中各符号对象;根据模型中符号的空间布局对符号进行分组及确定层次关系;对符号初步组织并放入短期记忆。专业的训练和实践能够使开发人员具备组织图形信息的技巧;而用户未接受过培训,只是按照阅读文本时的习惯策略从左向右、自上而下地组织模型信息,因此放入短期记忆中的信息基本是按照模型的信息组织方式。

认知理论解释了信息放入短期记忆后的认知过程,包括两个活动:搜索长期记忆中的相关知识;对图形信息进行解释并与长期记忆整合。影响认知效果的根本因素是认知计算量。对用户来说,主要依靠搜索长期记忆中关于业务环境等的知识来解释图形所传达的含义。根据认知匹配理论,当放人短期记忆的信息结构与用户长期记忆中的知识组织方式一致时。搜索相关知识的效率将提高,整合新知识时也减少了结构关系的转换计算,使得总的计算量降低,因此认知正确性将提高。

综上所述,概念模型的信息组织方式与用户长期记忆中知识结构的匹配程度是影响认知过程正确性的重要因素。

本文将以面向对象与面向过程的概念模型为例,验证上述分析。两类模型对信息的组织方式显著不同:面向对象的模型将信息分类、抽象为对象,以对象为中心组织与对象相关的属性、行为、通讯等信息,如用例图中围绕各角色的行为活动(即用例);而面向过程的模型将信息抽象为信息流,通过信息处理流程中的前后衔接组织信息,如数据流程图中“处理模块”的输入和输出“信息流”。

认知心理学中众多研究结论显示出人们的自然思考方式首先是分类,这正是面向对象思想的基础。因此可以说,面向对象模型的信息组织方式与未接受过专业学习的用户脑中的知识组织更加匹配。由此判断,与面向过程的概念模型相比,采用面向对象的概念模型更利于用户理解。

假设1:描述同一系统信息时,用户使用面向对象模型的理解效果显著高于面向过程模型。

2.2 基于语义网络理论的理解效果

语义网络理论对人脑中的知识组织方式作了很好的解释:人的长期记忆中,知识是通过节点互联的网络来组织的。节点代表任何实体、抽象类、属性等概念;节点间的连接表示概念间的某种关系。一条信息可能包含一个、两个或多个节点,而多个节点之间的关系可能是直接关联,或是通过某些节点间接关联。

显然,当信息包含的节点数较少、节点间的连接较少时,认知过程的搜索和整合计算量都更小。因此,为了进一步分析用户认知特点与概念模型的交互作用,本文根据信息中所包含的节点数及连接关系的复杂程度,将理解效果分为简单理解与复杂理解。

有研究曾发现,不熟悉概念模型的阅读者在使用用例图和使用数据流程图识别单个信息点的完整性上没有差别。这是因为,理解简单信息时的认知计算量很少,面向对象模型信息组织的优势不显著;但随着信息复杂度增加,两类模型认知计算量的差异将显现出来。

假设2:描述同一系统的简单信息时,面向对象与面向过程概念模型的用户沟通效果无显著差异;

假设3:描述同一系统的复杂信息时,面向对象概念模型的用户沟通效果显著高于面向过程模型。

3 研究方法

3.1 实验对象及实验过程

本文采用实验室研究方法收取数据。实验在大学课堂道行,选修同一课程的管理学院各专业学生自愿参加,最终参加学生41人。实验中学生被随机分为两组,依次完成三项任务:阅读描述同一系统的系统需求说明,两组的阅读材料不同;回答关于系统理解效果的测试问题,包括简单信息及复杂信息;填写个人经历以及实验感受的问卷。

3.2 实验设计

3.2.1 实验情境 待开发的系统是一个校友录系统。大学生对这样的系统较为熟悉,符合学生作为系统用户的角色。实验人员在实验开始时将以系统开发者的角色进入,并说明实验参与者将作为该系统的用户,实验目的是使用户理解系统的构建内容。

3.2.2 需求说明 两组阅读的需求说明分另0由用例图(UseCaseDiagram)与数据流程图(DataFlowDia-gram)来描述,两者是当前使用最广泛的概念模型,分别代表面向对象与面向过程的概念模型。两组模型描述了相同的系统内容,所传达的信息量一致,只是表达形式不同。由于实验时间的限制,所描述的系统只具备简单的功能。

3.2.3 理解效果 用户的理解效果通过回答问题的正确率来反映。所有问题均为判断题,共14题:关于简单理解的问题共7题,只涉及需求中两个概念及直接连接关系;关于复杂理解的问题共7题,涉及三个以上概念及其关系。所有14道问题的正确率反映用户的整体理解。

3.2.4 实验后调查问卷 问卷主要通过五点量表测量实验中的假定条件以及控制变量。包括三个问题:阅读者对概念模型的学习程度、阅读者对校友录系统背景的熟悉程度(这两者用来保证学生作为用户角色的有效性)以及阅读者感知的模型阅读难度。感知的阅读难度也是影响模型使用的重要因素,因此在本研究中作为控制变量。

4 实验结果与讨论

4.1 实验数据剔除

实验收集到数据41份,首先剔除回答不完整的数据1份,然后对实验的前提假定进行检验。统计阅读者的模型知识表明所有参与者都没有学习过概念模型知识,同时95%的参与者较熟悉或非常熟悉校友录系统。为进一步保证实验的有效性,根据参与者对系统背景的熟悉情况剔除了解很少或完全不了解的参与者数据3份。最终获得有效数据37份,其中用例图组19份,数据流程图组18份。接下来将使用SpSS统计软件对数据进行分析、验证假设。

4.2 模型对用户理解的影响

采用多元方差分析方法验证两概念模型组阅读效果的差异,并将用户感知的模型阅读难度作为协变量以控制其对因变量的影响。两组用户的简单理解效果没有显著影响(显著性=0.617),支持了似设2;复杂理解效果方面,用例组(均值=0.722)显著高于数据流程图组(均值=0.579),显著性=0.007,支持了假设3;总体理解效果方面,用例图组(均值=0.726)也显著(显著性=0.043)高于数据流程图组(均值=0.643),支持了假设1。如表1所示:

4.3 用户不同层次的理解效果

通过对同一用户简单理解效果与复杂理解效果的配对均值检验来反映前文中关于理解划分的认知基础。用户对简单问题的理解效果显著高于对复杂问题的理解(显著性=0.045),如表2所示:

4.4 讨论

4.4.1 用例图组用户的总体理解效果显著高于数据流程图组(假设1) 基于前面的分析,该结论在理论上验证了影响用户理解效果的一个重要的概念模型因素――模型信息组织结构特征,该因素与用户知识组织结构交互影响用户理解效果,即使用与用户知识组织结构更相近的概念模型得到的用户理解效果更好。这为概念棋型的选择和评价提供了一个较可靠的一般性的依据。该结论为实践中而向对象的概念模型在用户沟通方面的意义提供了证据支持,为开发项目选择概念模型提供了直接的参考。

本文基于认知特点的分析认为用户与开发人员在理解概念模型时(无论是感知过程还是认知过程)具有显著差异,对比以往研究中面向过程的慨念模型更有利于开发人员理解的结论,本实验室研究的结论间接证明了用户与开发人员认知特点上的差异。

4.4.2 用户对不同复杂度信息的理解效果差异显著

用户对简单问题的理解效果显著高于复杂问题;且用例图/数据流程图在简单和复杂信息理解效果方面的表现显著不同(假设2,假设3)。这些结论验证了认知复杂度是用户理解效果的本质影响因素,进一步解释了具有不同信息组织特征的概念模型是通过影响用户认知计算量影响用户理解效果的。

同时,该结论具有更高的可靠性。可以对以往一些研究结论进行解释:即由于所设置的信息过于简单或没有选择对用户认知计算量有影响差别的概念模型,以往研究可能获得概念模型对用户沟通效果无影响作用的结论。这再次肯定了该领域研究中以用户认知特点为基础的重要意义。

5 结语

地理信息系统基本概念篇7

关键词:管理会计信息系统;pea模型;平衡记分卡;全面概念数据库设计框架

中图分类号:F234.3 文献标识码:a 文章编号:1005-0892(2007)08-0116-05

信息技术的迅猛发展,推动人类社会从工业经济时代跨入知识经济时代。在这种背景下,会计作为“商业语言”,面临着前所未有的巨大冲击和挑战。众所周知,管理会计作为公司的信息系统,在开发业绩评价框架方面始终发挥着主导作用。然而,陈旧的会计信息系统设计方式,制约了管理会计对信息技术发展的充分利用。运用会计领域的创新工具Rea模型和平衡记分卡进行管理会计信息系统重构,可以实现管理会计与公司数据库设计的融合,密切公司业绩评价、战略决策和信息系统设计功能之间的联系,促使管理会计人员更加有效地参与公司战略管理和控制。

一、管理会计信息系统重构的背景:管理会计人员面临职责转变挑战

信息技术的发展和推广应用,持续不断地改变着会计工作的作用和内容。peterDrucker(1992)指出,信息技术的发展已经使得会计成为最具挑战性和不确定性的管理领域之一,日益带来会计与管理信息系统的交叉。管理信息系统工作人员通常比较关注与计算机软硬件相关的技术问题,但信息系统面临的未来挑战将不在于技术方面,而在于把数据转化为对决策有用信息的能力。michaelallies等预测,在未来10年中,管理会计将有可能提供一系列广泛的战略和运营指标,从而使财务会计成为其子集。随着公司战略从成本竞争转向质量、时间和客户服务竞争,将有更多参与者(诸如工程师、it界人士和咨询公司等)作为信息提供者与管理会计人员展开竞争,他们甚至可能在提供特定类型信息方面比管理会计人员更具优势。在这种变革的环境下,“随着对大量信息实时解释需要的增加…会计人员面临的挑战将是证明他们的内在竞争优势”。

会计领域的发展能否应对这种挑战?传统会计系统受到基于经济业务的财务会计需求驱动,难以反映公司经济活动的全貌。因此,公司内部不同职责部门持有平行的信息系统用于满足各自的需求,不仅导致数据储存的低效率,而且难以实现跨部门信息整合。问题的关键在于,传统会计系统的设计和开发已经陈旧过时。首先,传统会计系统中的唯一设计是设置账户表,它是会计循环的第一步,最终旨在生成统一财务报表,因此仅关注经济业务的财务方面,而将更广泛的信息如生产率等排除在外。其次,传统会计系统的构建基础是具有700年历史,可以追溯到卢卡.帕乔利时代的借贷模型。虽然借贷模型在手工记账系统中十分有效,实现了会计业务活动的具体化,但随着公司性质和规模的变化以及数据库和联机处理的出现,以其为基础的传统会计系统已经难以满足管理层的决策需要。

在这种情形下,公司的信息系统开发任务在很大程度上归属到管理信息系统(miS)部门。miS已经确立了“系统开发生命周期”(SDLC),包括系统规划、分析、设计和执行。使用michaelporter的价值链概念对其加以描述,有助于我们获得对影响公司信息系统开发问题的深入理解,如图1所示。SDLC的设计阶段增加了该信息系统的价值,因为它有助于确定决策所用信息的充分性和相关性。如前所述,信息系统面临的未来挑战将不在于技术方面,而在于把数据转换为对决策有用信息的能力。因此,信息价值链的主要优势在于能够收集和提供相关信息,带来控制和决策流程的增值。miS开发人员因接受过技术培训而在当前的系统设计和执行中发挥着重要作用,但最了解信息价值链和价值增值手段的是管理会计人员。正如michaelporter所指出的,“任何其他信息系统都不具备将公司所有职能部门的业绩整合为一套指标体系的能力,正是这种能力,使得会计被称作‘商业语言’”。但是,传统会计系统仅反映公司流程的有限方面,不利于管理会计人员在整个公司管理信息系统设计中发挥重要作用。全面采纳Rea模型和平衡记分卡重构会计信息系统,实现管理会计与公司数据库设计的融合,有助于管理会计人员成功完成职责转变。

二、管理会计信息系统重构的基础:平衡记分卡和Rea模型

Rea模型(资源-事件-参与者模型)是一种数据库设计概念模型,可以为管理会计人员提供数据库系统设计工具。平衡记分卡(BalancedScorecard)作为信息价值链中的下游作业,可以提供业绩评价框架,用于传递和计量战略,并为系统设计提供依据。这两种工具在信息系统开发设计阶段的结合使用,可以促使管理会计人员在信息系统领域发挥新作用。

(一)平衡记分卡

平衡记分卡被称作“战略计量系统”和“全面业绩评价系统”,由卡普兰和诺顿在1992年提出,其后得到不断丰富和完善。从概念设计的角度看,平衡记分卡作为业绩评价框架可以发挥最大效用。andyneelY等指出,“毫无疑问,平衡记分卡是目前得到最广泛认可的业绩评价框架之一。”

从本质上看,平衡记分卡是旨在反映公司战略的一系列领先型和落后型业绩评价指标的结合。其基本原理在于,一个“平衡”的业绩评价系统不仅应该包括传递有关公司过去业务活动信息的落后型指标(财务指标),还应该包括反映财务业绩动因的领先型指标(非财务指标)。因此,平衡记分卡是财务指标与非财务指标的结合,非财务指标表明公司战略的执行过程,财务指标反映公司战略的执行结果。

平衡记分卡的业绩评价系统包括四个方面:财务业绩、客户关系、内部业务流程、学习和成长。客户关系视角侧重于战略对客户满意度的影响,包括质量、时间、绩效、服务和成本等各个方面。客户满意度是公司内部业务流程运作的结果。内部业务流程视角反映公司核心竞争力和核心流程(诸如生产、设计和新产品开发等领域)的业绩,公司在这些领域必须非常出色,才能实现整体目标。全球竞争的日益激烈要求公司持续对其产品和流程加以改善,并且具有开发新产品的能力。学习和成长视角考虑持续学习和创新的重要性,侧重于衡量公司对流程和产品加以改良以实现其目标的能力。财务视角是表明公司战略恰当与否的最终指标,反映战略执行情况的改善是否已经转化为更高的盈利能力,通常使用现金流量、销售增长率和收益等传统指标计量公司财务业绩。

从总体上看,平衡记分卡相关研究主要从两个视

角展开。一个视角是考察基本理论的相关性,尤其是领先型指标对财务业绩的影响。Christopherittner等发现,客户满意度是财务业绩的领先型指标。RaJivBanker等也发现,反映客户满意度的非财务指标与未来财务业绩非常相关,而且包含财务指标所未能反映的额外信息。Venkynagar等则发现,与质量相关的非财务指标(例如缺陷率和及时运达率等)是未来销售收入的领先型指标。叫另一个视角是考察成功执行平衡记分卡的各个方面。marymalina等检验了卡普兰等在1996年提出的观点,即认为平衡记分卡主要不是一种评估方法,而是一种战略规划和传递工具。研究结果表明,经过良好设计并且具有良好信息传递功能的平衡记分卡,能够激发低层经理人员按照公司战略行事的积极性。Christopherittner等考察平衡记分卡在激励计划中的应用,发现非财务指标权重设计的主观性导致了激励计划的执行混乱。marlysLipe等对各业务部门的专用指标和共用指标进行研究,发现共用指标被应用于业务部门评价,而专用指标未能在这种评价中受到重视。

这些研究表明,平衡记分卡赋予了参与财务会计报告过程的管理会计人员一个新角色,即在信息价值链中发挥作用。平衡记分卡所提供的平衡指标系统意味着,信息系统的各项功能需要彼此结合。卡普兰等把“功能鸿沟”(“functionalsilos)视作战略开发和执行过程中的障碍。他们指出,“按照传统,公司总是围绕财务、生产、销售、工程和采购等功能设计,各种功能具有自身的知识、语言和文化,从而导致功能鸿沟产生并成为战略执行的主要障碍,因为大多数公司很难进行跨功能战略传递和协调。”平衡记分卡是一个将各种功能结合起来的计量系统,管理会计人员可以在利用其潜能方面发挥重要作用。

相关研究还指出,信息系统价值链的系统设计对计量指标的有效性具有重要影响,从而进一步证实管理会计人员应该更多参与系统设计和执行,因为各种计量指标正是在设计阶段被融入系统中。在各个功能领域,各种指标被赋予的含义与所收集数据之间的关系必须保持一致,而且必须反映公司的经营活动。有研究证实,各业务部门的共用指标更有助于决策,从而表明指标应该更具一致性和可比性。此外,为实现一战略在整个公司内部的传递和协调,还需要将各种计量指标无偏地应用于公司内部各个不同层次。卡普兰等指出了平衡记分卡实施流程与信息系统之间的联系,“一个新组建的团队提出了一个记分卡执行计划,包括把数据库计量指标与信息系统联系起来,在公司内部传递平衡记分卡理念,以及鼓励和促进分权经营公司次级指标的开发。作为这一流程的结果,一个全新的管理信息系统将被建立起来,从而把高层业务部门的计量指标与最低层车间班组的特定运营指标联系起来”。因此,信息系统设计是执行与公司战略相符的平衡记分卡的重要环节。

(二)Kea模型

Rea模型是一种支持信息系统设计的概念建模工具。所谓概念模型,是指用高度抽象的方式反映现实世界状况的数据模型。这种模型独立于机器,对现实状况的描述易于理解和解释。Rea模型具有很多有助于其成为有效管理会计工具的特征。首先,它能够反映经济业务的两重性,即资源的流人和流出,与传统会计中的“借项和贷项”一样有效。此外,它还可以为管理会计人员提供一个概念框架,帮助其概括公司特征、详述业务活动和站在公司全面视角设计数据库,从而满足内外信息使用者的需求。

Rea模型的基本构架由三种实体组成,分别称为资源、经营事件和参与者。经营事件是公司流程的一部分。例如,收现是一个经营事件,它是销售流程的一个组成部分。与该经营事件相关的资源是现金,相关参与者则为内部参与者(出纳人员)和外部参与者(客户)。实体的最基本性质称为属性,即为实体的具体化。例如,对于客户实体而言,属性可以包括客户状况、客户数量、客户满意度反馈等项目。资源、经营事件和参与者作为Rea模型的基本构架,有助于把公司战略指标系统与信息系统数据库联系起来。

Rea模型通过提供两种组织观――局部观和全局观,支持公司的计划、控制和决策流程。局部观又称为外部纲要,是指对公司不同业务流程的经营事件以及与这些经营事件相关的资源和参与者加以具体描述,如图2所示。全局观又称为概念纲要,是局部观、业务活动和流程在公司范围内的整合,如图3所示。

三、管理会计信息系统重构的方法:开发全面概念数据库设计框架

Rea模型和平衡记分卡作为会计领域的创新工具,为管理会计信息系统的重构奠定了基础。我们试图在两者之间建立起逻辑联系,通过开发全面概念数据库设计框架,重构管理会计信息系统,以充分发挥管理会计在公司战略规划开发和评估中的作用。

(一)开发概念设计框架的依托:概念模型和设计战略

开发概念设计框架,首先需要依托概念模型。Rea作为一种概念模型设计工具,能够满足开发数据库系统支持战略决策的需要。概念设计旨在描述数据库的信息内容,通常从需求说明开始,结束于数据库全局观的形成。概念设计模型在SDLC的各个流程与信息价值链的价值创造之间建立起重要联系。.用户输入对确定数据库的内容至关重要,尤其便于计量指标和其他信息的含义与数据相符。CarloBatini等指出,“最终用户影响设计决策能够带来很多积极后果:概念纲要的质量会提高,项目更有可能趋向预期结果,开发成本也会下降。更重要的是,如果用户拥有更多机会参与决策流程,将促使其更愿意接受和使用该信息系统。Rea概念模型的最基本构成要素“属性”,可以将其与平衡记分卡的业绩评价指标联系起来,从而促使用户直接参与支持决策的信息系统设计过程。

开发概念设计框架,还需要依托战略,以便确定数据来源以及将数据在概念模型内部加以整合的方式。Batini等描述了三种概念设计开发战略:自上而下型战略、自下而上型战略和混合战略。自上而下型战略重视概念设计各个阶段的改进,以最宽泛和抽象的理想系统纲要作为起点,引入与模型相关的具体信息,诸如各个层次不同功能领域之间的关系等。自下而上型战略则以各功能领域的需求等基本概念作为起点,在此基础上建立更复杂的概念,最终融合为一个全局纲要。混合战略使用前两种战略的要素,是前两种战略的综合。混合战略的重要特征是:系统设计师使用应用域的细分子集引导全面系统,子集使用自下而上型战略开发,包括应用域的详细信息;与此同时,设计师使用骨架纲要整合设计的各个方面,骨架纲要发挥框架作用,包括应用域的最重要概念,更便于子集所产生的不同纲要进行自下而上的整合。

(二)全面概念数据库设计框架的构建:平衡记分卡战略模型与Kea模型的结合

本文使用混合战略开发概念数据库设计框架,同

时应用Rea模型和平衡记分卡实现概念设计,称为全面概念数据库设计框架,如图4所示。图4表明,全面概念数据库设计框架的执行,涉及到两个重要阶段:首先需要把公司战略转化为平衡记分卡模型,即阐明公司战略并将其与平衡记分卡相结合;其次需要把平衡记分卡模型转化为Rea概念模型。

全面概念数据库设计框架以平衡记分卡战略模型的开发作为起点,使公司战略与信息系统相联系。在这一阶段,公司首先确定战略目标,随后将战略目标映射到平衡记分卡中,转换为四个视角的目标以及各个目标的相应计量指标。例如,如果一家公司实施产品差异化战略,它可能将开发研究技能作为学习和成长视角的目标,而相应的计量指标可能是所雇用研究科学家的数量。与此相联系,内部业务流程视角的目标可能是提高公司内部的创新能力,而相应的计量指标可能是所开发专利的数量;客户关系视角的目标可能是提高市场份额,而相应的计量指标可能是新客户的数量。通过这一阶段,平衡记分卡可以提供基于公司战略的一个全面计量系统。

在第二个阶段,公司需要把平衡记分卡模型转化为Rea概念模型。为实现这一目的,公司首先需要使用平衡记分卡,建立作为混合战略概念设计基础的骨架纲要。骨架纲要能够为理想的信息系统模型提供框架,平衡记分卡在这方面尤其有用,因为它能够确定与战略相关的主要目标,对这些目标加以计量,并且提供有关计量指标之间的逻辑关系,形成一个计量系统。这种基于平衡记分卡的骨架纲要是自上而下型战略的基础,可以用于确定与战略相关的业务流程,受到影响的实体,以及与实体相关的特定属性,确保最终模型与平衡记分卡战略模型相呼应。公司也可以采纳自下而上型战略实现概念没计,首先将平衡记分卡的计量指标分解为Rea模型的基本计量单位“属性”,然后确定与属性相关的实体,最后确定流程。有些计量指标不需要进一步分解,可以直接成为与实体相联系的恰当属性,例如产品创新带来的新客户等;有些指标则需要进一步分解为不同要素,以便形成与Rea相对应的属性,例如投资回报率等。同时使用上述两种战略。既可以确保最初战略中确定的所有计量指标都通过自下而上型战略包括在内,也可以确保可能与战略相关的其他指标都通过自上而下型战略找到。最后,使用骨架纲要对根据两种战略形成的概念设计加以比较,可以形成公司的全局纲要,从而确保公司战略总目标得到保持。

四、管理会计信息系统重构的意义:实现管理会计与公司数据库设计的融合

开发全面概念数据库设计框架重构管理会计系统,有助于实现公司内部的会计与信息系统集成,完成会计与信息系统数据的语义统一。在全面概念数据库设计框架下,系统所有数据按照“资源”、“经营事件”和“参与者”集成在一个逻辑数据库中,消除了数据分散重复存储在多个系统中所造成的数据不完整、冗余和不一致问题,有助于支持跨部门信息传递。由于系统记录所有经营事件的细节数据,任何信息使用者都可以通过查询功能从信息系统中直接获得自身所需信息,并且相应生成各类报告,突破了传统会计信息系统以单一会计信息使用者为用户的局限性,有助于满足公司所有利益相关者的信息需求。

开发全面概念数据库设计框架重构管理会计系统,有助于管理会计人员对平衡记分卡在公司内部的执行。有研究表明,平衡记分卡能否成功,关键在于执行问题。卡普兰等指出,平衡记分卡的成功执行者是有能力将战略转化为行动的“战略型公司”。公司战略的成功转化涉及到通过平衡记分卡与信息系统的有效结合,把平衡记分卡理念在公司内部传播。全面概念设计框架能够为管理会计人员提供将战略映射到概念设计中的工具――平衡记分卡的计量指标,并最终将其与信息系统数据库相结合。正如卡普兰等所指出的,平衡记分卡的执行涉及到创造“一个全新的管理信息系统,把从高层业务部门直至车间班组的计量指标联系起来。”它作为一个持续的过程,支持公司内部各个层次的战略传递和整合。因此,管理会计人员可以通过参与设计阶段,在平衡记分卡执行问题上对公司形成支持,例如在公司内部传递平衡记分卡理念、将薪酬计划与平衡记分卡联系起来等。

开发全面概念数据库设计框架重构管理会计系统,有助于促使管理会计人员深入参与公司战略和信息价值链设计,并在执行战略过程中获得更多与行政管理人员合作的机会。随着管理会计人员对全面概念数据库设计框架功能的深入了解,将有助于其在为公司实现价值增值方面发挥更大作用。

地理信息系统基本概念篇8

财务会计概念框架(以下简称“概念框架”)“是一个连贯、协调、内在一致的理论体系”(paton和Littleton,1966)。一些主要国家的概念框架均以理论性文件而非会计准则存在。考虑到现时的实际情况,葛家澍教授(2005)提出,“我国财务会计概念框架建设应该分两步走,第一步先修改、充实现行基本准则;第二步,等到时机成熟,基本准则可以转化为更符合国际惯例的财务会计概念框架,这一设想,并非保守,而是实事求是”。另一方面,我国准则制定机构正在考虑《会计准则——基本准则》(简称《基本准则》)的修订,并将其定位调整为规范具体准则的制定以及没有具体会计准则规范的交易或者事项的会计处理。上述思路与做法可以归纳为我国概念框架建设“理论共识-基本准则-概念框架”这一两阶段形式转换策略。

显然,两阶段形式转换策略既有会计环境的诉求,也有现实的客观需要。

但概念框架的理论本质与其表现形式具有天然的联系,若以基本准则来展现概念框架的阶段性设计,可能导致其实质和形式的内在冲突。本文的主旨是分析这种冲突形成的根源及其影响,并在关注现实国情的前提下提出相应的缓解对策。

一、冲突的由来及其根源

1.概念框架的理论本质

直到今天,著名会计学家:paton和Littleton在其经典名著《公司会计准则导论》中提出的“会计理论的框架应当成为一个连贯、协调、内在一致的理论体系”的观点不仅得到了理论界的高度认可,也得到各国以及国际准则制定机构的积极认同。美国财务会计准则委员会(FaSB)1980年发表的第二号财务会计概念公告(SFaCno.2)指出,财务会计概念框架是由目标和相互关联的基本概念组成的连贯的理论体系。这些目标和基本概念导致前后一贯的准则。通过制定财务会计和报告的结构与方向,促进公正的财务会计信息和有关信息的提供,以便有助于协助资本市场和其他市场的有效运行。该框架将能为公众利益服务。

确定目标和识别基本概念并不是为了直接解决财务会计和报告中的各项,而是要求目标指出方向,用概念作为解决问题的工具。

自FaSB发表SFaCno.2之后,理论界关于概念框架本质的认识还形成了一些新的观点,包括“宪法”和“章程”观点:“法”和“理性编纂”观点:“结构化的理论”观点;观点:“自圆其说的文件”观点等。总体而言,概念框架是一种具有指南作用的共识性的会计理论(孙铮,朱国泓,2004)或实用性理论(葛家澍,2005)的观点得到了比较普遍的认可。因此,最符合其本质的表现形式只能是会计理论和共同的会计理念。

2.概念框架的适用形式及其国际实践支持

概念框架的理论本质要求有其适用的表现形式。作为一种理论,概念框架除了深入、系统地揭示事物本身的内在性外,还需要相应的表现形式来加强其理论效果,这些表现形式包括理论的推理、结构图形的巧妙运用、类比与比喻的措辞选择等。从其载体来看,iaSC、加拿大和澳大利亚尽管将其归集于国际会计准则或各自的权威手册中,但都强调了概念框架的非准则性质。

3.概念框架理论本质与会计法规形式的冲突

两阶段形式转换策略的第一次转换实际上是通过基本准则吸纳概念框架的部分内容,力图实现概念框架的实质性作用。对概念框架而言,它经历了一种形式上的转换,即不再是理论性的权威文件,而是内化于我国基本准则的会计法规。法规的表现形式是条文化的,重结果,只规定哪些行为是允许的,哪些行为是禁止的,一般不讲究条文之间的内在逻辑推理,更不可能采用符合人们认知规律的层次结构图。为保证法规的严肃性,一般不会采用通俗易懂的比喻、类比措辞等。概念框架的理论本质与会计法规的条文形式之间难免存在冲突。其结果是,一个缺乏内在逻辑的条文很难成为使用者的共识,不利于准则制定过程中的有关主体在充分博弈的基础上更好地制定或修改准则,也不利于会计人员更好地做出职业判断。

另一方面,第二次转换若以基本准则为出发点的话,更有可能偏离概念框架理论本质所需要的表现形式,最终影响概念框架实际作用的充分发挥。

4.冲突的主要根源

概念框架形式转换过程产生的冲突根源可以从供给与需求两个方面进行挖掘。从供给方面来看:(1)概念框架权威文件的推出首先需要有系统、成熟并得到公认、能形成共识的概念框架理论。截止,既反映我国具体国情,又体现其内在规律性的会计理论体系并未形成。(2)会计理论、规范制定的政府导向比较明显,会计理论研究独立性较低,加上概念框架的“准公共产品”属性,概念框架的推出面临众多困难。(3)大陆法系的法律传统,通常会促使准则制定机构偏向于以《会计准则》这一法规形式表述国外对应的理论性文件。(4)不同的学科有不同的思维与语言体系,学科之间的沟通通常会制约法律法规的出台,概念框架必然面临法律的程序困难以及准则制定机关和法制部门的沟通问题(葛家澍,2005)。

另一方面,现实对概念框架的形式转换提出了需求:(1)我国1992年出台的《基本准则》经过实践检验,在对具体问题的指导上,起到了相当积极的作用。改革和对外开放的深化又要求《基本准则》与时俱进,以更好地满足各方会计信息使用者的决策需要。概念框架在现时部分地进入会计法规已具备了一定的现实基础。(2)人们很难挣脱的路径依赖习惯使我国概念框架要在“只认法律、法规或规章”的会计环境下引起有关各方的高度重视,并起到指导人们实践的作用存在着相当的困难,所以采取《基本准则》这一法规形式是比较合适的权宜之策。

现阶段我国的概念框架建设必须进行相应的形式转换,概念框架的理论本质与会计法规的表现形式之间的冲突由此形成,并在当前这一特定阶段内无法回避。

二、冲突的可能影响及其经济后果

1.表现形式制约其实质作用的发挥

《企业会计准则——基本准则》(征求意见稿)(以下简称征求意见稿)新增加的第二条“本准则规范具体会计准则的制定以及没有具体会计准则规范的交易或者事项的会计处理”是本次《基本准则》修订中最大的变化和亮点所在,它界定了《基本准则》所追求的目标类似于概念框架的实质性作用。但《基本准则》无法实现这一目标。原因是,作为会计法规的具体表现形式,《基本准则》存在众多局限性,比如法规的强制性、封闭性,法律条文为迎合法律的表述形式可能丧失其应有的独立性,以及它与具体会计准则、会计制度协调的现实要求都可能影响作为会计理论共识的概念框架的开放性与独立性,此外法规所要求的结论性文字表述,以及比喻、类比措辞的极少使用都可能影响准则制定者、参与者及具体人士对它的理解,和它的被接纳程度。

2.理论准备不足影响其权威性和可接受性

会计法规的表现形式影响《基本准则》实质作用的展开,实际上有一个暗含的假设,即我们的概念框架理论研究已经取得了高度共识,并成为指导人们准则制定、职业判断的共同理念。在概念框架理论尚未形成共识时,通过基本准则这种形式加以转换,以实现“实质重于形式”的目的,会面临更多难题。对于《基本准则》而言,在概念框架理论尚未达成共识时仓促修订《基本准则》很可能影响《基本准则》的权威性及其被接受程度,并进一步影响其所追求的实质性目标。尤其是当第一阶段转化后,若理论界和准则制定机构放松概念框架理论研究,《基本准则》的适时修订及其权威性保障就可能面临重大的危机。

3.形式转换降低效果

国外概念框架权威文件所蕴含的理性精神及其对认知规律的强调通过人们对相关共识的认可而对其行为产生潜移默化的影响。尽管这种影响并不具有强制性,但其影响之深远往往是法律法规、准则、制度所无法比拟的。它的影响范围之大,受众对象之多,也可能是已有会计规范无法比拟的。它的构建与合理表述还使它具有非常典型的、深远的教育含义。这种教育含义不仅仅体现在学校正规教育、会计职业教育,而且还体现在那些对此问题感兴趣的人群的自由阅读中(孙铮,朱国泓,2004)。一旦让概念框架的某些内容进入《基本准则》,由于上述表现形式的约束,必然导致其教育效果的降低。

4.路径依赖造成概念框架出台的拖延乃至偃旗息鼓

国内理论界及准则制定机构试图将概念框架的某些内容内化到《基本准则》的修订稿之中,是基于一个最基本的判断和认识:我国是大陆法系国家,只有法律法规才具有相应的权威性。很显然,上述思维更多地认同了路径依赖对规则制定的影响。如果不能对此进行系统思考,这一权宜决策可能会加重这种路径依赖——人们更多地关注《基本准则》具体条文本身,而忽视整个《基本准则》所依托的概念框架理论及其背后的会计理念。可能的结果是,概念框架理论研究被延缓乃至偃旗息鼓。路径依赖的增强很可能造成未来概念框架权威文件出台的久拖不决。

5.权宜决策影响会计国际化的方向与节奏

作为一种建立在经济理论逻辑基础之上的实用性会计理论,在不同国家之间仍然具有典型的相同相通性。尽管各国的会计环境存在差异,并有可能导致会计信息质量特征强调重点的差异,但它们之间的差异与会计实务的差异相比,终究是比较小的。所以,概念框架有助于一国会计国际化方向与节奏的整体把握。作为一种权宜决策,将概念框架的部分内容置于《基本准则》之中,由于法规自身的形式要求,以及上述的路径依赖,有可能影响我国会计国际化的方向与节奏。

6.可能的经济后果

尽管概念框架的形式转换(《基本准则》)并不像具体准则的经济后果那样直接和具体,但它对具体准则制定的指导、评估及修改以及为人们提供相关的背景共识使得它在经济后果方面具有极强的杠杆特征。其经济后果可以从直接经济后果和间接经济后果两方面加以分析。就前者而言,上述形式转换所产生的冲突将增加《基本准则》的修订成本,包括人们与应用《基本准则》的成本、具体准则的制定及修订成本、为达成具体准则的讨价还价成本等。至于后者,则是因具体准则试错和频繁修订所导致的一系列经济资源的不当配置及其财富的漏损造成的。

三、冲突的缓解:《基本准则》修订的若干基点及其两难的排解

1.修订《基本准则》的若干基点

在概念框架尚未取得广泛共识前,为《基本准则》修订设置合理的基点尤为必要。

第一,关于《基本准则》的定位。征求意见稿第二条将《基本准则》的作用定位在“规范准则的制定以及没有具体规范时交易或事项的会计处理”。由于会计信息不仅包括信息的生产,更需要以合理的方式加以及时的传递。

上述定位应修改为“……交易或者事项的会计处理,信息的列报与披露”。

第二,关于会计信息的总体质量目标。我国主义市场是以公有制为主体的市场经济,国有经济占主导地位,这要求我国会计信息的总体质量目标是“提供有关财务状况、经营业绩和现金流量等方面的有用信息,以满足有关各方的信息需要,有助于使用者做出经济决策,并反映管理层受托责任的履行情况”。所以,应坚持决策有用观和受托责任观兼顾的观点。

第三,关于《基本准则》的模块设定。现行《基本准则》包括“总则”、“一般原则”、“资产”、“负债”、“所有者权益”、“收入”、“费用”、“利润”、“财务报告”和“附则”共十章。若将概念框架的有关内化到《基本准则》中,上述模块结构必须加以调整。为更好地体现概念框架的实质,建议国外概念框架的体例:首先强调《基本准则》的重新定位;其次列明会计的基本假设和基本原则;再次就会计信息质量要求做出规定;随后分别对六大会计要求加以简单的定义,并就其确认与计量提供简明标准;最后就会计信息的列报与披露做出相应的规定。

2.《基本准则》修订的两难及其排解:以“会计信息质量要求”为例与现有的《基本准则》相比,征求意见稿专列了第二章“会计信息质量要求”。应该说,这种安排更好地体现了概念框架的精神实质,有助于实现其目标定位。

但是,会计法规的形式要求与基本准则所追求的实质性目标之间存在冲突,再加上会计信息质量特征的理论研究尚未形成共识,使得《基本准则》修订中“会计信息质量要求”的修改同样面临着两难困境,必须及时排解。

(1)“原则”与“会计信息质量要求”的“合与分”。征求意见稿第二章“会计信息质量要求”仍然沿袭了现有《基本准则》中“原则”与“质量要求”不分的体例。但二者混为一谈,必然人们对会计信息质量的充分理解。所以,建议将“权责发生制原则”、“成本原则”、“收入费用配比原则”和“划分收益性支出与资本性支出原则”等四大基本原则放到“总则”会计假设之后,更加突出会计信息质量要求。

(2)会计信息质量的“多与寡”。现行《基本准则》谈到了“如实反映”、“可比性”、“一致性”、“及时性”、“可理解性”、“谨慎性”、“完整性”、“重要性”等质量要求。征求意见稿在强调会计信息的“决策有用”和“反映受托责任”的基础上提到了“如实反映”、“真实性”、“完整性”、“可靠性”、“相关性”、“谨慎性”、“实质重于形式”、“可比性”、“充分披露”、“及时性”、“可理解性”、“重要性”等信息质量要求。二者相比较,征求意见稿的会计信息质量要求实现了“大扩容”。按照法规表述,这些会计信息质量要求只能采用罗列式表述,而不太可能采用国外会计信息质量特征的层次结构图。其结果是,不便于阅读者理解这些质量要求之间的内在逻辑关系,以及为什么是这么多会计信息质量要求,而不是更多或更少?哪些质量要求是主要的质量要求?哪些质量要求是主要质量要求的构成要素?可见实质与形式之间存在着两难问题是不言而喻的。要排解这一两难,最根本的解决办法是首先确定哪些质量要求是主要质量要求,哪些是主要质量要求的子要求。建议借鉴英国aSB(1999)的最新成果,将相关性、可靠性、可比性与可理解性作为最主要的四种质量要求,然后分别就它们的子要求加以规定。

(3)会计信息质量的成本约束与重要性权衡。现行《基本准则》和征求意见稿都提到了重要性,但为什么要提重要性,并没有相应的解释。实际上,之所以会计信息的生产要有重要性标准,其根本原因在于,会计信息的生产存在成本与效益的平衡约束。就会计法规而言,它不太可能讲述会计信息的成本效益约束条件。另一方面,它也不会解释为什么会计信息要讲重要性。要解决这一两难问题,《基本准则》必须在揭示会计信息局限性的基础上展开重要性的基本内涵及其适用情形。

(4)各质量要求之间如何进行权衡?通常而言,会计法规只可能罗列各种会计信息质量要求,而不可能讲述各质量要求之间的权衡问题。然而,在准则制定和评估以及职业判断过程中,各质量要求之间的权衡取舍在很大程度上决定了准则或者职业判断的优劣。要排解这一两难问题,理论界和准则制定机构首先要在质量要求之间的权衡上达成共识,并在此基础上加以适当的表述。

四、冲突的缓解:配套支撑系统的建构

要使《基本准则》部分地起到概念框架的作用,除了《基本准则》按概念框架的实质修订之外,还需要有相应的支撑系统。

1.舆论的引导

尽管概念框架的地位和作用早已为国外的实践所证实,但理论界仍有部分人士在概念框架的认识上存在这样或那样的误区。因而有必要通过主流媒体和会计类报纸、期刊进行正确的舆论引导。目的是不仅要让会计界知道概念框架的积极作用,更要让社会各界关心会计的人士知道概念框架的本质、作用及其基本构成等。

2.理论准备与应循程序

我国设定的概念框架两阶段形式转换策略选择的根本瓶颈在于概念框架理论研究的不足。为此,理论界要加大研究力度,积极寻求符合我国会计环境的概念框架。准则制定部门应积极推动相关理论研究的公开讨论,在逐步研究的基础上形成相应的备忘录,有序推进概念框架的理论研究,为形成共同的会计理念奠定坚实的理论基础。在此基础上将上述研究成果加以集中整合,形成的概念框架草案。随后组织专家、学者、政府部门、业内人士就草案展开深入交流与对话,形成概念框架的征求意见稿。最后,就征求意见稿广泛征求各方意见,最终形成符合中国会计环境的概念框架。

3.方式的创新

《基本准则》是会计法规。除了这种表现形式外,准则制定部门和会计学术界仍有较大的伸展空间和多种具体表现形式来缓解概念框架形式转换所带来的内在冲突。比如,在《基本准则》(修订稿)时,拟订发行相应的“指南”和“基本准则讲解”,为每一个对会计特别是对基本准则感兴趣的人士讲述《基本准则》背后所隐含的会计理念。其二,中国会计学会、中国注册会计师协会可以印刷“基本准则修订的背景、重点及其理论说明”单行本,让会计职业界人士理解《基本准则》的实质性目标,促进《基本准则》实质性目标的真正实现。

4.的深化

要缓解我国概念框架形式转换所带来的冲突,必须通过会计教育加以弥补。从教育的具体形式来看,无论学历教育还是职业化的继续教育都需要加入概念框架方面的理论教育,更为重要的是要有关于中国概念框架的教育内容。在中国概念框架还不成熟之时,可以采取上述创新所形成的具体载体加强这方面的教育。会计教育的对象是多元的,它针对的应是关心会计、与会计有着切身利益关系的所有人士。

5.修订的动态化

由于概念框架理论研究的不足,我国《基本准则》的修订不可能一蹴而就。要更好地发挥其概念框架的实质性作用,《基本准则》必须随着概念框架理论研究的和会计共识的渐次形成进行积极的修订。如果概念框架理论研究取得全面突破,那么出台概念框架理论性权威文件就应该是—个正确而重要的战略决策。

五、结论与建议

首先,在当前环境下通过《基本准则》吸纳概念框架的内容与基本精神,实现“会计理论一基本准则”的第一阶段形式转换有重要的现实意义。

其次,现阶段《基本准则》对概念框架实质性作用的追求与其法规形式之间的冲突无法回避。在当前概念框架形式转换的过程中,概念框架理论研究不仅不能松懈,反而应该加强。只有这样,才能实现“框架理论研究-概念框架”的成功转换。

第三,《基本准则》要实现概念框架的实质性作用,在修订过程中应设定合理的基点,并按照“基本共识先行进入基本准则,更多共识陆续进入基本准则”的原则进行动态化的修订。

第四,要缓解上述冲突,有必要建立起包括舆论引导、理论准备、方式创新、教育深化与动态优化在内的配套支撑系统。

最后,《基本准则》不能取代概念框架,更不能取代对概念框架的理论研究。加强会计理论研究,尽早推进适合我国具体环境的概念框架理论性文件的出台是我国未来会计改革取得成功的重要因素。

参考:

[1]财政部。企业会计准则[S].北京:经济出版社,2001.

[2]财政部。企业会计准则——基本准则(征求意见稿)[Z].2005.

[3]财政部会计司(组织翻译)。对美国财务报告采用以原则为基础的会计体系的研究[m].北京:中国财政经济出版社,2003.

[4]葛家澍。实质重于形式欲速则不达——分两步走制定中国的财务会计概念框架[J].会计研究,2005,(6):3~9.

[5]孙铮,朱国泓。财务会计信息质量特征:验证与暂行结论(财政部重点课题研究报告)[R].上海:上海财经大学,2004.

[6]aaSB.qualitativecharacteristicsoffinancialinformation[Z].1990.

[7]aSBofUK.Statementofprinciplesforfinancialreporting[Z].1999.

[8]CiCa.Financialstatementconcepts[Z].1991.

[g]FaSB.analysisofissuesrelatedtoconceptualframeworkforfinancialaccountingandreporting:elementsoffinancialstatementsandtheirmeasurement[Z].1976.

[10]FaSB.thequalitativecharacteristicsofaccountinginformation[Z].1980.

地理信息系统基本概念篇9

企业价值是公司现有基础上的获利能力价值与潜在的获利机会价值之和。以价值为核心的绩效评价突破了传统的以财务指标为主的企业绩效评价体系的局限,强调绩效评价应能更好地体现企业未来业绩的预测与评价。

一、成本信息成为制约企业绩效评价的瓶颈

在以价值为基础的企业绩效评价体系中,无论是高层次的战略定位,还是低层次的企业经营,成本信息的运用一直贯穿其中。但是,目前国内许多企业的成本管理处于一种成本概念歪曲、成本信息滞后、成本系统无效的状态,在一定程度上成为制约企业价值的瓶颈因素。

(一)对成本概念的理解过于片面

当前,企业对成本的理解仍过多地强调成本的财务信息属性,而忽略了它的非财务信息属性。实质上,成本是一个内容十分宽泛的概念。它既包括管理者有效管理企业时所需的成本收益方面的财务信息,也包括生产率、质量等非财务信息。如果企业一味地注重财务信息,则有可能产生误导作用。因为财务信息倾向于关注短期因素。然而,随着经济的全球化发展和竞争的日益加剧,获得可持续性的竞争优势成为企业成功的关键因素。为了取得竞争胜利,企业必须首先关注一些长期的非财务性因素,如,产品与生产领先、产品质量和顾客忠诚度等。有时,过分强调财务信息去削减成本(一项财务指标)而忽略甚至降低质量标准(一项非财务指标),这样的决策可能会给企业带来重大灾难,导致长期内顾客和市场份额的丧失。反之,企业为了获得竞争优势可能会有意地抬高成本,只要所取得的溢价收入大于成本的增加额。因此,在研究成本概念时,有必要将战略思想引入其中,从战略角度考虑它的非财务性和长期性。

(二)会计收益的计算只考虑了债务资本的成本,忽略了对权益资本成本的补偿

众所周知,现行财务会计只确认债务资本成本(利息费用),股东的权益资本成本被当作是“免费的午餐”不予核算。在金融市场不发达和企业组织形式为独资和合伙时,债权人被认为是唯一的外来者,重要的是确认和计量债务资本成本,相反,单独确认和计量权益资本成本是没有多大意义的。然而,在企业组织形式为公司制时,无论是债权人还是股东,相对于公司这个独立的人格化主体而言,都是“外来者”。公司通过两个渠道筹集其所需要的资本,无论是哪种资本,公司使用它们都是有代价的,都应作为成本处理。而且,在公司制企业中,股东并不直接参与企业的经营,不了解企业信息的股东可以随时用“脚”投票,出售其原来持有的股票而不再成为公司的股东。因此,从这个角度来讲,他们已经成为企业的“外部人”,股东权益资本成本必须单独计量。

(三)强调物质资本成本,忽略了对人力资本成本的计量

1960年,美国经济学家西奥多・舒尔茨(theodorew.Schultz)在其“向人力资本投资”的演说中正式提出了“人力资本”的概念。他指出,人力资本是相对于物质资本而言的,是指体现于劳动者身上,通过投资形成并能使价值迅速增值的包括健康、体力、经验、知识和能力的存量。西方人力资本理论认为,在经济增长的要素中人力资本的作用大于物质资本的作用。我国著名经济学家肖灼基也认为,人力资本比物质资本具有更大的增值空间,特别是在后工业时期和知识经济初期,人力资本将具有更大的增值潜力。周其仁(1996)在“企业契约性质”的基础上进一步分析,认为“企业是一个人力资本与非人力资本的特别合约”。这里的非人力资本,通常是指除人力资本之外的所有物质资本的总和。人力资本与非人力资本的合作契约关系,是双方长期博弈的结果,体现了一种博弈均衡。

(四)固守陈旧、落后的成本系统

一个有效的成本系统提供的信息应具有以下一些特点:首先,成本信息应具有可靠性,成本信息应能够尽量客观地反映现实,接近实际,管理人员使用该成本信息应能够做出恰当的决策,不会导致错误判断。其次,成本信息应具有相关性,成本信息的提供应与管理者将要做出的决策相关。当决策需使用历史成本时,成本系统应提供历史成本信息;当决策需利用未来现金流量时,成本系统应提供未来的相关成本信息。再次,成本信息必须支持各种类型的管理决策。如,为管理层指出正确的经营方向、产品投资组合与定价、材料(零件)自制/外购、新产品开发、长期投资决策等。此外,有效的成本系统还应有助于企业的激励与控制、学习与反馈等。企业管理人员可以直接或间接地对成本系统进行深入的分析和研究,如果发现成本系统对于一些现象无法解释时,表明企业的成本系统可能无效了。

二、改革现行成本信息系统势在必行

(一)建立以管理职能为基础的成本概念框架

企业的日常管理工作是由一系列相互关联、连续进行的活动构成的,这些活动可被归类为一些基本的管理职能,包括计划与决策、组织与领导、绩效与控制。

1.基于战略职能的成本概念。近年来,随着经济的全球化发展,企业间的竞争日益剧烈,企业要获得竞争优势,就必须重视战略。因此,管理的战略职能已经一跃成为管理的首要职能。把战略管理思想同成本管理结合起来便形成了战略成本管理,战略成本的实质要以企业的战略为核心,与一系列具有源流性质的成本动因相对应。战略成本的内容一般包括时间成本、信息化成本、创新成本、学习成本和市场成本。

2.基于计划与决策职能的成本概念。企业管理人员为了做出各种计划和决策,必须获得足够的信息,其中,成本是一项非常重要的指标。但是,企业管理人员所运用的成本信息并不是简单的成本数据,而是一些经过处理的具有及时性、相关性和精确性的成本信息。于是产生了常见的用于计划和决策职能的成本概念。这些概念主要包括相关成本、差别成本、机会成本和沉没成本。

3.基于绩效与控制职能的成本概念。成本管理的一个重要作用就是为控制企业的日常管理活动和生产经营活动、考核和激励雇员及经理提供信息。用于此项管理职能的重要成本概念是可控成本与不可控成本、标准成本、定额成本和责任成本。

4.基于报告职能的成本概念。企业管理当局需要定期编制各种财务报表,以满足广大外部信息使用者和内部成本管理的信息需求。在这一管理职能中所使用的重要成本概念为生产成本和期间成本。这些成本通常是根据国家统一的财务和会计法规、制度核算出来的,又称为财务成本或制度成本。

5.基于组织与领导职能的成本概念。企业在进行组织设计之后,为确保各项任务的顺利完成并使系统能够正常运行,组织还必须按照设计的要求为系统配置合适的人力资源,并对之进行有效的管理,称为人力资源管理。与人力资源管理职能相对应的成本概念为人力资源成本。广义的人力资源成本包括劳动者被企业雇佣之前为了培养自身的劳动能力所花费的代价和企业在员工的招聘与培训、人力资源开发等方面所花费的代价;狭义的人力资源成本仅指劳动者受雇后的成本,是企业组织为了取得或重置人力资源而发生的成本。

可见,成本信息正扮演着多种角色,为管理的各项职能服务。因此,我们必须改变传统的成本观念,冲破单纯的产品成本概念的束缚,多层次、多方位地理解成本的概念。而且,随着经济的发展,新的管理手段、方法和目标的出现,成本的涵义也必然随之拓展和延伸,成本概念的内容将更加丰富多彩。

(二)将权益资本、人力资本纳入会计核算系统

会计学家安东尼(1973)认为,利息费用不仅包括债务资本成本,而且包括权益资本成本,它应和债务资本一样计量成本并和直接材料、直接人工、制造费用一起计入存货成本和商品销售成本。现行资产负债表的股东权益部分并不代表股东在企业中的权益数额。尽管实收资本项目反映了股东原始资本的投入,但是,留存收益却不代表股东的贡献,盈余是会计主体本身赚取的,而不是股东赚取的。因此,有必要改变以股东为导向的资产负债表右边结构,将原来的股东权益分成股东权益和主体权益两个部分。新的股东权益包括:一是原来资产负债表上列示的实收资本数额;二是权益资本成本(权益利息)部分。新的主体权益与现行财务会计程序下的留存收益也并不是一回事。因为在资本成本会计理论下,净收益应该是各种收入与各种费用(包括权益利息)之间的差额。每个会计期间的净收益应该加到主体权益上去,只不过这个净收益要比现行会计程序计算出来的净收益小一些。

地理信息系统基本概念篇10

【关键词】中医药;文本信息抽取;本体

【abstract】textinformationextractionbecameanovelmechanismforknowledgeminingfromtextsintraditionalChinesemedicine(tCm)domaininrecentyears.weconstructedanontology-basedtextinformationextractionsystemfortCmdomain.itcanextractsemanticrelationsfromtCmtexts,andsupportuserstobrowse,analyze,andannotatetheserelations.thissystemcanfacilitatetCmexpertstoacquireknowledgefromtCmdocuments,andfurtherrefinetCmdomainontologies.

【Keywords】traditionalChinesemedicine;textinformationextraction;ontology

First-author’saddress:informationinstituteoftraditionalChinesemedicine,ChinaacademyofChinesemedicalSciences,Beijing100700,China

doi:10.3969/j.issn.1674-4985.2015.21.040

中医药文献是中医药文化的重要载体之一,记载着历代医家的智慧和经验。如何对浩如烟海的中医药文献进行系统梳理和深度挖掘,是中医药知识管理中的一个重要问题[1-2]。文本信息抽取(textinformationextraction)是指从一段文本中自动抽取特定信息的计算机技术,它能显著提升人类处理海量文献并从中获取知识的效率[3-4]。文本信息抽取的任务包括命名实体识别[5]、语义关系发现[6]、事件抽取[7]、情感分析[8]等。笔者构建了基于本体的文本信息抽取系统,用于辅助中医专家从中医文献中挖掘知识,并进一步完善中医领域本体系统。本文介绍该系统所使用的文本信息抽取方法,以及该系统的主要功能和使用情况。

1文本信息抽取方法

该系统使用一种本体驱动的文本信息抽取方法。本体(ontology)是一种用于表示领域知识的计算机模型,它能帮助计算机更好地理解领域术语并处理文本内容[9]。它定义了一个领域中的语义类型和语义关系,并构建了领域的概念层次结构和语义网络[10]。中医界从本世纪开始在中医药领域中引入了本体技术,对该领域的概念和术语体系进行系统性的表达[11]。其中的代表性系统包括中医药学语言系统和中医古籍语言系统等[12-13]。本体为文本信息抽取提供了领域背景知识,可将领域本体与文法分析技术相结合,从而改进文本信息抽取的效果[9,14]。本系统基于中医药本体,从文献中提取关键性词汇,识别领域概念,进而发现领域实体之间的语义关系。信息提取有2种途径:(1)关系提取,即理解作者在文本中直接提出的显性关系;(2)假设生成,即根据显性关系推理出文本中并未直接提出的隐性关系。该方法包括如下4步。

第一步、提取关键性词汇。文本中仅有部分词汇有助于机器理解文本中蕴含的语义关系,这部分词汇被称为关键性词汇。首先,根据应用需求,从本体中导出关键性词汇,创建领域词库。例如,在药物发现应用中,“药物组成”“感冒”“甘草”“主治”等词汇往往用于表示领域专家关切的医药学关系,而“”等地理名称一般不可能构成有意义的医药学关联。又如,中医古籍文献中的某些关键动词(如“主”)往往对应概念之间的语义关系(如“管理”),因此需要找出这些关键动词,并建立关键动词与语义关系之间的对照表。在建立关键性词汇的词库后,利用一种词库驱动的最大匹配算法,从文献中提取关键性词汇,从而将原始的中文文本转化为词汇序列。

第二步、识别关键性概念。为消除领域知识表达中的歧义性,领域本体中定义了概念和词汇之间的语义关系,包括概念的正名和异名等。机器根据领域本体从词汇序列中识别对应的概念,并判断概念的语义类型。例如,根据本体中定义的异名关系〈甘草,藏名,‘相额尔’〉(即甘草在藏医药学中称为‘相额尔’),将藏医药学文本中出现的词汇‘相额尔’理解为概念甘草;并根据本体中定义的类型关系〈甘草,rdf:type,草药〉,将概念甘草归属于草药这个类。此后,将概念及其类别加入词汇序列中的对应位置,生成文本对应的概念序列。

第三步、抽取语义关系。通过一系列预先定义的语义模板与概念序列进行匹配,若匹配成功则生成对应的陈述。该过程分为3步:(1)基于领域本体生成一个语义模板库,其中的每个语义模板为由领域概念和词汇构成的三元组;(2)根据资源序列中出现的概念在模板库中检索对应的一系列语义模板;(3)将每个模板与资源序列匹配,如果匹配成功,则生成对应的陈述。例如,针对文本“[七十味珍珠丸]的[药物组成]为:……[相额尔]……”,首先提取出其中的3个关键词,并识别对应的概念;其次根据本体中定义的概念类型〈七十味珍珠丸,类型,方剂〉和〈甘草(相额尔),类型,药物〉,获取相应的模板〈方剂,‘药物组成’,药物〉;最后,将模板与资源序列匹配,从而推出陈述:〈七十味珍珠丸,包含,甘草〉。将所获得的陈述融合为一个图,并将其加入索引结构中。

第四步、推导假设性语义关系。根据文本中的语义信息,使用领域规则进一步推导出假设性的语义关系。领域规则形如BodyHead,在Body和Head中均可出现变量。例如,规则R1:〈?x,包含,?y〉〈?y,属于,?x〉表示对于任意x和y,如果x包含y,那么y属于x;根据规则R1和陈述〈七十味珍珠丸,包含,甘草〉,可以推出〈甘草,属于,七十味珍珠丸〉。又如,规则R2:〈?x,包含,?y〉〈?y,具有功效,?z〉〈?x,具有功效,?z〉表示如果某种药物x的成分y具有功效z,则x具有功效z;根据规则R2和〈七十味珍珠丸,包含,当归〉、〈当归,具有功效,补血〉可推出〈七十味珍珠丸,具有功效,补血〉。

下面通过一个关于方剂生化汤的案例来解释上述过程。下面是《中华药典》中描述传统方剂生化汤的组成和功效的部分文本:“……[生化汤]中重用[当归],补血活血,祛瘀生新为[君];[川芎]行血中之气,[桃仁]活血祛瘀为[臣];[黑姜]入血散寒,温里定痛为[佐];[炙甘草]调和诸药为[使]。[功效]为[活血化瘀]……”。首先,根据中医领域本体,从词汇序列中提取对应的概念,并对概念归类。据本体可知,生化汤为方剂的实例,当归、川芎、桃仁、黑姜和炙甘草为中药的实例,活血化瘀为功效的实例。进而,提取文中的语义关系。例如,根据模板〈方剂,药物,‘君’〉,和序列(生化汤,当归,‘君’),推出:〈生化汤,君,当归〉。最后,根据已知的语义关系生成假设。例如,根据陈述〈生化汤,具有功效,活血化瘀〉和规则〈?x,具有功效,活血化瘀〉〈?x,治疗,血瘀证〉,推出假设:〈生化汤,治疗,血瘀证〉。提取出的语义信息构成了如图1所示的语义图。

2文本信息抽取系统

笔者采用上面的方法,构建了中医文本信息抽取系统。该系统基于本体对中医文献进行处理,自动识别其中出现的中医概念,生成文本内容的索引。该系统还能从文本中自动发现语义关系,再将所发现的语义关系交由领域专家进行检验。笔者以综合性医学著作《医学纲目》等中医古籍作为试验文本对该系统进行了测试。该系统基于“中医古籍语言系统”对中医古籍进行处理,从中提取出中医药领域概念及其语义关系,取得了良好的效果。

该系统还实现了文本语义关系管理与检阅的功能,对从文本中发现的语义关系进行集中管理,支持用户查看语义关系在中医文本中的用法,并完成语义关系的检阅、分析和标注工作。如图2所示,该系统以网页的形式展示《医学纲目》古籍全文,以不同的颜色标出文本中出现的中医名词和谓词。该系统在左侧建立书籍目录导航,在页面主体部分显示全文,自动识别文中出现的中医概念并在文本右侧列出,用户可点击查看概念定义。该系统还找出文中出现的谓词,据此识别文中出现的语义关系。用户也可以点击查看原文中蕴含的语义关系。该系统还实现了中医本体加工辅助工具,将文本语义关系正式插入某个本体系统,为中医本体的修订和完善提供可行的技术路径。

3小结

中医药文献是中医药知识共享的主要手段。近年来,随着文字识别等信息技术的广泛应用,大量的中医药文献被转换为数字文件、数据库等数字资源[15]。中医药文献的数字化,为将文本信息抽取等各种文献处理技术应用于中医药领域奠定了基础。本文介绍了中医文本信息抽取系统,它能从中医文献中提取领域实体及语义关系,并支持用户完成文本语义关系的检阅、分析和标注工作。这套系统能辅助中医专家开展文献知识挖掘工作,为梳理中医药知识体系,实现中医文献和知识的共享和重用提供技术支持。

参考文献

[1]刘毅.中医古籍数字化与知识挖掘[J].图书馆工作与研究,2010,14(12):92-94.

[2]周雪忠,崔蒙,吴朝晖,等.基于文本挖掘的中医学文献主题自动标引[J].中国中医药信息杂志,2003,10(1):71-74.

[3]顾铮,顾平.信息抽取技术在中医研究中的应用[J].医学信息,2007,20(1):27-30.

[4]杨博,蔡东风,杨华,等.开放式信息抽取研究进展[J].中文信息学报,2014,28(4):1-11,36.

[5]赵军.命名实体识别、排歧和跨语言关联[J].中文信息学报,2009,23(2):3-17.

[6]陶金火,陈华钧,胡雪琴,等.中医药文献语义关系图发现[J].计算机科学,2011,38(3):213-217,251.

[7]吴家皋,周凡坤,张雪英,等.Hmm模型和句法分析相结合的事件属性信息抽取[J].南京师大学报(自然科学版),2014,14(1):30-34.

[8]赵妍妍,秦兵,刘挺,等.文本情感分析[J].软件学报,2010,21(8):1834-1848.

[9]丁晟春,刘逶迤,熊霞,等.基于领域本体和语块分析的信息抽取的研究与实现[J].情报学报,2010,29(1):53-58.

[10]GrubertR.ontology.entryintheencyclopediaofDatabaseSystems,LingLiuandm[m].tamer?zsu(eds.),Springer-Verlag,2008.

[11]于彤,崔蒙,李敬华,等.中医药本体工程研究现状[J].中国中医药信息杂志,2013,20(7):110-112.

[12]贾李蓉,杨硕,董燕,等.中医药学语言系统评价体系的研究与建立[J].中国数字医学,2012,7(10):13-16.

[13]朱玲,尹爱宁,崔蒙,等.中医古籍语言系统构建的关键问题与对策[J].中国中医药信息杂志,2010,17(4):98-99.

[14]方纯洁,王波,罗杰,等.基于信息抽取的中医药文献知识发现[J].浙江中医药大学学报,2012,36(1):88-90,96.