我要投搞

标签云

收藏小站

爱尚经典语录、名言、句子、散文、日志、唯美图片

当前位置:双彩网 > 知识库 >

国内外知识库研究现状述评与比较

归档日期:06-28       文本归类:知识库      文章编辑:爱尚语录

  从上述对机构知识库和基于WIKI系统知识库的研究,可以看出现有的机构知识库(IR)中知识库的管理是一种强调的“中心化”策略的管理,即机构知识库的组织者负责构建该知识库、建立知识描述的规则,并搜集、组织、存储和发布各类知识,提供使用这些知识的工具和手段。1)目前国内外研究的关注点基本相同,主要集中在知识库构建的必要性、理论基础、基本结构,知识库构建的原则、模型设计,知识库中的知识抽取、知识标引、知识表示、知识组织、知识检索、知识发现以及知识库整合,知识库构建的技术、工具等以及知识库构建的具体实践这些方面。4.3国内外研究成果对构建档案知识库的启示通过对国内外关于知识库研究的梳理和比较分析,为促进知识库在档案领域的实践,档案工作者还需在以下三个方面不断加强:一是加强对档案知识库的基础理论研究,如理论基础、档案知识库的内涵、性质。

  关键词:档案知识库;机构知识库;知识库构建;检索;语义;知识库研究;知识库中的;应用;仓库;知识库系统

  英文文献获取时,“知识库”对应的英文术语存在Knowledge Base、Knowledge Bank、Institutional Repository、Knowledge Repository四种不同形式。通过对上述知识库的几种形式分别在不同的英文论文数据库中进行篇名精确检索,检索出大量与本选题有关的论文,具体检索结果如表2。从表2中还可以看出国外研究档案知识库的文献也比较少。

  国外对知识库的研究最早是在研究专家决策系统基础上进行的,随着人工智能技术的成熟和发展,对于知识库的研究也不断成熟。关于知识库的概念认识、框架和结构、知识库中运用的技术和方法以及知识库在不同领域的应用均有较为深入的研究。

  (1)知识库使用的必要性研究。澳大利亚学者Dong-Tsan Lee等[47]论述了在科学知识方面逐渐呈现出构建大规模知识库的发展趋势。在这样的知识库中,重要的不是使所有的知识之间都有密切的相互关系,而是要能够确定与当前问题有关的知识。Richard C.Hicks[48]针对已有的一些智能支持系统等并不能提供足够的验证测试问题,提出了知识库管理系统为业务规则和专家系统的发展和验证提供了一个完整的生命周期环境。通过对知识库管理系统生命周期和框架结构的深入研究,并在此基础上,通过知识库管理系统构建或建立了一个专家系统,强调每一个阶段的验证测试。知识库管理系统这一工具的可用性对知识库系统的可访问性大大扩展,使其有更加广泛的用户,也将促进知识库系统得到更好的发展。

  (2)关于知识库基本结构和基本理论的研究。Grigoris Antoniou[49]研究了知识库的结构,应该包含规则库R(是一系列有限的规则)、缺省的规则库D(包含多个默认缺省)和声明集(A declaration set)DêC,它主要包含目标文字的设置G、输入文字的设置Z和一些限制的设置C。Eric C.Okafor and Charles C.Osuagwu[50]则将知识库的知识使用框架结构描述如图1所示。

  Andreja Andric等[51]探讨了知识库知识存储和输出格式,针对知识库对知识反馈要求较大的内存消耗问题,将整个知识库转化成一系列HTML文本,使内存达到可接受的程度,正如万维网(可接受来自世界各个地方的同时访问以及对同一问题的多次访问,万维网(WWW)的这一工作机制可以被运用于知识库中。N.A.Lorentzos等[52]认为任何专门领域的知识都和时间有一定关系,据此,可将知识分为两类:与时间无关的和与时间有关的。为了维持基于规则的知识库内容更新,三种方法被提出并评估。它们的共同之处在于知识被存储在数据库中,因此,当其被知识库所接纳时,数据库的所有优点也同时被继承。Adah S.等[53]等提出当合并多个知识库时,这些知识库可能包含不一致、不确定性和否定的非单调模式统一,研究发现,对注释逻辑进行适当修正,可用于不同知识库间的协调。与此同时,还对不同知识库合并的算法、数据结构和查询处理进行了研究。加拿大学者James P.Delgrande和德国学者Torsten Schaub阐述了基于一致性的知识库整合研究[54]。作者提出一个框架来表达各种合并操作符的信念集,其中有两个基本的合并操作符方法。第一种方法中,可信的来源被统一组合起来,以确保知识库合并后的结果是一个最大化的、一致的公式的组合,并且包含知识库中的知识节点;第二种方法类似于一个普遍的信念修正算法。不同的知识库被连接在一起,并且这种方法是独立于语义的。D.Xue,S.Yadav等[55]在产品生命周期特征模型、产品实现过程模型、数据关系维护模型和最优并行设计模型四种数学模型基础上,设计出了一种知识库和数据库智能并行系统。该系统引用特征概念,对产品生命周期的各方面进行描述,旨在开发一个基于计算机的并行设计环境,在保持产品生命周期各方面一致性的基础上,支持产品生命周期内的所有活动,从而为下一代的CAD/CAM系统的并行设计能力提供理论指导和实施的框架。Thomas Eiter等[56]则通过基于复杂性和规则条件下的条件知识库研究,填补了条件知识库中缺省推理下复杂性的清晰图谱。Grigoris Antoniou[57]探讨了非单调知识库(Nonmonotonic knowledge bases)中的一些异常,诸如冗余、矛盾和知识缺乏。他认为非单调性知识库在一些特定领域的应用将会不断增加,但是非单调性知识库中的检验和确认还没有引起足够的关注和重视,认为可以通过运用一些传统的验证方法来检测非单调性知识库中的一些异常(anomalies)。美国学者Eugene Santos Jr.等[58]探讨了贝叶斯知识库(Bayesian Knowledge Bases),提出了一个框架,可以克服时间约束下的不确定性。该框架的构建是将时间约束同不受时间影响的贝叶斯知识库有效融合在一起,时间约束贝叶斯知识库推理和融合算法在贝叶斯知识库中得到拓展,可在表示时间可变性和不确定性的过程中保持其语义不发生变化。同时,还讨论了该框架的一些特性和介绍了相应的算法来确保该模型建设中的确定性。

  (3)关于知识库技术和工具实现的研究。印度学者Keshav Dev等[59]探讨了遗传算法在知识库分割中的作用,在知识库几个分区中进行产生规则分配可以缩短专家系统应用程序的编制和执行时间,并促进它们的验证、确认和维护。针对知识库在整合中出现的NP完全问题,首先提出了一种遗传算法用于解决知识库的分割,然后与处理同一问题的一个启发式聚类算法比较其性能。研究结果清楚地表明,遗传算法要远比聚类算法更优。Eric C.Okafor等[60]评估了目前最成功的知识表示方法和技术的效能和水平。在专家系统知识库构建中,知识表示(Knowledge representation)在专家系统开发中是最为重要和最为关键的一环,文章列举了现有的一些知识表示技术,产生规则、语义网络、框架、逻辑,并对各种知识表示方法的优缺点进行了描述。由于单一的知识表示方法在知识表示系统(KMS)中都有其优缺点,为了获得更大的效率和进行更好的知识表示,两种或两种以上的知识表示组合方法在知识库构建时是必需的。J.Kingston[61]阐述了高性能知识库中知识获取与呈现的四种方法,即可通过AIAIs、TFS/Cycorps、ISIs和GMUs共四种方法来解决知识库中的知识获取、表示、推理和呈现。通过运用上述四种方法和最新人工智能技术的发展成果,大型知识库能够被快速有效的建立起来,用于解决各类实际问题。Philipp Cimiano[62]等探讨了ORAKEL系统的知识库便携式自然语言接口,描述了其构成结构、设计选择及执行。同时还展示了ORAKEL的适应性模型,该模型允许用户在不熟悉自然语言处理(natural language processing)和形式语言学(formal linguistics)方法的基础上通过一个便携式的自然语言界面便捷地访问知识库。David Lubliner等[63]论述了知识库集成领域知识的功能作用。通过知识库设计图,描述了作为工具设计基础的知识整合理论模型,并提出可通过定性和定量的评价手段对知识库设计地图的有效性进行评估。文章同时还对语义网等相关知识库中的技术和方法进行了论述。Olivier Roussel等[64]阐述了基于循环检索的知识库所取得的成效。作者提出可通过一种新的循环搜索来实现检索/搜索的编译方法,该方法可以使我们精确识别那些之前连接不完整的知识或者我们已经完成的知识。这样做的结果是我们不必去关注单一关联,也可以尽量避免数量较多的无用计算。因此,借助于这个系统可以产生一个图形化的解释,有助于为编辑者发现更多的增值信息或知识。Michel R.Klein[65]论述了SIMAR的设计与实施框架。SIMAR是一种对知识库的管理策略进行定义和测试的应用程序,该应用程序在规则形式下允许策略性知识标准化。Udo Hahn,Martin Romacker[66]论述了SYND I KATE系统的内容管理:即如何实现将技术文本直接转化成文本知识库。S YND I KATE是自然语言理解系统中一个能自动从现实世界文本(例如,信息技术测试报告,医疗调查报告)中获取知识并转移这些内容到正式的框架结构中,从而构成一个组合的文本知识库。文章提出了一个通用的系统架构,集成了从单句的分析到引用链接的句子形式组合文本知识库的要求。Werner Winiwarter[67]介绍了用于访问FAQ知识库的自然语言界面结构,作为FAQ知识库检索入口。采用可扩展的语义枚举数(eXtended Semantic Enumeration,XSE)的机器学习模块在遍历树中从语义、语法以及务实分析来激活语言测试,实现使用者使用自己所用的自然语言就能轻松地获得他所要的请求。基于FAQ技术,目前国外已开发出应用价值较高的FAQ信息服务系统,如FAQshare、FAQFinder、AskJeeves、Answer BUS等,FAQ已经成为国外英文网络中一项重要的资源服务方式。

  (4)知识库对决策的影响研究。美国学者Kurt D.Bollacker等[68]论述了一种超分类器的分类器知识库构建方法。超分类器尽可能使用较少的训练样本,支持大量离散的样本数据,通过增加相关支持分类器的数量来添加知识,并且经由一个分类向量的输入值进行分类决策。他们认为,在理论上,随着更多的分类器进行重用,使用汉明最近邻分类器可以将预测真正目标分类的概率确定在一个指数比率上。Shuliang Li等[69]通过调查多代理的混合智能系统在国际市场计划中的支持作用,将多项代理、仿真、知识库和模糊逻辑进行整合来实现这一多代理混合智能系统的智能性,为国际市场营销决策提供参考依据,并通过评估研究证实了其在营销决策上的积极作用。Aviv Segev等[70]就知识库在医学诊断帮助中的作用进行了论述,临床决定或决策的做出是一个基于经验、判断和推理的复杂过程,通过整合病人过去就诊历史和现在的症状等做出诊断和作出治疗决策,才会更加科学。南非学者Herna L Viktor等[71]认为发达国家的管理面临的主要挑战是提高知识服务工作者的表现,而在南非这样的发展中国家,对政府而言一个发达的商业部门则更加重要。他们研究了以知识为基础的南非国家研究与技术(NRT)审计知识库的建设。该知识库使用归纳学习团队合作(CILT)的方法,通过数据挖掘工具从知识库中获得新的见解,为决策和政策制定提供知识库智能参考作用。

本文链接:http://almaqtari.net/zhishiku/40.html