本体论(信息科学)

信息科学中,一个本体涵盖了类别,属性的代表,正式命名和定义,以及与一个,许多或所有域的概念,数据或实体之间的关系。更简单地说,一个本体是通过定义代表该主题领域实体的一组术语和关系表达式来显示主题领域的属性及其相关性的一种方式。研究如此构想的本体论的领域有时称为应用本体论

每个学术学科或领域,创建其术语,从而为本体论奠定了基础。每个人都使用本体论假设来构建明确的理论,研究和应用。改善的本体论可以改善该领域内的解决问题,数据系统的互操作性以及数据的可发现性。当来自不同国家 /地区的专家保持每种语言之间的行话词汇量时,在每个领域中翻译研究论文是一个更容易的问题。例如,经济学的定义和本体论马克思主义经济学的主要关注点,也是其他经济学子领域。依靠信息科学的经济学的一个例子发生在模拟或模型旨在实现经济决策的情况下,例如确定哪些资本资产处于风险的风险和数量(请参阅风险管理)。

信息科学哲学中的本体论既有共同点是根据一个类别制度来代表包括对象和事件在内的实体,以及其所有相互依存的属性和关系。在这两个领域中,关于本体论工程问题(例如,哲学中的Quine and Kripke和Kripke在信息科学中的Quine and Kripke和Kripke )以及有关信息科学中的辩论是可能在多大程度上可能的(例如,哲学中的基础主义连贯主义,BFO, BFO ,BFO)的辩论。和人工智能中的CYC )。

某些人认为应用本体论是哲学先前工作的继任者。但是,许多当前的努力更关心建立狭窄领域的受控词汇,而不是哲学上的第一原理,或诸如固定本质的存在方式之类的问题,或者是否持久对象(例如, perdurantism and enturantism )在本体学上是否比本体学更重要。 。人工智能机器翻译知识表示中的自然语言处理等子字段中对应用的本体论保持着非常关注,但是经常在包括生物医学信息学,行业的一系列领域中使用本体编辑。这样的努力经常使用诸如Protégé之类的本体编辑工具。

哲学本体论

本体论是哲学的一个分支,与形而上学,认识论和语言哲学等领域相交,因为它认为知识,语言和感知与现实本质如何相关。形而上学处理诸如“存在什么?”之类的问题。和“现实的本质是什么?”。形而上学是五个传统的哲学分支之一,关注通过属性,实体和关系(例如细节普遍性内在和外在属性本质生存)探索存在。自记录的历史记录以来,形而上学一直是讨论的持续讨论。

词源

复合词本体结合希腊语ὄν, ongen。ὄντος安大略省),即“存在;那是”,这动词εἰμί, eimí ,ie ie,即我是,我是,我是” “和-λογία, -logia ,即“逻辑话语”,请参阅此类单词形成的经典化合物

尽管词源是希腊语,这是该词本身的最古老的现存记录,但新拉丁语形式的本科生在1606年出现在雅各布·洛尔哈德( Jacob Lorhard )的《 ogdoas scholastica》中,在1613年,在1613年,在RudolfGöckelgoclenius )的Lexicon Phicsiveon phocientophicum中。

OED牛津英语词典,在线版,2008年)记录的英语本体论的第一次出现在Archeologia Philodica NovaGideon Harvey新哲学原理中。

正式本体论

自1970年代中期以来,人工智能领域(AI)的研究人员已经认识到,知识工程是构建大型和强大的AI系统的关键。 AI研究人员认为,他们可以创建新的本体论作为计算模型,从而使某些类型的自动推理能够略有成功。在1980年代,AI社区开始使用本体论一词来指代建模世界的理论,也是基于知识的系统的组成部分。尤其是,戴维·鲍尔斯(David Powers)在1990年的文献评论中向AI介绍了AI一词以参考现实世界或机器人基础,该文献评论强调了基于基础的本体论,这与呼吁论文征求了AAAI夏季夏季研讨会的自然语言和本体学,并与扩展的版本发表在Sigart公告中,并作为程序的序言包括在内。一些研究人员从哲学本体论中汲取灵感,将计算本体论视为一种应用哲学。

在1993年,汤姆·格鲁伯(Tom Gruber)被广泛引用的网页和纸张“针对用于知识共享的本体设计原理”,将本体用作计算机科学的技术术语,与早期的语义网络分类学观念密切相关。格鲁伯(Gruber)介绍了术语作为概念化的规范

本体论是对代理商或代理商社区正式存在的概念和关系的描述(例如计划的正式规范)。该定义与本体论作为一组概念定义的使用是一致的,但更笼统。这与在哲学中的使用是一种不同的意义。

格鲁伯(Gruber)表示,试图将本体论与分类学和知识模型中的类似努力距离距离阶级继承的类似努力,格鲁伯(Gruber)说(1993):

本体论通常等同于班级,阶级定义和综合关系的分类学层次结构,但是本体不必限于这些形式。本体论也不限于保守的定义,即,在传统逻辑意义上的定义仅引入术语,并且不添加有关世界的任何知识。为了指定概念化,需要陈述确实限制定义术语可能解释的公理

正如Gruber定义Feilmayr和Wöß(2016)的改进所说:“本体论是对共同概念化的正式,明确的规范,其特征是增加复杂性所需的高语义表达性。”

正式的本体论组成部分

当代本体论具有许多结构相似性,无论其表达方式如何。大多数本体论描述了个人(实例),类(概念),属性和关系。

类型

领域本体论

领域本体论(或特定领域的本体论)代表属于世界领域的概念,例如生物学或政治。每个领域的本体论通常都会对术语的特定于域特定定义进行建模。例如,单词具有许多不同的含义。关于扑克域的本体论将对单词的“扑克卡”含义建模,而有关计算机硬件域的本体论将建模“打孔卡”和“视频卡”含义。

由于领域本体论是由不同的人撰写的,因此它们以非常具体和独特的方式代表概念,并且在同一项目中通常不兼容。随着依靠领域本体论扩展的系统,他们通常需要通过手动调整每个实体或使用软件合并和手动调整来合并域本体。这给本体设计师带来了挑战。同一领域中的不同本体论是由于不同的语言,对本体论的不同意图使用以及对领域的不同看法(基于文化背景,教育,意识形态等)。

目前,合并并非从公共上部本体论发展的本体论是一个在很大程度上的手动过程,因此耗时且昂贵。使用相同的上本体论来提供一组基本要素来指定域本体论实体的含义的域本体论可以以更少的精力合并。有关于合并本体论的广义技术的研究,但是这一研究仍在进行中,最近的事件是通过使用相同的上层本体论等相同的本体论,例如OBO Foundry,是通过具有多个领域的本体论来避免了这个问题。

上本体论

上本体(或基金会本体论)是通常在广泛领域本体论中适用的通常共享关系和对象的模型。它通常采用核心词汇表,该核心表列为各种相关领域本体中使用的术语和相关对象描述。

可供使用的标准化上本体论包括BFOBoro方法都柏林核心GFOCYCSUMOUMBELDOLCEWordNet被某些人认为是上层本体,并被用作学习领域的语言工具。

混合本体论

Gellish本体论是上层和领域本体论组合的一个例子。

可视化

Katifori等人对本体可视化方法进行了调查。 Dudás等人发布了对本体可视化方法和工具的最新调查。 Fu等人评估了最成熟的本体可视化方法,即缩进的树和图形可视化。 OWL本体(VOWL)的视觉符号指定了猫头鹰中代表的本体的视觉语言。

工程

本体工程(也称为本体构建)是与特定领域的本体学发展有关的一组任务。它是知识工程的一个子领域,研究本体发展过程,本体论生命周期,建立本体论的方法和方法以及支持它们的工具和语言。

本体工程旨在明确软件应用程序中包含的知识以及特定领域的组织程序。本体工程为克服语义障碍提供了一个方向,例如与业务条款和软件类别的定义相关的障碍。本体论工程的已知挑战包括:

  1. 确保本体学是当前具有域知识和期限使用的当前
  2. 为感兴趣的领域提供足够的特异性和概念覆盖范围,从而最大程度地减少内容完整性问题
  3. 确保本体学可以支持其用例

编辑

本体论编辑是旨在帮助创建或操纵本体论的应用程序。本体论编辑使用一种或多种本体论语言是常见的。

本体论编辑器的各个方面包括:知识模型推理引擎信息提取中的视觉导航可能性;支持模块;外国知识表示语言的进口和导出以匹配本体;以及诸如owl-s都柏林核心等元主教的支持。

学习

本体学习是自动或半自动创建本体,包括从自然语言文本中提取域的术语。由于手动构建本体论非常耗费劳动力且耗时,因此有很大的动力来自动化这一过程。已经探索了信息提取和文本挖掘,以自动将本体论与文档联系起来,例如在生物挑战的背景下。

研究

认识论假设在研究中询问“您知道什么?或“您怎么知道?”)创建基金会研究人员在接近某个主题或领域进行潜在研究时使用的。因为认识论与知识直接相关,以及我们如何来关于接受某些真理,进行学术研究的个人必须了解什么使他们能够开始理论建立理论。简单地说,认识论的假设迫使研究人员质疑他们如何获得他们所拥有的知识。

语言

本体语言是一种用于编码本体论的正式语言。本体论和基于标准的本体有许多这样的语言:

  • 常见代数规范语言是在IFIP工作组1.3“系统规格的基础”中开发的一种一般逻辑规范语言,是软件规格的事实上的标准语言。现在,它被应用于本体规范,以提供模块化和结构机制。
  • 常见的逻辑是ISO标准24707,这是一个可以准确翻译成彼此的本体语言家族的规范。
  • CYC项目具有其自己的本体论语言,称为Cycl ,基于一阶谓词微积分,并具有一些高阶扩展。
  • 教条(开发的本体基础方法和应用)采用了面向事实的建模方法,以提供更高水平的语义稳定性。
  • Gellish语言包括其自身扩展的规则,因此将本体论与本体语言集成在一起。
  • IDEF5是一种软件工程方法,可开发和维护可用,准确的领域本体。
  • KIF是基于S-表达一阶逻辑的语法。 Suo-kif是一个衍生版本,支持建议的上部合并本体
  • MOFUMLOMG的标准
  • Olog是一种本体论的类别理论方法,强调使用函子的本体论之间的翻译。
  • OBO ,一种用于生物学和生物医学本体论的语言。
  • Ontouml是UML的本体学性概况,用于域本体的概念建模。
  • OWL是一种用于制作本体论声明的语言,是从RDFRDFS的后续发展,以及早期的本体语言项目,包括石油DamlDaml+石油。 OWL旨在在万维网上使用,其所有元素(类,属性和个人)均定义为RDF资源,并由URIS确定。
  • 规则互换格式(RIF)和F-Logic结合了本体和规则。
  • 语义应用设计语言(SADL)使用通过Eclipse插件输入的类似英语的语言捕获了OWL表现力的子集。
  • SBVR (商业词汇和规则的语义)是行业中采用的OMG标准,用于构建本体。
  • TOVE项目,多伦多虚拟企业项目

已发表的例子

  • 阿拉伯语本体论,是阿拉伯语的语言本体论,可以用作阿拉伯语Wordnet,但具有本体学清洁的内容。
  • AURUM-信息安全本体论,一个用于信息安全知识共享的本体,使用户能够协作理解和扩展域知识体。它可以作为自动信息安全风险和合规管理的基础。
  • Babelnet是一个非常大的多语言语义网络和本体,以多种语言化
  • 基本正式本体论,旨在支持科学研究的正式上部本体论
  • Biopax,一种用于生物途径(细胞过程)数据的交换和互操作性的本体
  • BMO,一种基于企业本体论和商业模式文献的评论的电子商务模型本体论
  • SSBMO是一种基于对系统的自然和社会科学文献(包括商业)的评论,这是一个非常可持续的商业模型本体。包括对业务模型本体论(BMO)的批评和重大扩展。
  • CCO和GEXKB,应用程序本体(APO),将各种类型的知识与细胞周期本体(CCO)和基因表达知识基础(GEXKB)相结合
  • CCOntology(客户投诉本体论),一个电子企业本体,用于支持在线客户投诉管理
  • CIDOC概念参考模型文化遗产的本体论
  • Cosmo,一个基础本体(猫头鹰的当前版本),旨在包含逻辑上指定任何域实体含义所需的所有原始概念的表示。它旨在用作一个基本本体,可用于在其他本体或数据库中的表示之间翻译。它最初是作为opencyc和Sumo本体论的基本要素的合并,并已补充了其他本体论元素(类型,关系),以包括朗曼词典所有单词的表示。
  • 计算机科学本体论,这是一个自动生成的计算机科学领域研究主题的本体论
  • CYC ,一个大型基础本体,用于正式代表话语宇宙
  • 疾病本体论,旨在促进疾病和相关条件与特定医疗法规的映射
  • Dolce ,语言和认知工程的描述性本体论
  • Drammar,戏剧本体论
  • 都柏林核心,一个简单的文档和出版本体论
  • 金融行业业务本体论(FIBO),金融业的商业概念本体论
  • 基础,核心和语言本体论
  • 解剖学的基础模型,人类解剖学本体
  • 朋友的朋友,描述人,活动以及与他人和对象的关系的本体
  • 基因组学基因组学
  • Gellish English Dictionary ,一个本体论,其中包括词典和分类学,其中包括上述本体论和较低的本体论,该本体专注于工程,技术和采购方面的工业和业务应用。
  • 地缘政治本体论,一个本体论,描述食品和农业组织(FAO)创建的地缘政治信息。地缘政治本体论包括多种语言(英语,法语,西班牙语,中文,俄语和意大利语)的名字;地图标准编码系统(联合国,ISO,FAOSTAT,AGROVOC等);提供领土之间的关系(土地边界,团体成员等);并跟踪历史变化。此外,FAO还提供了地缘政治本体论和模块制造商的Web服务,以将地缘政治本体的模块下载到不同的格式(RDF,XML和Excel)中。在FAO Country Profiles中查看更多信息。
  • GAO(通用汽车本体论) - 汽车行业的本体论,包括“汽车”扩展
  • 黄金,语言描述的一般本体论
  • 口香糖(广义上层模型),这是一个以语言动机的本体,用于调解客户系统和自然语言技术
  • Ideas Group是澳大利亚,加拿大,英国和美国国防部开发的企业建筑的正式本体。
  • Linkbase是生物医学领域的形式代表,建立在基本形式本体论的基础上。
  • LPL,具有里程碑意义的图案语言
  • NCBO生物规则,生物学和生物医学本体和相关的工具搜索,浏览和可视化
  • 神经科学信息框架NIFSTD本体学:神经科学领域的一组本体。
  • OBO-EDIT,大多数开放生物学和生物医学本体的本体浏览器
  • Obo Foundry ,一套可互操作的参考本体论和生物医学的参考本体论
  • 综合本体论,学习,教学和教学设计的本体论
  • 生物医学研究的本体论,一种开放式,综合的生物学和临床研究本体。
  • ONSTR,新生儿筛查后续研究和翻译研究的本体,新生儿筛选后续数据集成协作,亚特兰大埃默里大学。
  • 植物结构和生长/开发阶段的植物本体,等等。
  • 教皇,普渡大学制药工程本体
  • Pro,乔治敦大学蛋白质信息资源的蛋白质本体论
  • Probonto概率分布的知识库和本体论。
  • 程序抽象分类学
  • 蛋白质组学的蛋白质本体学
  • RXNO本体论,用于化学的名称反应
  • SCDO,镰状细胞疾病本体论,促进了SDC社区内的数据共享和协作以及其他应用程序(请参阅SCDO网站上的列表)。
  • 序列本体论,用于表示生物序列上的基因组特征类型
  • Snomed CT (系统化的医学术语 - 临床术语)
  • 建议的上部合并本体论,正式的上本体论
  • 系统生物学本体论(SBO),用于生物学计算模型
  • 地球和环境术语的甜蜜​​语义网
  • SSN/SOSA,语义传感器网络本体论(SSN)和传感器,观察,样本和执行器本体(SOSA)是W3C建议和OGC标准,用于描述传感器及其观察结果。
  • ThoughtTreasure本体论
  • 时间项目,索引医学教育的主题
  • Uberon ,代表动物解剖结构
  • Umbel ,一种轻巧的参考结构,是20,000个主题概念类别及其从Opencyc得出的关系
  • WordNet ,词汇参考系统
  • Yamato,另一个更高级的顶级本体论

链接开放数据社区项目协调的W3C试图将不同的本体论融合到全球语义网络中。

本体论的发展导致了提供服务列表或目录的服务的出现,称为本体学库。

以下是人类选择的本体论的库。

  • Colore是一个共同逻辑中的一阶本体论的开放存储库,并在存储库中的本体学之间形成正式联系。
  • Daml本体论图书馆在Daml中保持了本体论的遗产。
  • 本体设计模式门户网站是一个可重复使用的组件和本体设计实践的Wiki存储库,并且还保留了示例性的本体列表。
  • Protégé本体库包含一组猫头鹰,基于框架和其他格式的本体。
  • Schemaweb是在RDF,OWL和DAML+OIL中表达的RDF模式的目录。

以下是目录和搜索引擎。

  • OBO Foundry是生物学和生物医学中的可互操作参考本体的套件。
  • Bioportal(NCBO的本体论库)
  • OntoSelect本体库为RDF/S,DAML和OWL本体提供了类似的服务。
  • 安大略省是一个“语义网络数据的可搜索且可浏览的目录”,重点是具有猫头鹰本体的RDF词汇。 (自2004年以来,NB项目“搁置”)。
  • Swoogle是网络上所有可用的RDF资源(包括本体)的目录和搜索引擎。
  • 开放本体存储库计划
  • Romulus是一个旨在改善语义互操作性的基础本体论库。目前,存储库中有三个基础本体论: DolceBFOGFO

申请的示例

通常,本体可以在几个领域中有益地使用。

  • 企业应用程序。一个更具体的例子是蓝宝石(卫生保健)情境意识以及对公共卫生事件和推理引擎的准备,这是一种基于语义健康信息系统,能够跟踪和评估可能影响公共卫生的情况和情况。
  • 地理信息系统将来自不同来源的数据汇总在一起,因此受益于本体论元数据,这有助于连接数据的语义。
  • 在生物医学研究中,特定领域特异性的本体非常重要,这需要对各种生物医学术语和缩写的指定实体歧义,这些术语和缩写具有相同的字符,但代表了不同的生物医学概念。例如,CSF可以代表刺激因子或脑脊髓液,两者在生物医学文献中以同一项为CSF表示。这就是为什么大量公共本体论与生命科学有关的原因。生命科学数据科学工具无法实施这些类型的生物医学本体论,将无法准确确定概念之间的因果关系。

也可以看看

相关的哲学概念