解析树
解析树或解析树或衍生树或混凝土语法树是一种有序的,根生的树,根据某些无上下文的语法表示字符串的句法结构。术语解析树本身主要用于计算语言学;在理论语法中,术语语法树更为常见。
混凝土语法树反映了输入语言的语法,使它们与计算机编程中使用的抽象语法树不同。与用于教授语法的Reed-Kellogg句子图不同,解析树不对不同类型的成分使用不同的符号形状。
分析树通常是基于选区语法(短语结构语法)或依赖语法的依赖关系的组成关系的构建。可以为天然语言(请参阅自然语言处理)以及在处理计算机语言(例如编程语言)的句子生成解析树。
一个相关的概念是在转化生成语法中使用的短语标记或p-marker的概念。短语标记是一种语言表达式,标记为其短语结构。这可以以树的形式或作为括号表达式表示。短语标记是通过应用短语结构规则生成的,并且其本身受到进一步的变革规则的约束。一组句法上可能的解析树被称为“解析森林”。
命名法
解析树由节点和分支组成。在图片中,解析树是整个结构,从S开始,在每个叶子节点(John,Ball,The,hit)中结束。在解析树中,每个节点是根节点,分支节点或叶节点。在上面的示例中,S是根节点,NP和VP是分支节点,而John,Ball,The the the the Als as as as as as as Ball是叶子节点。
节点也可以称为父节点和子节点。父节点是一个至少一个由该分支下方链接的其他节点。在示例中,S是NP和VP的父母。子节点是一个至少一个直接与树的节点与树的分支链接的节点。同样,从我们的示例中,HIT是V的儿童节点。
非末端函数是一个函数(节点),该函数是该树中的根或分支,而终端函数是叶子树中的函数(节点)。
对于二进制树(每个父节点都有两个直接的子节点),加泰罗尼亚州数字给出了带有n个单词的句子的可能解析树的数量。
基于选区的解析树
基于选区的组成语法(短语结构语法)的解析树区分了末端和非末端节点。内部节点由语法的非末端类别标记,而叶子节点则由末端类别标记。下图代表基于选区的解析树;它显示了英语句子的句法结构约翰击球:
解析树是整个结构,从S开始,在每个叶子节点( John , Hit , The , Ball )中结束。在树上使用以下缩写:
- s句子,此示例中的顶级结构
- n为名词
树上的每个节点都是根节点,分支节点或叶节点。根节点是一个节点,其顶部没有任何分支。在一个句子中,只有一个根节点。分支节点是连接到两个或多个子节点的父节点。但是,叶节点是一个终端节点,不主导树上的其他节点。 S是根节点,NP和VP是分支节点, John (n), hit (v), ( d)和球(n)都是叶子节点。叶子是句子的词汇令牌。父节点是一个至少一个由该分支下方链接的其他节点。在示例中,S是N和VP的父母。子节点是一个至少一个直接与树的节点与树的分支链接的节点。从示例中, HIT是V的子节点。
基于依赖关系的解析树
依赖性语法的基于依赖关系的解析树将所有节点视为终端,这意味着它们不承认终端类别和非末端类别之间的区别。它们平均比基于选区的解析树更简单,因为它们包含较少的节点。上面示例句子的基于依赖关系的解析树如下:
该解析树缺少上面基于选区的对应物中的副类别(S,VP和NP)。像基于选区的树一样,也确认了组成结构。树的任何完整子树都是组成部分。因此,这种基于依赖关系的解析树承认主题名词John和对象名词短语,就像基于选区的parse树一样。
选区与依赖关系的区别是深远的。与基于选区的解析树相关的其他句法结构是必要的还是有益的。
短语标记
Noam Chomsky和其他人开发的早期变革性生成语法中引入了短语标记或P标记。代表句子深层结构的短语标记是通过应用短语结构规则生成的。然后,此应用程序可能会经历进一步的转换。
可以以树的形式呈现短语标记(如上图所述的基于选区的解析树),但通常以“括号表达式”的形式给出,在内存中占据较小的空间。例如,与上面给出的基于选区的树相对应的包围表达式可能是:
与树一样,这种表达式的精确结构和所示的细节量取决于所应用的理论以及查询作者希望说明的观点。