摘要:介绍了范畴的基本定义,说明范畴论和传统集合论的区别,并结合实例,讨论了范畴语法在自然语义分析中的简单应用。
关键词:范畴语法;自然语义;重用性
中图分类号:TP301文献标识码:A文章编号:1009-3044(2009)27-7728-02
Application of Category in the Natural Semantics
DING Sheng-bin
(Fujian Agriculture And Forestry University, Fuzhou 350002, China)
Abstract: This paper introduces the basic definition of the theory of category and illustrates the distinction between the traditional set theory and the category theory , and discusses a simple application of category in the natural semantics analyze combined with examples.
Key words: category; natural semantics; reusability
范畴论产生于20世纪40年代对同调代数的研究。1942年,Eilenberg 和Maclane 的论文(自然等价性的一般理论)引入了范畴、函子和自然变换的概念用来描述某些“自然”同构的概念[1]。现在范畴论已经发展成为一门具有广泛应用的新理论,在现代数学研究中,范畴论为日趋多样的数学分支以及各个分支的多样化的联系提供了一种统一的简洁的“符号语言”,目前已经在代数学、拓扑学、代数几何学等领域有着深刻的应用。在逻辑学中,以范畴为基础的Topos理论正在发展成为现代数学全新的统一的基础。
在理论计算机科学研究中,范畴论在函数程序指令、程序语义学和程序逻辑学等领域也有着广泛的应用。例如高阶逻辑的语义可以用范畴论的概念表达[2];范畴论可用于数据库的概念模型[3];莫特盖特的学生Moot进而在其博士论文中设计了被称之为Grail的范畴语法定理证明器,可以设计任何自然语言片段的范畴语法系统:输入词条构成词库,输入结构公设等特定的技术手段,然后据此判定任意给定的句子是否合语法。同时,Grail还在视窗界面上展示判定的搜索过程[3]。
范畴论在语义描述方面的优势在于比传统逻辑学的数学基础——集合论更抽象,具有更广泛的应用与良好的重用性。本文第2部分将讨论这一问题。第3部分将说明范畴语法在自然语言中的应用。最后是本文的总结。
1 范畴论与集合论
1.1 范畴的基本定义
1) 定义1[4]:一个范畴(category)C是由下列三种成员所组成:
C1:一类对象(object)obc:A,B,C;
C2:一类由每一对对象A与B(相等或相异)所唯一确定的集合C(A,B)。
集合中的元素叫做态射(morphism)morC,当σ∈C(A,B)时,A为σ的定义域(domain),B为σ的变区(range);
C3:一种对应方法,使得对任何σ∈C(A,B)与τ∈C(B,C)都能对应唯一的一个ρ∈C(A,C),ρ称σ为τ与的乘积,记为ρ=τσ;
满足以下的三条公理:
∏1不相交性:C(A,B) ∩C(A",B") ≠?准?圳A=A",B=B";
∏2结合律:当σ∈C(A,B),τ∈C(B,C),f∈C(C,D)时, f(τσ)= f(τ)σ;
∏3恒等态射存在:对任一对象A,C(A,A)至少有一个元素1A,使得对任何σ∈C(A,B),恒有σ1A=σ=1Bσ;
2) 定义2设C和D是范畴;一个函子F由两个映射组成:
F: C->D
obC |→ obD: A |→ F(A)
morC |→ morD:f |→ F(f)
满足dom(F(f))=F(dom(f)),cod(F(f))=F(cod(f)),F(1A)=1F(A),
并且dom(g)cod(f)则F(gf)=F(g)F(f)。
1.2 范畴论与集合论的区别
1.2.1 抽象层次不同
集合论只是范畴论中的一个具体的子范畴,范畴论涵盖了整个集合论。同时集合论以具体的集合以及集合间元素的映射为基础,定义关系和函数。范畴论以一类对象以及对象间的态射为基础进行研究,避免了类似“集合的集合”之类的悖论,同时通过函子定义不同结构范畴间的“映射”,以及自然变换反映不同体系、结构事物间的关联性,在更高的层面定义和讨论事物间的联系与区别,为不同结构的事物的联系提供统一的“箭图语言”。如在某范畴中的积(product)可用图1简洁的给予描述,而同样的概念用一阶语言表达相同的语义,是一个较长的公式:
?坌f?坌g((D(f)=D(g)∧C(f)=A∧C(g)=B)->(?埚!z)(zx=f∧zy=g))
1.2.2 重用性不同
首先,范畴论以一类对象以及对象间的态射集为基础,是一种抽象和普遍的数学结构,被认为是沟通各个数学分支的有效语言,这是范畴论概念可重用的基础。更通俗的说,范畴论与集合论在对语义分析的重用性方面的比较如同在程序设计中面向对象与面向结构的区别。集合论局限于集合范畴,难以表达其他范畴,只有范畴论提供适合各种范畴,对各类问题域一致的表示方法。其次,范畴论概念能普遍重用于各种具体范畴,集合论数学各分支分别研究不同的具体范畴,各自的概念与这些具体范畴的对象和箭头的定义紧密相关,所以集合论数学的概念都只能在个别具体范畴中使用,它的各个分支之间重用概念很困难,所以集合论数学相比而言不适合重用。
1.2.3 范畴论比集合论更具有对称性
范畴论中的许多概念都是成对出现的,如核与余核、积与余积、单态射与满态射、推出与拉回等等。这些对偶的概念使对偶的原则变得十分显然,从而使得具有对偶性质的证明变得简化:如果陈述S对某一类范畴成立,则其对偶陈述Sop也对这一类范畴自然成立,这一特性使得在自然语义分析中更加具有优势。
1.3 范畴语法在自然语言语义分析中的应用
1.3.1范畴语法的基本原理
范畴语法是一种使用运算和推演的手段来描述语言的形式化工具,是一种数理语言学,属于逻辑。其基本原则是:语言认识是数学计算,语法分析是逻辑演绎。自然语言具备由单词连成词组再由词组连成短语以及句子的功能,这种由较小语言成分形成较大语言成分的体系就是自然语言的毗连性(concatenation),通过毗连各个语言符号串可逐步扩张。
如:小明住在北京,可表现为逐层逐级毗连过程如图2。
1.3.2 范畴语法的基础方法
范畴语法把自然语言形成规律的基础方法:把某一语言成分当作函项,把相邻的成分当作函项的主目,把两个成分的毗连当作函项运算获得的结果。如上列,给专名“小明”,动词“住”,介词“在”,通名“北京”分别定义各自不同的具体范畴如:专名范畴、动词范畴、介词范畴、通名范畴。如上例可以表示如图3所示。
在建立不同成分的范畴之后,则可以对不同成分进行运算、分析,即不同成分的毗连就可以认为是不同具体范畴间的函子来进行运算与表示。范畴语法对自然语言的逻辑分析在计算机领域获得实现,这推动了自然语言的信息处理工作。另一方面,从逻辑理论角度深入研究范畴语法。对范畴运算推演规律进行抽象形成范畴语法的逻辑系统,不仅把函子范畴中的斜线变换“/” 和“\” 以及毗连变换“·” 当作广义的逻辑联结词,把范畴推演的规则当作系统中的定理,还进一步考虑建立范畴逻辑的语义理论。范畴逻辑系统于是获得可能世界的框架语义解释,据此函子范畴中的斜线和范畴的毗连均被看作是二元模态算子。运用右函子范畴定理:A/B·B->A,左函子范畴定理:A·A\B->B,范畴的连接函子:A·B->AB与结合定理:A·(B·C)->(A·B)·C,对例子:“小明爱看书”可进行如图4演算。
2 结论
以上只是范畴论在自然语义分析中的简单应用,简而言之:范畴论是对传统集合论数学中的结构的归纳和抽象,范畴论是对集合论的发展,在数理逻辑中已经得到广泛的应用,如在形式本体化等的研究中有着重要的应用。
参考文献:
[1] Eilenberg S, MacLane S. General theory of natural equivalences. Trans.Amer.Math.Soc.,1945(58),231-294.
[2] Barwise J. Handbook of Mathematical Logic[M]. NORTH-HOLLAND PUBLISHING COMPANY,1977.
[3] Moot R. Proof nets for linguistic analysis[D].PhD thesis, Utrecht University,2001.
[4] 贺伟.范畴论[M].北京:科学出版社,2006.
扩展阅读文章
推荐阅读文章
花田文秘网 https://www.huatianclub.com
Copyright © 2002-2018 . 花田文秘网 版权所有