关于概念格
概念格,也称为Cralois格,又叫做形式概念分析,由Wille R于1982年首先提出,它提供了一种支持数据分析的有效工具。概念格的每个节点是一个形式概念,由两部分组成:外延,即概念所覆盖的实例;内涵,即概念的描述,该概念覆盖实例的共同特征。另外,概念格通过Hasse图生动和简洁地体现了这些概念之间的泛化和特化关系。因此,概念格被认为是进行数据分析的有力工具。从数据集中(概念格中称为形式背景)中生成概念格的过程实质上是一种概念聚类过程;然而,概念格可以用于许多机器学习的任务。目前,已经有了一些建造概念格的算法,并且概念格在信息检索、数字图书馆、软件工程和知识发现等方面得到应用。2
概念格基本定理形式背景(formal context)可以表示为三元组T=(O,D,R),其中O是事例(对象)集合,D是描述符(属性)集合,R是O和D之间的一个二元关系,则存在唯一的一个偏序集与之对应,并且这个偏序集产生一种格结构,这种由背景(O,D,R)所诱导的格L称为概念格。格L中的每个节点是一个序偶(称为概念),记为(X,Y),其中 称为概念的外延; 称为概念的内涵。每一个序偶关于关系R是完备的,即有性质:
1)
2)
在概念格节点间能够建立起一种偏序关系。具体地,给定概念 =( , ) 和 =( , ),则