版权归原作者所有,如有侵权,请联系我们

[科普中国]-分类操作

科学百科
原创
科学百科为用户提供权威科普内容,打造知识科普阵地
收藏

简介

分类操作是指将同一种属性或类别数据或文件归并到一起,或是指同一属性数据分类到几个区域或列表中。前者在计算机操作系统管理中经常可见,例如操作系统将文件分类成源文件、目标文件、文本文件等不同类型文件。分类操作的目的主要方便系统对计算机中资源进行管理,提高系统效率。或者主要应用于数据挖掘中,经数据进行分类操作,便于分析和聚类,经常通过聚类和决策树实现。

属性一个具体事物,总是有许许多多的性质与关系,我们把一个事物的性质与关系,都叫做事物的属性。

计算机中的字段属性、资源特性和那些读取与修改的权限。例如:文件属性、用户的属性。

Windows、MS-DOS中文件夹的管理属性如:“只读”、“归档”、“隐藏”。并且显示在属性栏的文件属性是可以改变的。

在类Unix操作系统的属性,指的是文件权限。

在关系数据库的关系模型属性,指的是数据库属性。

数据挖掘中分类操作实现聚类聚类分析(Cluster analysis,)是对于统计数据分析的一门技术,在许多领域受到广泛应用,包括机器学习,数据挖掘,模式识别,图像分析以及生物信息。聚类是把相似的对象通过静态分类的方法分成不同的组别或者更多的子集(subset),这样让在同一个子集中的成员对象都有相似的一些属性,常见的包括在坐标系中更加短的空间距离等。聚类(Cluster)分析是由若干模式(Pattern)组成的,通常,模式是一个度量(Measurement)的向量,或者是多维空间中的一个点。

决策树决策树(Decision tree)由一个决策图和可能的结果(包括资源成本和风险)组成,用来创建到达目标的规划。决策树建立并用来辅助决策,是一种特殊的树结构。决策树是一个利用像树一样的图形或决策模型的决策支持工具,包括随机事件结果,资源代价和实用性。它是一个算法显示的方法。决策树经常在运筹学中使用,特别是在决策分析中,它帮助确定一个能最可能达到目标的策略。如果在实际中,决策不得不在没有完备知识的情况下被在线采用,一个决策树应该平行概率模型作为最佳的选择模型或在线选择模型算法。决策树的另一个使用是作为计算条件概率的描述性手段。分类决策树模型是一种描述对实例进行分类的树形结构。决策树由结点(node)和有向边(directed edge)组成1。

在机器学习中,决策树是一个预测模型;他代表的是对象属性与对象值之间的一种映射关系。树中每个节点表示某个对象,而每个分叉路径则代表某个可能的属性值,而每个叶节点则对应从根节点到该叶节点所经历的路径所表示的对象的值。决策树仅有单一输出,若欲有复数输出,可以建立独立的决策树以处理不同输出。 数据挖掘中决策树是一种经常要用到的技术,可以用于分析数据,同样也可以用来作预测。从数据产生决策树的机器学习技术叫做决策树学习,通俗说就是决策树。