[科普中国]-多重分类程序-

简介

分类是根据对象的本质属性或显著特征将对象区分为若干种类，使每个种类相对于其他种类都具有确定的地位。分类可以使杂乱无章的事物现象或材料条理化、系统化。多重分类程序是指对需要进行分类的对象或样本进行多次分类的程序。多重分类程序是对分类对象精确划分，例如在文件系统中，多重分类程序对文件对象进行精确划分，有利于对文件的查询和管理；在数据挖掘或机器学习中，对对象进行多重分类，能从一定程度上减小错分概率。多重分类程序可以借助决策树实现。

属性和特征属性客观上存在且可区分的事物称为实体。实体可以是人，也可以是物；可以指实际的对象，也可以指某些概念；可以指事物与事物间的联系。如学生是一个实体。实体所具有的某一方面的特性。一个实体可以由若干个属性来刻画。如公司员工实体有员工编号、姓名、年龄、性别等属性。再如学生实体有学号、姓名和性别等属性1。

特征特征是一个客体或一组客体特性的抽象结果。特征是用来描述概念的。任一客体或一组客体都具有众多特性，人们根据客体所共有的特性抽象出某一概念，该概念便成为了特征。

程序计算任务的处理对象和处理规则的描述。任何以计算机为处理工具的任务都是计算任务。处理对象是数据，如数字、文字、声音和图像等。处理规则一般指处理动作和步骤。在低级语言中，程序是一组指令和有关的数据或信息。在高级语言中，程序一般是一组说明和语句，即程序规范说明和程序体两部分。程序规范说明是该程序“做什么”的概括描述，程序体是其实现步骤，即“如何做”的具体描述。构成程序的基本成分包括子程序、协同程序、递归程序和模块等，它们均称为程序单位。程序都是用程序设计语言来书写的。程序是软件的主体，是软件研究的主要对象。衡量程序质量的准则是：正确可靠、简明易读、易维护、易适应和时空开销合理。系统程序：支持计算机系统工作且为所有计算机用户公用的程序。操作系统程序、各种语言的编译程序、编辑程序、调试程序以及作为程序设计环境的各种工具性程序，都是系统程序。通常，系统程序是同计算机本体一道提供给用户的。应用程序解决某特定领域的应用问题的程序。

子程序：以良好的算法和数据结构编制成的一组具有独立功能的语句序列或指令序列，能够在程序中反复调用，执行后返回调用处。在子程序内也可以调用另外的子程序。子程序又可分为函数型子程序和非函数型子程序。

程序包：具有相对独立性的一组逻辑上相关的实体。程序包也是构成程序的一种单位。通常，程序包中的实体包括数据类型、数据对象和子程序，这些实体可被引用该程序包的外部程序使用，但隐藏了程序包内部的实现细节。

决策树决策论中（如风险管理），决策树（Decision tree）由一个决策图和可能的结果（包括资源成本和风险）组成，用来创建到达目标的规划。决策树建立并用来辅助决策，是一种特殊的树结构。决策树是一个利用像树一样的图形或决策模型的决策支持工具，包括随机事件结果，资源代价和实用性。它是一个算法显示的方法。决策树经常在运筹学中使用，特别是在决策分析中，它帮助确定一个能最可能达到目标的策略。如果在实际中，决策不得不在没有完备知识的情况下被在线采用，一个决策树应该平行概率模型作为最佳的选择模型或在线选择模型算法。决策树的另一个使用是作为计算条件概率的描述性手段。

机器学习中，决策树是一个预测模型；他代表的是对象属性与对象值之间的一种映射关系。树中每个节点表示某个对象，而每个分叉路径则代表某个可能的属性值，而每个叶节点则对应从根节点到该叶节点所经历的路径所表示的对象的值。决策树仅有单一输出，若欲有复数输出，可以建立独立的决策树以处理不同输出。数据挖掘中决策树是一种经常要用到的技术，可以用于分析数据，同样也可以用来作预测。从数据产生决策树的机器学习技术叫做决策树学习,通俗说就是决策树。一个决策树包含三种类型的节点：决策节点：通常用矩形框来表示；机会节点：通常用圆圈来表示；终结点：通常用三角形来表示。决策树学习也是数据挖掘中一个普通的方法。在这里，每个决策树都表述了一种树型结构，它由它的分支来对该类型的对象依靠属性进行分类。每个决策树可以依靠对源数据库的分割进行数据测试。这个过程可以递归式的对树进行修剪。当不能再进行分割或一个单独的类可以被应用于某一分支时，递归过程就完成了。另外，随机森林分类器将许多决策树结合起来以提升分类的正确率。

[科普中国]-多重分类程序

微信扫一扫：分享