概念
理论统计学是统计学的一个分支,它是把研究对象一般化、抽象化,以概率论为基础,从纯理论的角度,对统计方法加以推导论证,中心的内容是统计推断问题,实质是以归纳方法研究随机变量的一般规律。理论统计学包含的内容很多,例如统计分布理论,统计估计和假设检验理论,相关与回归分析,方差分析,时间序列分析、随机过程理论等。
统计学统计学是通过搜索、整理、分析、描述数据等手段,以达到推断所测对象的本质,甚至预测对象未来的一门综合性科学。统计学用到了大量的数学及其它学科的专业知识,其应用范围几乎覆盖了社会科学和自然科学的各个领域。
统计学的英文statistics最早源于现代拉丁文Statisticum Collegium(国会)、意大利文Statista(国民或政治家)以及德文Statistik,最早是由Gottfried Achenwall于1749年使用,代表对国家的资料进行分析的学问,也就是“研究国家的科学”。十九世纪,统计学在广泛的数据以及资料中探究其意义,并且由John Sinclair引进到英语世界。
统计学是一门很古老的科学,一般认为其学理研究始于古希腊的亚里斯多德时代,迄今已有两千三百多年的历史。它起源于研究社会经济问题,在两千多年的发展过程中,统计学至少经历了“城邦政情”、“政治算数”和“统计分析科学”三个发展阶段。所谓“数理统计”并非独立于统计学的新学科,确切地说,它是统计学在第三个发展阶段所形成的所有收集和分析数据的新方法的一个综合性名词。概率论是数理统计方法的理论基础,但是它不属于统计学的范畴,而是属于数学的范畴。
统计估计统计估计(statistical estimation)是统计推断的一种形式,统计估计的方法是用样本的函数来估计总体的分布函数、分布参数或数字特征。例如,用样本均值估计总体均值;用经验分布函数估计总体分布函数等,参数估计与非参数估计是统计估计的两大部分。
统计估计是指推断统计中用样本资料去估计总体参数的方法。有点估计与区间估计两种。
数理统计包括统计描述和统计推断两部分,统计推断就是由样本推断总体,是统计学的核心内容,统计推断内容非常丰富,大致可以归纳为两大类:统计估计和统计检验。统计估计分为参数估计和非参数估计、点估计和区间估计,下面只涉及参数的点估计和区间估计,参数的点估计,指用样本统计量的值估计未知参数的值。参数的区间估计就是用样本来确定一个区间,使这个区间以很大的概率包含所估计的未知参数,这样的区间称为置信区间。
点估计是直接估计总体参数的值,通常用样本数据的一个统计量作为总体参数的估计量。例如,在估计一个正态总体的平均数时,把样本数据的平均数取作总体平均数的估计量。点估计时,要求样本统计量是无偏统计量,即要求在无数次重复抽样时,这种样本统计量产生的分布的平均数等于被估计的参数。还要求这个样本分布的方差比其他无偏估计量的方差要小。区间估计是构造 一个区间,推断参数的真值以某个概率落在这个区间内。这个概率称为“区间的置信水平”。这个区间,称为“置信区间”。1
假设检验假设检验(Hypothesis Testing)是数理统计学中根据一定假设条件由样本推断总体的一种方法。具体作法是:根据问题的需要对所研究的总体作某种假设,记作H0;选取合适的统计量,这个统计量的选取要使得在假设H0成立时,其分布为已知;由实测的样本,计算出统计量的值,并根据预先给定的显著性水平进行检验,作出拒绝或接受假设H0的判断。常用的假设检验方法有u—检验法、t检验法、χ2检验法(卡方检验)、F—检验法,秩和检验等。
假设检验的基本思想是小概率反证法思想。小概率思想是指小概率事件(PMSw(远远大于)。
MSb/MSw比值构成F分布。用F值与其临界值比较,推断各样本是否来自相同的总体。3