[科普中国]-小数定律- · 科普中国网

小数定律(law of small numbers)又称小数定理，是阿莫斯·特沃斯基（Amos Tversky）和丹尼尔·卡纳曼Daniel Kahneman在其研究中对“赌徒谬误”的总结。

介绍小数定律认为人类行为本身并不总是理性的，在不确定性情况下，人的思维过程会系统性地偏离理性法则而走捷径，人的思维定势、表象思维、外界环境等因素，会使人出现系统性偏见，采取并不理性的行为。大多数人在判断不确定事件发生的概率时，往往会违背概率理论中的大数定律，而不由自主地使用“小数定律”，即滥用“典型事件”，忘记“基本概率”。

小数定律是人有把从大样本中得到的结论错误地移植到小样本中的倾向。比如人们知道掷硬币的概率是两面各50% ，于是在连续掷出5个正面之后就倾向于判断下一次出现反面的几率较大。这一点已被大量的实验和证券市场上的错误预测所证实。1

内容卡尼曼和特维尔斯基发现，不确定性下的推断系统地偏离于传统经济理论提出的理性类型。卡尼曼和特维尔斯基的早期工作基于这样的基本观点：总的来说，人们通常没有能力对环境做出经济学的和概率推断的总体严格分析。人们的推断往往靠的是某种顿悟或经验，所以经常导致系统性偏差。

一类基本偏差是人总是倾向于运用小数法则，认为小样本和大样本的经验均值具有相同的概率分布，其实这违反了概率理论中的大数原则。例如，在一个著名的实验中，参与人认为某一给定时间在大医院内诞生的婴儿有60%是男孩，则一家小医院内情况必定相同。通常，人们好像都认识不到随着样本规模的扩大，随机变量的样本均值的方差减小的有多快。

更准确地说，根据统计学的大数法则，独立观察某随机变量的一个大样本，其均值的概率分布集中体现这一随机变量的预期值，随着样本规模的变大，样本均值的方差趋近于0。

但是，按照人类心理的小数法则，人们确信随机变量期望值的分布也会反映在小样本的样本均值之中。这导致对短序列的独立观察值做了过度推论(overinference)。

小数法则的案例之一是，当投资者观察到一位投资经理在过去两年表现好于其他人，就总结说这位经理水平要高一些，而这一结论的统计含义太弱。另一个相关的例子称为“赌博者谬误”：许多人都经常预期一个随机赌局的第二轮会得到与第一轮相反的结果，而实际上，每一轮在统计上都是独立的。如果一项投硬币游戏前若干轮出现太多的“头像”，那么许多参与者确信下一轮便应该是“文字”了。

小数法则还与相似性(representativeness)相关，这种相似性是形成推断的重要因素。特维尔斯基和卡尼曼在一些精美的实验中表述了这种经验推断方程。参与人被要求以已知的描述为基础将人进行分类，如区分销售人员或议员等。对于一个给定群体中随机抽取的某个人，当给他的描述是“对政治感兴趣，乐于参与辩论，渴望出现在媒体上”时，许多参与人判断说是议员。即使这个群体中，销售员更具备这种特征。特维尔斯基和卡尼曼(1973)深入地考察了这种经验推断式的思考方式，在他们的实验中，一些参与者得到有关群体构成的确切信息。一类设计中群体由30%的工程师和70%的律师组成，另一类设计中群体构成比例相反。实验的结果是这种差异对参与者的推断不会产生真正的影响。

经验推断也会令人们相信两个事件的联合概率高于其中的事件之一发生的概率，这与概率理论的基本定理相悖。例如，某实验中的参与者就认为如果Bjorn Borg闯入温布尔登决赛，则相对于输掉第一盘的结果，他输掉第一盘而赢得冠军的结果更可能出现。

Shleifer(2000)的回顾行为金融理论的文章认为，小数法则和相似性推断可以解释金融市场中的某些反常现象。例如，对股价变动的过分敏感可能是投资者对短期利好信息的过度反应的结果。

概率推断中的另一种常见偏差是可利用性(availability)偏差，指人们通过不费力地回想出的例子来进行概率推断，结果导致赋予那些易见的、容易记起的信息以过大的比重。比如，人们总是在亲身获知某人在一座城市中被谋杀时，高估这座城市的犯罪率。认知心理学通常认为，与不熟悉的信息相比，熟悉的信息更容易被忆起，也更让人相信其真实性和相关性。熟悉和可得性于是成为真切和相关性的暗示。2

地位小数定律是关于 “无穷小随机变量之和的极限分布，是广义泊松分布的极限定理的总称。独立重复试验中的稀有事件(小概率事件)出现次数的极限分布是泊松分布，是小数定律的重要特例。

小数定律，因涉及无穷小随机变量之和或稀有事件出现次数的极限分布而得名，并非大数定律的对称。

大数定律概率论的基本定律之一，指关于大量的随机现象具有稳定性质的法则。它说明，如果被研究现象的总体是由大量的相互独立的随机因素所形成的，而且每个随机因素对总体的影响都相对地比较小，这时对大量因素加以综合平均，上述因素的个别影响就将互相抵消并显现出它们共同作用的倾向，使总体具有稳定的性质。大数定律的涵义具体可归纳为以下四个方面：(一)现象的某种总体性规律，当将具有这种现象的足够多的单位加以综合汇总的时候，这种规律才能够明显地显示出来；(二)现象的总体性规律通常是以平均数的形式表现出来的；(三)所研究现象的总体包含的单位数越多，平均数也就越能正确地反映出这些现象的普遍规律性；(四)各单位的共同倾向决定着平均数的水平，而各单位对平均数的离差则会由于足够多数单位综合汇总的结果而相互抵消，表现为趋向于消失。就抽样推断而言，大数定律则证明：如果由随机变量构成的总体存在着有限的平均数和方差，则对于充分大的抽样单位数n(一般指n>30)，将会有几乎趋近于1的概率，期望抽样平均数与总体实际平均数的绝对离差为趋近于0。

本词条内容贡献者为:

尚华娟 - 副教授 - 上海财经大学