两年前,常山药业称「约1.4亿中国男人阳痿,产品市场广阔」而引发热议,该公司12/28公告,收到证监会《行政处罚决定书》,认定常山药业2018-28号公告中的部分内容信披违规,对公司给予警告并处以罚款60万元。如此常山药业又一次登上了热搜。
毫无疑问,这所谓的约1.4亿数据来源肯定是以偏概全,因为统计数据会说谎。
以前好像有本书就是这样命名的,就像下图这种同一个数据调坐标系。
其实常山药业这种,就是类似的。
我们经常看到各种数据,中国xx有多少亿,比如
常山药业之前说中国阳痿患者有1.27亿,贵州百灵之前说中国糖尿病患者超过1.1亿,通策医疗说不孕不育的有5,000万以上,康宁医院说每5个人就有一个是精神病。
但是,理论上,除了全国人口普查,没有任何机构可以做到全国性的普查,甚至每年的普查也是抽样的。
那么,常山药业如何得出这个结论?
其实办法就是抽样调查算出概率,然后乘以总人口。
比如找了几十上百个人调查一下比例,得出样本群里男性阳痿比例20%,最后用全国7亿左右的男性一乘,那就是1.4亿。
但是,这里面就有问题了:
统计学里做抽样调查,对于抽样是有严格的要求的。
常山药业的样本抽样到底如何?
地方是否具有代表性?是否全国性抽样?还是用某个城市代表的?
全国那么多地市,不同区域风土环境人情都有差异,人们生活习惯也有差异,是否包括?
年龄分布如何?
不同年龄段的个人性功能存在差异,尤其是少年儿童还没性成熟呢。
职业分布如何?
不同职业可能也存在差异
甚至于调查方式也有很大的影响,互联网?电话?上门?
比如互联网调查是否会涉及到上网人群和不上网人群的问题等等?我国当前接入互联网的人群是9亿,还有5亿多人没接入互联网呢。
如果这些没搞清楚,那么这个抽样调查就不具备说服力,举个典型的例子:
记者到列车上采访,发现人人都有车票,于是记者报道:春运一票难求问题已经得到解决。
这就是典型的调查样本选取的问题。
可是很多时候,又会遇到一些问题,那就是,对方到底是故意搞错呢?还是本身能力有限不知道抽样调查有这么多道道呢?