版权归原作者所有,如有侵权,请联系我们

[科普中国]-被人口普查漏掉的人,AI在卫星地图上能看见

我是科学家
原创

脊髓灰质炎,又称小儿麻痹症,是由脊髓灰质炎病毒导致的传染病。为了防止脊髓灰质炎病毒传播,绝大多数新生儿在5岁前都要接种脊髓灰质炎疫苗。

中国的“免费提供、强制接种”制度,让这种疾病几乎绝迹。而在另一些国家——比如尼日利亚——脊髓灰质炎仍一度成为区域流行病。这背后很大一部分原因是疫苗资源分配的问题:有些地区的疫苗供给大于实际需求数量,而另一些地区的疫苗则可能不够用。

那么,如何才能更准确地估计出不同地区的疫苗需求、把有限的疫苗资源最合理地分配给亟待注射的儿童?

需要精准地知道不同地区儿童数量的分布。

一张特殊的地图

根据尼日利亚官方最新统计数据,人口密度最高的拉各斯州大约有900万常住人口,北部的卡杜纳州则是600万,联邦首都特区为140万。更进一步,我们还能获得各州内“地方政府辖区”的人口数量,结合经典人口学方法,似乎很容易就能得知不同区域5岁以下儿童人口的数字。

这就是我们需要的数据吗?很遗憾,这个答案并不完美。如果带着救命的疫苗站在尼日利亚的土地上,你会发现这些统计结果帮助十分有限。

尼日利亚每个行政单位内的人口分布并不均匀。 以拉各斯州为例,州内大约90%的人口都分布在拉各斯城市带,而拉各斯城市带仅占全州面积的约1/3。

除此之外,相较于经济发达地区,贫穷地区往往更加地广人稀,获取疫苗的成本也更高,因此需要更加准确的人口分布与资源分配方案。而当前的统计结果只能告诉你:在这广阔的100平方公里内居住了10户人家,至于这些居民的具体位置,它则一无所知。

为了解决这些弊端,20世纪初,一位俄罗斯地理学家发明了 分区密度地图 (dasymetric map) 。这种地图需要利用人口统计结果,但却摆脱了以行政单位划分人口的限制。

这是怎么做到的呢?

分区密度地图引入了许多辅助信息,其中既包括山岭、水域等地形信息,也包括农田、森林等土地性质信息。随着地理信息系统 (GIS) 的发展,道路、建筑等设施的遥感图像也被添加进来。这些信息可以体现不同地理环境下,人口分布水平的大致范围,将它们与人口统计数据相结合,就可以获得更加符合真实情况的人口分布地图了。

俄勒冈阿斯托里亚市普通人口分布图与分区密度地图(向右滑动) | Geographic Information System Software to Remodel Population Data Using Dasymetric Mapping Methods

随着技术的发展,“区”分得越来越小,反映出的人口分布水平也越来越准确。带着这张地图,我们就能清楚地知道一片区域内到底有多少需要疫苗的孩子,以及如何才能有效地实现疫苗调配了。

然而,分区密度地图能完全解决尼日利亚的问题吗?

答案是不尽然。

尼日利亚的困局与转机

还记得前文中提到的尼日利亚各州人口数据吗?——不用回去翻,因为那些数字已经无法代表真实情况了。上一次尼日利亚官方更新人口统计数据,是2006年。

一次大规模人口普查的平均成本大约为1-2美元/人,而尼日利亚的人口接近2亿,全国性人口普查会是一笔不小的费用。

其实尼日利亚的经济情况在非洲尚且算好,更多贫穷的国家因为高额的成本、糟糕的经济加上动荡的政权,可能在过去几十年间都没有进行过规范的全国性人口普查。

甚至对于已经完成的普查结果来说,数据的准确性也需要打上一个问号。2006年尼日利亚全国人口普查显示拉各斯州拥有900万人口,而同一时期,拉各斯州当地政府进行的调查则显示拉各斯州人口为1750万,相差达近两倍之多。

在数据老旧过时、可靠性差的情况下,分区密度地图方法也难以得到准确的人口分布结果,更不用说利用它进行有效地疫苗规划了。

尼日利亚需要新的解决方案。

尼日利亚索科托上门递送疫苗的妇女 | gatesfoundation.org

2017年,英国南安普顿大学的世界人口计划项目组,与比尔及梅琳达·盖茨基金会、美国橡树岭国家实验室联合发表了一篇学术论文。这篇文章讲述的人口分布估计新方法,成功提升了整个尼日利亚地区疫苗规划方案的效率与效果。

这种方法摆脱了对大规模人口普查的依赖,从尼日利亚北部卡杜纳州与卡诺州的总体人口与5岁以下儿童分布测算开始,逐渐推广到了整个尼日利亚疫苗追踪系统。

它的实现得益于—— 高清卫星地图 。

当下流行的地图类手机应用中都存在一个图层,叫做“卫星地图”。选择展示这一图层,你会发现你身处的建筑、甚至建筑上的窗户都清晰可见。

现在 高清卫星地图的精度可以达到1米以内 ,这让人口学家们发觉了其中的潜力:能不能从卫星地图上获取建筑信息,通过计算不同建筑内的人口密度,测算出特定区域的人口分布呢?

答案是肯定的。

首先,研究者们借助机器学习方法,分两步从高清卫星地图中识别、提取出了7类有人居住的建筑,其中包括6种不同的城市建筑以及1种乡村建筑。他们的假设是:这7种建筑间存在人口居住密度的差异,而同类建筑则具有相同的人口居住密度。

然后,研究者们对目标地区进行了小规模人口普查。

他们从地图上随机抽取了覆盖不同建筑类别的样本区域,每个样本区域覆盖25-50座同类建筑,研究者们雇佣当地非政府组织,对每座建筑中的人口状况进行了调查与统计,从而估计出了每类建筑的人口居住密度。

两步建筑提取法: 第一步,识别“居住区域”与“非居住区域”; 第二步 (向右滑动 ) ,识别不同建筑类型。A-F为不同城市建筑类型,Z为非居住区。 结果 (再次向右滑动 ) :根据不同建筑类型估算出的人口居住密度( 左:卡努市 右:卡杜纳市) | 参考文献[4]

结合不同类别建筑的人口居住密度信息,与实际抽样人口数,研究者们就可以得到人口分布结果了。

他们将这种人口分布的估计方法称为“自下而上”法—— 先对小范围地区进行人口调查,然后通过统计模型估计未调查地区的人口分布水平 。

与传统的“自顶向下”法 (从全国性人口普查数据出发,将人口逐步拆解分配到不同空间区域) 相比,这种方法的测算成本能够下降数十倍。

与此同时,新方法也提升了测算结果的精度——“自下而上”法能够测算90米×90米小方块中的人口密度,而当时其他人口分布测算方法的精度只有1千米左右。

十年前,尼日利亚暴发的脊髓灰质炎病例占到了全球病例的一半以上。十年后,2020年8月,世界卫生组织正式宣布尼日利亚已经不再属于脊髓灰质炎流行区域。

尼日利亚胜利了。

“看见每一个人”

除了实现疫苗资源分配之外,人口分布数据还能提供什么帮助?

2013年到2016年,西非暴发了有记录以来最严重的埃博拉疫情 (一种平均死亡率约为50%的病毒感染) 。过去许多次埃博拉疫情都暴发于与世隔绝的村庄,因此病毒没有得到大规模扩散。这一次疫情爆发初期,人们也如此认为。直到——2014年无国界医生组织报告利比里亚首都蒙罗维亚,已经面临“灾难性”公共卫生危机,世界卫生组织报告英国、美国和西班牙也出现了埃博拉感染个案。后续的分析认为,如果人们能 及时确定疫情暴发源头的地理位置与人口规模 ——知晓当地村落分布与人口分布——从而估算出更准确的疫情传染率,一切也许不会演变成最终的局面。

在欠发达地区,疫情传染率与疾病发生率的估算都是不小的挑战。除此之外,各种资源需求及成本评估、灾难应对规划以及社会经济指标测算也面临着许多障碍。这些问题也正是联合国2015年公布的可持续发展目标 (SDG) 中需要解决的重要问题,而人口分布的精确测量,恰恰能为这些问题提供解决方案。

随着高清地图资源的丰富与人工智能算法的发展,许多科技公司也加入了人口分布测算的研究。过去几年间,脸书 (Facebook) 与美国哥伦比亚大学以及世界银行合作,预测并公布了世界上绝大部分地区的人口分布地图。借助深度卷积神经网络与半监督学习等人工智能前沿算法与高清卫星图像,他们得到的人口分布地图在偏远地区也能够达到30米的量级,如同给地球这张大地图插上了无数关键的“侦查守卫”,照亮了世界的每一个角度。

脸书发布:基于深度卷积神经网络的非洲人口分布预测 | 参考文献[16]

脸书发布的人口分布数据,帮助国际红十字会推进了高效率、低成本的非洲马拉维麻风疫苗接种运动,协助世界粮食计划署完成了灾难应急响应规划,并为推动欠发达地区的电气与通信网络铺设提供了宝贵而准确的信息。

与此同时,还有许多研究机构与学者在尝试利用飞速发展的技术与算法,实现更加准确的人口分布测算,进而为不同地区提供更有保障的生活、医疗、教育与现代社会资源。

联合国可持续发展目标的一项基本原则是“不让任何人掉队”,希望不断进步的人口分布测算方法,终有一天能让我们 “看见每一个人”。

作者名片

作者:氪罗钡路斯

编辑:范可鑫

排版:夏晓茜

参考文献:

[1]. Leyk S, Gaughan A E, Adamo S B, et al. The spatial allocation of population: A review of large-scale gridded population data products and their fitness for use[J]. Earth System Science Data, 2019, 11(3).

[2].One Hundred Years of Dasymetric Mapping: Back to the Origin

[3].Wardrop N A, Jochem W C, Bird T J, et al. Spatially disaggregated population estimates in the absence of national population and housing census data[J]. Proceedings of the National Academy of Sciences, 2018, 115(14): 3529-3537.

[4].Weber E M, Seaman V Y, Stewart R N, et al. Census-independent population mapping in northern Nigeria[J]. Remote Sensing of Environment, 2018, 204: 786-798.

[5].Hu W, Patel J H, Robert Z A, et al. Mapping missing population in rural india: A deep learning approach with satellite imagery[C]//Proceedings of the 2019 AAAI/ACM Conference on AI, Ethics, and Society. 2019: 353-359.

[6].Tiecke T G, Liu X, Zhang A, et al. Mapping the world population one building at a time[J]. arXiv preprint arXiv:1712.05839, 2017.

[7].Bonafilia D, Gill J, Basu S, et al. Building High Resolution Maps for Humanitarian Aid and Development with Weakly-and Semi-Supervised Learning[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition Workshops. 2019: 1-9.

[8].Tatem A J. WorldPop, open data for spatial demography[J]. Scientific data, 2017, 4(1): 1-4.

[9].Koch, Tom. "Ebola in West Africa: lessons we may have learned." (2016): 5-12.

[10].https://www.worldpop.org/case_studies/nigeria

[11].https://en.wikipedia.org/wiki/List_of_Nigerian_states_by_population

[12].https://www.un.org/africarenewal/news/polio-no-longer-endemic-nigeria-%E2%80%93-un-health-agency

[13].https://www.afro.who.int/news/press-release-who-and-unicef-congratulate-nigeria-ending-wild-poliovirus-call-strengthening

[14]. https://www.bbc.com/news/world-africa-53887947

[15].https://dataforgood.fb.com/docs/high-resolution-population-density-maps-demographic-estimates-documentation/

[16].https://ai.facebook.com/blog/mapping-the-world-to-help-aid-workers-with-weakly-semi-supervised-learning/

[17].https://unsdg.un.org/2030-agenda/universal-values/leave-no-one-behind

欢迎个人转发到朋友圈

本文版权属于“我是科学家”,未经授权不得转载。如需转载请联系iscientist@guokr.com

欢迎填写调查问卷,支持我们↓↓↓

“科普中国”公众满意度调查问卷 ▲

【扩展阅读】 在东非大草原上做科研,是怎样一种体验?