2022年11月15日凌晨1点29分,全球媒体都在报道一个消息:第80亿个小宝宝在菲律宾诞生了!地球人口突破80亿大关。
但是,问题来了:80亿真的是地球上的全部人口吗?有没有可能,这颗蓝色星球上,还藏着10亿人没被统计到?人口统计到底是怎么进行的?它又有什么用?
今天,咱们就来聊聊地球上可能存在的“潜在粉丝”。
谁在统计全球人口?数据又从何而来?
在搜索引擎上输入“世界人口”,蹦出来的数字是80.62亿。这个数据是咋来的?是谁在统计?
搜索引擎下方贴心地标注了数据来源:世界银行。难道是世界银行统计并发布的吗?
扒拉了一通世界银行的官网,会发现这么一段话:“人口数据由联合国人口司提供”。
看来,联合国人口司才是80.62亿这个数据的主要来源。
找到数据提供方了,但更关键的是:这个数据是怎么统计出来的?
联合国在这方面还是相当负责的,他们把每个地区的人口数据来源都放在官网上,供所有人下载。
根据表格信息,联合国统计的全球人口数据主要来源于以下几个方面:
- 国家层面发起的人口普查
- 人口登记系统
- 住户调查及人口估计
- 其他行政记录
其中,最主要、也最可靠的,当属国家层面发起的人口普查。
庞大的人口普查工程:误差真的无法避免?
说到人口普查,大家都不陌生。根据规定,我国每10年进行一次人口普查。上一次是2020年11月1日零时,统计出了14.4亿人口。
这14.4亿是怎么得来的?答案是问卷式普查。普查期间,普查员会登门请你填写问卷,或者通过网络填报信息。
要知道,在中国这样一个人口大国搞问卷调查,那工程量是相当惊人的。上次普查动用了700万名普查员,花了40天,才完成数据的初步收集。
数据收集上来还不能直接用,还得和公安户籍、卫生部门、电信运营商的信息进行对比,进行一大堆减少误差的操作,才能得到最终结果。
从前期规划到普查登记,再到数据汇总,一次全面的人口普查,前前后后要花上一整年的时间。
但是,就算投入这么多人力物力,普查结果依然会有统计漏洞。因为人是流动的,这就产生了两种不同的统计口径:常住人口和现有人口。
- 常住人口:指在同一居住地居住了一定时间的人口。在我国,一般居住半年以上就算作常住人口。
- 现有人口:指的是人口普查时,正在区域内的人口。
如果人口普查时按照常住人口统计,容易漏报;按照现有人口统计,又容易重报。流动人口的口径差异,使得人口普查的结果和实际人口之间几乎必然存在误差,有时候误差还很大。
比如,2000年进行的第五次人口普查,漏报率在1.81%左右。当时统计的人口是12.65亿,这意味着有2291万人没被纳入统计,这相当于当时整个朝鲜的人口数了。
别以为1.8%的误差很夸张,要知道国际上对人口普查偏差的容忍度一般是3%。像加拿大、新西兰、澳大利亚这些老牌发达国家,人口普查的误差率也常年在2%到3%之间。英国更是经常以5%到6%的误报率“独领风骚”。
对于更多不那么发达的国家而言,人口普查的误差率就更难说了,到底是重报了还是漏报了,根本不知道。
除了统计口径上的误差难以避免,全面的人口统计每隔10年才进行一次,数据时效性也无法保证。
新型普查方式:滚动式普查能解决问题吗?
为了解决时效性问题,法国和美国实行了一种新的人口普查制度:滚动式普查。
以美国为例,美国人口普查局在10年一次的普查之外,还会通过美国社区调查(ACS)来搜集人口信息,并更新进人口普查数据中。
具体方法是:以社区为单元,每个月进行不同方式的随机人口抽样,之后持续将数据报送至州乃至联邦,最后由联邦统一汇总统计。
这样做的好处是:
- 数据更新快且及时,避免了十年一次的统计时效性问题。
- 每个月都会用不同的方式进行统计,可以规避一些人为失误造成的误差。
这套框架的设计没啥大问题,但问题在于,再好的政策方案最终还是得靠人来实施。
就拿美国社区调查来说,对于比较高端的社区,住户会因为担心隐私问题而不愿意配合;对于不那么高端的社区,住户可能看不懂调查内容,也没办法配合。这就导致ACS的响应率逐年走低。
要知道,ACS可不是随便发的传单,按照美国法典的要求,ACS的回复是强制性的,不得拒绝、忽视或回复虚假信息。但即使这样,ACS的回应率也只有84.7%。
同时,ACS作为一种抽样调查,它所产出的数据是估计值。比如,这类数据就表示,在90%的置信区间下,2015年科罗拉多州的总户数为这么多,加减7500。你可以理解为,我们有90%的把握认为当地有这么多人,但具体是多少,不知道。
估计值本身并不适合用作精确计算,但对于了解人口状况和做出政治决策十分有利。所以,美国在ACS之外,仍然保有问卷式普查。
ACS还只是针对正经美国籍的人口调查,美国还有个更严峻的问题:非法移民。
不管是人口统计还是别的什么统计,想要知道人口数,总得先录入信息才可能计算到个人。但是对于海量的非法移民来说,一开始就没有录入任何信息,那自然是不可能统计到的。
综合以上种种,美国人口普查局虽然通过两种普查方式,尽力统计出了3.4亿的人口,但这个数据的准确性到底有多高,恐怕只有国税局才能核对清楚了。
登记式普查:有钱国家的专属?
滚动式普查之外,国际上还有一类常见的人口普查方式,流行于一些人口不多但人均GDP极高的国家,那就是登记式普查。
和问卷式相比,登记式普查把政府主动向群众索取信息,改为了人民主动向政府提供信息。
2005年,瑞典首次完全使用来自行政登记的信息作为人口普查的依据。能完成这一操作的前提是,瑞典拥有联网且高质量的个人信息化名册。同时,政府还努力协调了包括统计部门、土地调查委员会、税收委员会在内的多个部门间的合作和权责关系。
但即使这样,想要实现真正的登记式普查也不是一蹴而就的。光是筹备前期需要的数据信息和普查环节的框架搭建,就花了整整30年的时间,这还不算后期每年的维护费用,还有关于隐私权的讨论等等问题。
这也解释了为什么登记式普查只发生在北欧、新加坡这类又小又有钱的国家了。没有足够的财力和平稳的政治环境支撑,这种普查方式根本难以为继。
战乱地区的人口:如何统计?
前面提到的所有能够开展人口普查的国家和地区,最起码都是政治稳定、政府还保有一定控制力的地区,数据的来源也是有据可疑的。
那么,对于那些正在战争的地区,甚至是连政府都不存在了的地区,又该如何统计人口呢?
联合国人口司也给出了大概的方向。在人口数据的来源构成中,有114个国家和地区提供了2019年之后的人口普查数据,这部分地区可以算是比较和平稳定的。
在政治不太稳定的地区,还可以使用家庭调查和出生死亡婚姻记录来推算该区域的人口数。
这些数据是怎么来的呢?其实,除了联合国之外,还有诸如人口与健康调查、多指标类集调查等许多人权类机构,在动荡地区进行家庭调查。这些组织和机构通常由第三方提供技术和资金支持,与当地政府或管事机构合作调查家庭数据。这些数据中一般会包含人口信息,可以作为人口普查数据的补充。
如果一个地区动荡到连国际组织都不让进,也不肯合作的话,那就只能采用之前记录的人口数据,或者其他方式得到的学校注册人数、粮食援助发放名单等行政记录,作为人口规模的旁证。这种数据的准确性存疑,所以往往还需要通过复杂的统计模型介入,经过多种计算核对之后,才可以勉强算作地区人口的数据。
联合国人口司统计出的80.62亿人口的数据中,就有23个国家提供的人口普查数据是早于2009年的。像阿富汗的人口普查数据已经是1979年了,黎巴嫩更夸张,数据竟然来源于1932年。
要是一个地区经过多年动荡,早期记录的数据已经完全不可用了,新的数据又无法得出,这时候就只能上科技了。通过现代的卫星图像技术和夜间灯光亮度信息等,可以大概估计一个区域的发展情况,进而估计出当地大概的人口密度。或者又结合当地的手机卡激活情况,预估一个数值。
但动荡地区往往没什么灯光,也没什么电话,所以这些方式得出的数据也只能算是旁证的旁证了。
误差可能超乎想象:地球人口或被低估10亿
计算几十几百个人当然很简单,但是当这个数字增长到几亿几十亿,特别是这几十亿人还分布在5.1亿平方公里的地球表面上时,全球人口数的精确计算就变成了一个几乎不可能完成的宏大任务。
一个14亿人的国家上下偏差2%,误差就能吞没一个朝鲜。而81亿人上下偏差10%,就能再造一个地球上人数最多的国家。
不久前,芬兰阿尔托大学的几位研究员在Nature上发表了一篇论文,简单总结一下就是:研究员们观察了5个最广泛使用的全球人口数据集,发现地方的人类可能比我们知道的还差了有十几亿。
他们是这么算的:研究员先是统计了来自35个国家的307个大坝附近的搬迁人数。用这个数据有几个好处:
- 搬迁会涉及补偿,群众的参与度就会高。
- 需要补偿,政府也会出具详细的金额记录,数据可靠性比较有保证。
- 搬迁的范围是固定的,对于区域划分就很清晰。
在搜集了这些大坝的搬迁数据后,研究员建立了一个独立数据集,再和那5个传统的网格人口数据集做了对比,发现即使是误差最小的Waterpop,依然低估了53%的人口。
当然,大坝搬迁影响的是全球人口密度较低的农村地区。但是根据世界银行的数据,农村人口占据世界人口的比率也43%左右。就算保守估计全球40%的人口数据偏差了50%,总人口的偏差也有20%。带入80亿人口的话,偏差也是10亿的数量级了。
论文的内容大概是这些,当然这只是一个十分粗略的估算,实际情况要复杂得多,偏差或许还不止这些。
人口统计的真正价值:不在于精确,而在于趋势
如果只是因为它不精确,就认为它没必要,那就混淆了人口统计的真正目的与价值。
事实上,各个国家进行人口统计的目的,并非是为了获得一个准确无误的瞬时快照,而是希望通过它了解社会发展的宏观趋势与动态。
它是资源分配、政策制定、基础设施规划的基石,更直接关联着粮食安全、教育公平和养老体系的可持续性。
正因如此,就算人口统计困难重重,就算在工程上的绝对准确几乎不可能实现,我们还是会不断完善人口统计的方法,尽力减少误差。
地图上到底有多少个人?这个问题的答案不必等待上帝揭晓,因为它本就是人类自我探索、规划未来的必答题。
统计方式 | 特点 | 适用地区 |
---|---|---|
问卷式普查 | 最普遍,费时费力,数据准质性较高 | 大部分国家和地区 |
滚动式普查 | 美国特色,实践中仍有问题待解决 | 美国等 |
登记式普查 | 最费钱,适合小而富裕的国家 | 北欧、新加坡等 |