印度的人口年齡分布為何每五年出現一個高峰?

今天正好心血來潮想看看各國的人口情況,然後在看到印度的人口年齡構成時非常不解。具體請見下圖:
其中深藍和深紅是2010年印度男女的人口年齡分布,然後可以發現,在二十歲以上的印度人中間,每隔五年呈現出的一個周期性的生育高峰非常明顯。可以對比中國,美國,日本的人口年齡分布。中國的分布雖然不均勻但是可以解釋(政策性原因,三年災害),印度的這種五年一大年的情況究竟是怎麼回事呢?

是不是印度本身有擇年份而生的習俗,並且影響非常大?(類似於中國生龍年寶寶這種)還是有什麼其他原因。這樣的人口結構,對社會不會造成巨大的影響嗎?

數據來源:印度統計局
Census of India : Population Enumeration Data (Final Population)


@藕粽的回答是正確的,這個問題的答案就是Digital preference。印度人口的奇怪形態就是因為記不清自己的生日而產生的誤報。

人口普查中,有一個專門的名詞,叫Whipple指數,範圍在100到500之間,度量的是年齡尾數在0和5的集中程度。在精確度較為良好的人口普查中,Whipple指數一般在100左右,即以0和5結尾的年齡人數等於每個年齡的平均人數;當Whipple指數等於500時,代表0和5結尾的年齡人數等於每個年齡的平均人數的五倍——此時所有人的年齡都以0和5結尾。一般來說,Whipple指數和普查質量的關係如下表所示:


印度就是那種普查質量最最最低的國家。在2011年的人口普查,印度的Whipple指數是171,在差的範疇內,說明報告了0、5結尾的年齡的人數是平均人數的1.71倍。

大家不要笑,由於印度在2011年普查中採取了記錄出生年份的方法,這個數字比起2001年普查的230已經有了長足進步了。從下圖可以看出,儘管2011年的0、5結尾(除了0、5之外,印度人還偏好2、8結尾。這是 @呆濤 提到的偶數偏好,但印度人不喜歡4和6)的凸起仍然很嚇人,但比起前兩次普查,確實已經好了很多。

Digital preference的原因十分複雜。

Digital preference的原因十分複雜。 @藕粽 說到了文盲比例,這當然是一個重要因素,比如下圖是印度各邦在2001年的識字率和Whipple指數,可以明顯地看到識字率越高的地區Whipple指數越低。

但我們也可以發現,對於識字率達到了90%以上的Kerala邦,Whipple指數仍然高達140,處在差的範圍內。而中國在1953年的第一次人口普查時,文盲率高達80%,普查的Whipple指數卻仍然只有102,數據質量十分優秀。因此,能否記住自己的生日,文盲與否會在一定範圍內起到作用,但還有別的重要因素。

但我們也可以發現,對於識字率達到了90%以上的Kerala邦,Whipple指數仍然高達140,處在差的範圍內。而中國在1953年的第一次人口普查時,文盲率高達80%,普查的Whipple指數卻仍然只有102,數據質量十分優秀。因此,能否記住自己的生日,文盲與否會在一定範圍內起到作用,但還有別的重要因素。

生肖無疑算是一個因素。漢族的生肖系統結合自我報告的年齡,一般就可以把出生年份給推定精確了。在歷次人口普查中我們都可以發現,不管文盲與否,漢族人口都能精準地報告自己的生辰,而一些少數民族的報告就不那麼準確。例如維族和藏族的Whipple指數都在110以上,其中維族的Whipple指數在1990年高達130。下圖表示2010年普查的維族人口年齡結構,我們也能發現在0、5結尾處明顯的凸起,雖然沒有印度那麼強烈。


但生肖也不能解釋所有偏差。如果只算獸歷,那麼維族一樣有獸歷,印度其實也有,大家都有12隻野獸,為什麼漢族特別擅長記住自己的年齡呢?對生死的態度,可能算是另一個原因。中國的傳統視生死為大,對這兩個日子都記得很精確。一般墓碑上的生卒年是必不可少的。大一些的家譜裡面,即使是最默默無聞的人,一般也有這樣幾個信息——哪年生的,老婆是誰,哪年死的。

印度對生死有著什麼樣的傳統,我不太清楚,但是印度普查局在辯解年齡數據報告為什麼那麼不準確時,有一句話倒是讓人印象深刻:

In country like India, the distortions are naturally greater because precise determination of age is not considered important in everyday affairs.
在印度這樣的國家,(普查中的年齡)偏差較大,是因為精確判斷年齡在日常生活中並不被認為是一件重要的事。

到底有多不重要?我還是難以體會,直到算出這麼一幅圖。

上圖是印度某個人群在2004年小普查中的人口年齡結構。不出意料,波瀾壯闊呀。在0、5結尾的年齡非常高,在2、8結尾的年齡也比較高,在其他年份的人口幾乎減半。

上圖是印度某個人群在2004年小普查中的人口年齡結構。不出意料,波瀾壯闊呀。在0、5結尾的年齡非常高,在2、8結尾的年齡也比較高,在其他年份的人口幾乎減半。

但問題是,這批人是印度的大學畢業生和研究生,他們是印度學歷最高的一群人,僅佔印度總人口比例的4%不到,和文盲、不識數或者記性不好怎麼也沾不上邊。連這批人都記不住自己的生日,除了訴諸文化,我還真的想不到有什麼別的解釋了。


Digital preference. 這在文盲率較高的地區是常見現象。人們常常沒能確切記錄出生年月,在人口普查的時候按照約數(通常是 5、0 結尾)回答年齡。這跟具體的普查年份無關,任何時候普查都會有以 5、0 結尾的年齡為跳躍的現象。

==================================

補充

@呆濤 給出的 Whipple"s Index 是量度 age reporting 準確度的一個常用指數,昨天回答的時候沒想起來。但是有幾點值得注意:

1- @呆濤 給出的公式是用來測量 5、0 偏好的,但相似地可以構建別的數字偏好的公式。
2- 該指數只包含了 23 到 62 歲的年齡分布,也就是 25±2 到 60±2 的分布,Whipple 認為線性假設(見 3)對高齡組和低齡組不適用。
3- 該指數有一個重要假設:五歲年齡組內年齡分布為線性。如果有外生變數起作用,這個指數的效用就存疑。

根據 @呆濤 回答里的公式和題主給的印度普查數據(表 C-13),印度 2011 年普查全國的 Whipple"s Index (5、0 偏好)是 171.04,農村地區為 180.52,城市地區為 152.88。表 C-13 是分邦、分性別、分城鄉的,可以計算更多的 Whipple"s Index。

@呆濤 還提到文盲率解釋的問題。文盲率和這個現象(或者說 Whipple"s Index)高度相關應該是個安全的說法,但文盲率(或者社經發展程度)的確是一個略顯 remote 的原因。不過話說回來,用「缺乏相應的計數方式 」「對於數字敏感程度」來解釋這個現象有點兒 tautologic。

另外,就像 @chenqin 指出的那樣,如果要用文盲率來解釋這個現象,還需要在地區內部的歷史維度和地區間的比較維度上提出更合理的機制。


部分同意 @藕粽 的答案 (Digital Preference完全正確! 但是我認為不止是跟文盲率相關的現象).

反對 @孫毓波 的答案 (太主觀).

有個叫 George Chandler Whipple 的人發現的一個現象, 進而統計的一個參量. Whipple"s Index 可以用來量度人口普查的可信度. 該參數越大則越不準確. 原因就是參數越大的地區 缺乏相應的計數方式 (不只是文盲, 而只是對數字不敏感), 導致人們很隨意的round up 或者 down自己的年齡. 比如說28歲會說自己 "二十多", 進而就填25 或 30. 另一個例子是偶數偏好.

這個指數就類似於"強迫症調電視音量一定要調到25或者30!!! 28 是個什麼音量??!"


這個Index不代表文盲比例, 我認為最貼切的描述是"普通民眾對於數字敏感程度".
就算有人不是文盲, 但是他就是傾向於把自己年齡報成個整數 (19 報 20, 31 報 30).
不是每個人都對於年齡如此敏感.


我的父親為了工作項目年齡改過好幾次, 在二代身份證之前我父親的生日甚至是根據農曆算的, 二代身份證的時候才現編了一個生日 (所以我這個不孝子每年都不給他慶生... ...T.T).

演算法和參照表格如下:

Nx 表示 滿了X歲的人口數量

Whipple"s Index 對照量表.

Whipple"s Index 對照量表.


引用: http://ijphjournal.it/article/download/5630/5372


WIKI如下:
Whipple"s Index (ano... 請各位自行google/baidu/維基... 因為維基百科的網址中間有個 " 號 把網址分開了於是知乎識別不出來了...)

關於India的報道如下:
Whipple』s Index shows Indians are lying less about their age
摘圖:


2001 年的指數大概在170 ~200 之間浮動 (尼瑪數據純粹不可信啊...)
2010 沒找到平均值. 題主你的數據里應該給出來了, 或者有哪位Demography 大神來指導一下.. 我根據最高最低估算了一下大概是個125 - 175的區間吧(也就是Bad那一欄). 說明還是很明顯的傾向性.

補充: 目前只有一個民族/國家的人口普查Whipple"s Index 基本對不上號, 乃我大漢族!
我大漢族因為十二生肖的事情導致成為了最有名的Whipple"s Index NOT apply 的典範!!



需要明白的是,印度的人口普查人員調查的是一個人的報告年齡(reported age),而不是真實年齡(actual age)。印度人也沒有這麼奇怪的理由或習俗要在某一年生一大堆小孩。在人口普查時,通常是一個家長報告所有成員的年齡,所以他們為了方便,一般都是報五的倍數。

從2011年的年齡數據可以看出,從年齡10,12,18,20以後開始,每隔5年就有一個人口高峰。有意思的是,Kerala地區誤報年齡的數量是比其他地區少得多的,因為該地區居民的整體受教育程度比較高。

其實為什麼印度人口普查年齡人口為什麼那麼不精確呢?有諸多原因。

人口普查會問年齡,這很不靠譜,因為有人把出生那一年當作0歲,有人則把它當作1歲。其實這個問題在哪個國家都有,包括美國,但是在印度,這問題相對嚴重一點。印度已經逐漸採用詢問出生日期的方式做調查。

因為日常生活中,印度人就覺得沒必要報告準確的年齡(而中國人喜歡談論生肖,所以相對準確很多)。所以由於這些社會和文化等原因,在人口普查時,印度人喜歡報0或者5結尾的年齡,另外他們也喜歡偶數(從上圖也可以看出,偶數年齡人口也會有小高峰),比如12,18。而老年人,許多根本不知道自己的年齡或者直接報年齡段,比如50-60, 60-70, 70-80。另外,一種很普遍的現象是,許多老人直接虛報一個很大的年齡。這就是為什麼上圖裡面,100歲以上的人也是不少的(比95歲人口高了許多)。

另外,一個比較特殊的人群是婦女。婦女很大比例是文盲,所以她們很難準確地說出自己的年齡/出生日期。在許多地區,年輕婦女是被禁止回答調查員的問題,除非調查員是女的。另外,學齡前的兒童或者輟學兒童是很難統計年齡的。

有意思的是,印度並沒有什麼文化或者社會習俗來紀念生日,尤其是絕大部分的農村地區,壓根就不怎麼重視年齡和生日。而上面也講了,日常生活中也不鼓勵告訴別人準確的年齡。

出生證明,作為印度唯一合法的證明出生的文件,也挺不準確的。有時入學或者參加選舉時,都不檢查出生證明。而在刑事案件中,為了確定一個人是否成年,還需要驗骨頭(ossification test ),特別是青少年罪犯。

參考來源:
http://censusindia.gov.in/Data_Products/Data_Highlights/Data_Highlights_link/introduction.pdf
http://catalyst.nationalinterest.in/2013/09/09/the-age-of-india/


常年在百度印度吧混,也沒聽在印度的中國網友說印度有這個習俗,但是發現一個有趣的事,印度人民院每五年選舉一次。根據印度的國情,我很懷疑這兩個數據間有必然聯繫,不排除為了選舉獲勝而將一些未滿18歲的人的年齡造假成18歲,這樣就人為形成5年一個的高峰,而且20歲以上這個生育高峰才明顯恰好符合18歲才能選舉的情況。


我覺得道理其實很簡單。
印度處於熱帶地區,一年中只會感到熱與非常熱的交替。印度曆法和阿拉伯曆法的一年不是準確的365.2天對與他們而言也沒什麼影響。可見,年和日期對於他們而言對生活的影響非常小。自然,對於年齡也就沒什麼概念了。
而中國出在亞熱帶季風帶,農業受到四季天氣變化的影響很大。所以計算曆法的時候會非常仔細。


我的推斷:統計數據本身有誤

可能的原因是:

1 調查方法有問題
2 數據處理有問題

============================================================

不同意排名第一的藕粽的回答,理由如下:

1 印度是個文盲率較高的國家,這不假,但高的時候也只有30%左右。回來看這個表格,就算這30%的人恰好全錯了,也不會造成如此劇烈的波動。

2 文盲就記不住自己的出生年份嗎?這太奇怪了,他只是文盲而已,會讀寫的字數達不到標準,僅此而已,他不是弱智!他在社會上生存,他起碼他得會數錢吧,1斤羊肉150盧比,1斤雞蛋20盧比……如果連100以內的數都不會數還能算個正常人嗎?就算他真的不記得自己到底是22歲還是23歲,那他最多隨便說一個22或23,難道他還會取個整數說自己20歲或者25歲嗎?就算他是文盲中的腦殘,他不會數22這樣的數,怎麼那麼巧會認得25呢?

3 就算這些文盲真的記不清自己的出生年份,隨便估計了一個,那最終的報表也是相對平滑了。因為誤差都是隨機的,有大一兩年的,也有小一兩年的,在正常人的大基數的基礎上,最終的結果絕不會如此波動。

綜上所述,我覺得印度人口年齡分布曲線異常絕不會是因為文盲率導致的。但真正原因是什麼,我也不知道。


參考電影。中間的時間都跳舞去了。不如跳舞,什麼都不如跳舞……


推薦閱讀:

沒有電腦的時代,大學生在宿舍都幹嘛?
中國目前的大學劇社發展如何?
為什麼很多災難片里說「老人孩子先走」?

TAG:印度 | 社會學 | 數據統計 | 人口學 | 文化習俗 |