《灰色收入與居民收入差距》之二:收入差距真相
【網絡版專稿】
二、調查分析:我國城鎮居民真實收入和收入差距
1.對高收入居民的收入水平估計過低
目前,我國的收入分配狀況信息主要來自國家統計局的城鎮和農村住戶抽樣調查。迄今為止,這兩項調查是國內樣本量最大、跟蹤歷史最久、權威度最高的調查。但是有跡象說明,目前國內各類收支調查,包括上述調查在內,都在不同程度上低估了高收入階層居民的收入水平,從而低估了收入差距。
其主要原因有二:一是對高收入戶調查特別困難,拒訪率高,導致樣本中真正的高收入戶大量遺漏、覆蓋率過低;二是高收入戶對其收入的記載和陳述失真程度大,低報收入的情況相當普遍。特別是當涉及從非正常渠道獲得的收入時,通過常規方法的收入調查幾乎無法獲得真實信息。所謂從非正常渠道獲得的收入,指的是非法收入、違規違紀收入、按照社會公認的道德觀念其合理性值得質疑的收入,以及其他來源不明的收入。在本文中這些收入將統稱為灰色收入。(注3)
對高收入居民收入水平估計過低的一個證據,是高收入居民的收入水平與直觀感覺差距很大。根據統計數據,2005年城鎮10%最高收入家庭的人均可支配收入還不到2.9萬元,這與目前家用汽車、商品住宅等高值商品的普及率、房地產市場上的強勁購買力以及其他方面高收入居民表現出來的消費、投資能力不相稱。
對高居民收入水平估計過低的另一個證據,是根據居民家庭人均收入推算的收入總額占國民總收入(GNI)的比重過低。根據國家統計局2005年城鄉居民收支調查,城鎮居民人均可支配收入11089元(注4)、農村居民人均純收入3255元。城鄉人口分別按5.62億和7.45億人計算,城鄉居民收入總額為8.66萬億元,僅占當年GNI的47%。這個比例不僅低于世界上大多數國家,而且也低于國家統計局資金流量表中住戶部門可支配總收入占國民總收入的比例。以《中國統計年鑒2006》公布的2003年資金流量表數據為根據,2003年住戶部門可支配總收入為7.41萬億元,占2003年國民總收入的55%。這兩個比重相差8個百分點。
此外,根據作者對世界上56個國家數據的分析,絕大多數國家的居民可支配收入總額占GNI的比重都在50%-70%之間(例如,印度、英國、德國都是65%,巴西59%,智利69%,美國73%)。少數比重低于50%的國家大體上分為兩類,一類是少數歐洲福利國家,有大量國民收入進入社會保障賬戶,不計為居民可支配收入;另一類是像沙特阿拉伯這樣有豐厚石油收入但未轉化為普通居民收入的國家。中國不屬于兩者中任一種情況,說明很可能是低估了居民收入。與居民家庭人均收入數據相比,資金流量表提供的數據可能更真實。但可惜,后者沒有分收入等級的數據。
對高收入居民收入水平估計過低的第三個證據,是根據收入調查計算的居民儲蓄不足以解釋儲蓄存款和各項投資的實際增長。按照2005年城鄉居民收入和消費統計數據計算,城鎮居民人均可支配收入與消費性支出的差額是2550元,農村居民人均純收入與消費性支出的差額是700元。推算城鄉居民2005年儲蓄總額為1.95萬億元。
而事實上,2005年僅城鄉居民在金融機構的儲蓄存款就增長了2.15萬億元。同年全國新發行各種債券1.6萬億,其中個人認購部分占相當比重。在直接投資中,僅農村個人固定資產投資就接近4000億元,城鎮居民的直接投資肯定超過農村。如果再加上居民在股票市場上的投資、在海外的儲蓄和投資以及手存現金的增加,居民實際儲蓄會大幅度超過統計推算得到的儲蓄。
上述情況說明居民收入可能被大幅度低估了。而這會嚴重影響對國民收入分配實際狀況的判斷。但是,僅僅根據以上粗略的推算,我們還不能得出具體結論。因此對居民收入分配的真實狀況進行調查和研究是十分必要的。
2.關于居民真實收入的調查:方法和樣本分布
要對居民真實收入進行調查和推算難度很大。在本項研究中,我們試圖通過社會學的調查方法取得一系列居民消費特征參數,并用以對現有的居民收入數據進行校正,從而對各收入階層的真實人均收入進行初步的推斷。
經驗證明,關于涉及個人隱私的問題,通過正規渠道收集信息有很多困難并產生較大的失真,但通過非正式的個人渠道常常可以獲得比較真實的信息。這是社會學調查經常使用的方法。例如,費孝通著名的《鄉土中國》就主要是通過對自己家鄉親朋友好的調查形成的。
基于這個想法,本項研究通過一批專業調查員,于2005年和2006年分兩次對他們各自居住地屬于不同職業、不同收入階層的親屬、朋友、關系密切的同事和鄰里進行個別訪問,總共在全國范圍獲得2147份城鎮居民家庭實際收入和消費情況的問卷。問卷中包括不同來源的全部家庭收入基本情況,以及各方面生活消費支出的情況。由于調查員熟悉調查對象的家庭基本情況并有良好的信任關系,并且基于對原始數據嚴格保密的承諾,所收集的數據應該說比較真實地反映了被調查者的實際收入和消費狀況。
需要說明,這項調查的目的并不是要用調查樣本家庭的收入狀況推算我國城鎮居民的總體收入分布狀況,而是采集不同收入等級居民的收入和消費特征參數,用以檢驗和校正現有的城鎮居民收入數據。相對于中國龐大的人口規模而言,這項調查樣本數量有限,而且調查所采用的特定社會學方法不同于常規的統計抽樣方式,因此不能用來直接推斷全國總體的收入水平和收入分配狀況。這項調查的目的只是取得被調查者真實可信的收入和消費數據,分別計算不同收入水平居民的恩格爾系數和其他若干消費特征參數,并參照統計局住戶調查各樣本組別的消費特征參數分別組成參照組,使用這些參數與收入水平之間的對應關系對現有的統計局各組別居民收入數據進行檢驗和校正。
經濟學已有的大量研究證明,居民的恩格爾系數(食品消費占全部生活消費支出的比重)與他們的收入水平之間存在相當確定的關系,收入水平越高,恩格爾系數越低。因此在滿足一定樣本量的情況下,一定的恩格爾系數能夠反映一定的真實收入水平。在參照組的消費特征參數及其與收入水平的關系真實可信的情況下,如果參照組與對象組具有相同的平均恩格爾系數,但兩者的平均收入水平存在顯著差異,則說明對象組的平均收入可能偏離了真實水平。據此,我們可以就對象組數據失真的程度進行推斷和校正。
按照這一方法,本項研究并不要求調查樣本的收入分布對全國總體收入分布狀況具有代表性,而只要求不同收入水平各樣本的收入和消費數據真實可信,因而能夠在此基礎上建立消費特征參數與收入水平之間可信的對應關系。
本項調查樣本取自全國27個省市自治區的城鎮居民,包括27個省會城市和直轄市、22個地級市、以及14個縣級市、區和縣。考慮到我們重點關注的高收入居民在大城市的分布比較集中,因此調查樣本覆蓋了全國大多數大城市(省會城市和直轄市),同時適當兼顧了中小城市和縣鎮。調查總共取得問卷2 147份。經過多項檢驗,剔除了可信度不足的問卷93份,獲得有效問卷2 054份。調查樣本的地域分布情況見表1。調查對象的職業、工作單位和學歷分布見表2。
表1 調查樣本的地域分布
省份 |
樣本數 |
省份 |
樣本數 |
省份 |
樣本數 |
省份 |
樣本數 |
北京 |
94 |
黑龍江 |
44 |
河南 |
48 |
貴州 |
43 |
天津 |
43 |
上海 |
128 |
湖北 |
127 |
云南 |
50 |
河北 |
83 |
江蘇 |
76 |
湖南 |
43 |
陜西 |
117 |
山西 |
43 |
浙江 |
103 |
廣東 |
164 |
甘肅 |
100 |
內蒙古 |
63 |
福建 |
104 |
廣西 |
70 |
寧夏 |
54 |
遼寧 |
122 |
江西 |
63 |
重慶 |
58 |
新疆 |
44 |
吉林 |
54 |
山東 |
63 |
四川 |
146 |
合計 |
2147 |
注:本項調查主要由上海勺海市場調查公司執行。調查地點包括如下城市和縣:北京、上海、太原、濟南、西寧、銀川、烏魯木齊、南昌、西安、長沙、沈陽、武漢、石家莊、長春、天津、重慶、鄭州、哈爾濱、蘭州、廣州、南寧、杭州、呼和浩特、福州、成都、南京、貴陽、昆明、賀蘭縣、松江縣、上饒市、武寧縣、定陶縣、聊城市、泰安市、鹽城東臺、徐州郊區、惠州市、湛江市、廣州郊區、舞鋼市、大城縣、保定市、陽新縣、萬盛縣、雙橋縣、豐都縣、攀枝花市、青白江縣、薊縣、白山市、海拉爾市、烏盟市、平湖市、嘉興市、蘭溪市、余姚市、寧海市、奉化市、廈門市、泉州市、漳州市、詔安市、福清市。
表2 調查對象的職業、工作單位和學歷分布
職業 |
分布 |
工作單位 |
分布 |
學歷 |
分布 |
專業技術人員 |
13.8% |
黨政機關 |
4.3% |
小學 |
1.7% |
其他專業人員 |
8.2% |
文教衛生科研文藝團體 |
3.5% |
初中 |
12.2% |
黨政干部/軍人 |
4.4% |
其他事業單位/社會團體 |
8.5% |
高中 |
42.1% |
企事業單位/社會團體辦事及管理人員 |
22.8% |
國有企業 |
24.1% |
大學 |
43.2% |
工人/服務人員 |
17.7% |
股份/私營/合伙企業 |
31.0% |
碩士/博士 |
0.8% |
個體戶/自由職業者 |
18.1% |
三資企業 |
3.4% |
||
企業所有者/合伙人/股東 |
5.6% |
個體/自由職業 |
19.7% |
||
其他職業 |
6.5% |
其他 |
5.7% |
||
退休/無業 |
1.9% |
||||
合計 |
100% |
合計 |
100% |
合計 |
100% |
注:各項分布均按家庭中收入最高的家庭成員計算。
3.取得消費特征參數和校正數據
作者對2005年和2006兩個年份的調查數據(分別為2004年全年和2005年全年居民收入和消費數據)進行了合并。為了使數據具有可比性,對2005年樣本的收入和消費數據根據城鎮居民消費價格指數進行了調整,轉換為2006年不變價格數據。對合并后的調查樣本按居民家庭人均可支配收入進行排序,然后根據恩格爾系數進行分組匹配,形成了7個參照組,分別對應于國家統計局城鎮居民住戶調查樣本的最高收入組(占城鎮居民家庭總數的10%)、高收入組(占10%)、中上收入組(20%)、中等收入組(20%)、中下收入組(20%)、低收入組(10%)和最低收入組(10%)。‘
通過匹配,使每個參照組的平均恩格爾系數與統計局各樣本組(以下稱之為“對象組”)的恩格爾系數兩兩相等。根據“在相同經濟背景下具有相同恩格爾系數的兩組居民,應當具有大體相同的收入水平”這一判斷,將具有同等恩格爾系數的參照組和對象組的人均收入和消費數據進行比較,取得了如下初步結果(見表3):
表3 調查樣本和統計局住戶樣本的2005年人均收入比較(元)
最高 |
高收 |
中上 |
中等 |
中下 |
低收 |
最低 |
合計 | |
樣本分布a |
10% |
10% |
20% |
20% |
20% |
10% |
10% |
100% |
恩格爾系數b |
0.280 |
0.343 |
0.364 |
0.388 |
0.419 |
0.448 |
0.474 |
|
參照組收入水平(1) |
140 764 |
34 569 |
23 863 |
15 184 |
10 401 |
7 208 |
3 377 |
26 500 |
對象組收入水平(2) |
28 773 |
17 203 |
12 603 |
9 190 |
6 711 |
4 885 |
3 135 |
10 493 |
(1)/(2) |
4.89 |
2.01 |
1.89 |
1.65 |
1.55 |
1.48 |
1.08 |
2.52 |
注:a. “樣本分布”是指按照統計局樣本,各收入組居民家庭數占城鎮居民家庭總數的比例。
b. 由于采用由低到高遞推的方法,最高收入組的平均恩格爾系數為0.291,略高于統計局樣本;其他各收入組的平均恩格爾系數均與統計局樣本一致。
資料來源:國家統計局(2006)、課題調查樣本數據。
根據恩格爾系數進行匹配,將參照組和對象組的人均收入相比較,可以發現,盡管各對應收入組別的恩格爾系數都一致,但只有兩個對應的最低收入組的人均收入水平非常接近,只相差8%。其他各組別兩樣本的差異都非常顯著,統計局樣本收入無例外地低于調查樣本。而且,這些差異具有明顯的規律性,隨收入水平而呈階梯形上升趨勢。兩個最高收入組的差距最大,最高收入組參照組的人均收入水平是14萬元,對象組則不到2.9萬元;兩者相差4.9倍。
人均消費水平也存在類似的情況,調查樣本與統計局樣本的差異呈階梯形上升,只是差額的幅度較小。兩個最高收入樣本組的人均消費水平分別為5.3萬元和1.9萬元,兩者相差2.8倍。
以上規律性在其他消費支出方面也表現得非常明顯。以最低收入組來看,兩個樣本的各項支出相差不多,有些項目前者高一些,有些項目后者高一些。但其他各收入組相比較,基本上都是調查樣本高于統計局樣本,而且收入越高的組別,差別越大(見表4)。
表4 調查樣本和統計局樣本2005年各項消費比較
(調查樣本數據與統計局樣本數據之比)
最高 |
高收 |
中上 |
中等 |
中下 |
低收 |
最低 | |
人均消費比例 |
2.79 |
1.96 |
1.71 |
1.58 |
1.56 |
1.47 |
1.09 |
人均食品支出比例 |
2.53 |
1.84 |
1.59 |
1.49 |
1.50 |
1.41 |
1.02 |
人均外出就餐支出比例 |
2.70 |
2.09 |
1.94 |
1.84 |
1.54 |
1.48 |
0.67 |
人均服裝支出比例 |
2.37 |
1.49 |
1.37 |
1.13 |
1.07 |
0.99 |
0.77 |
人均醫療支出比例 |
1.80 |
0.98 |
1.25 |
1.45 |
0.97 |
1.29 |
1.20 |
人均交通通信支出比例 |
2.16 |
1.79 |
1.57 |
1.62 |
1.58 |
1.63 |
1.34 |
人均教育支出比例 |
1.83 |
1.36 |
1.37 |
1.48 |
1.87 |
1.69 |
1.21 |
人均旅游支出比例 |
5.84 |
3.79 |
1.91 |
2.61 |
2.50 |
1.59 |
0.35 |
人均自有住房面積比例* |
1.38 |
1.22 |
1.08 |
0.94 |
0.77 |
0.78 |
0.66 |
人均家用汽車比例 |
3.79 |
3.33 |
1.96 |
2.00 |
0.91 |
0.36 |
2.77 |
注:*人均自有住房面積的兩組數據口徑有所不同。統計局樣本為2004年建筑面積數據(但其他各項均為2005年數據),調查樣本為2005年使用面積數據。因此如果轉換為同一口徑數據,兩個樣本之間的差異會更大。
資料來源:同表3。
根據以上情況,我們可以初步判斷:除最低收入組以外,統計局城鎮居民住戶調查樣本都可能在一定程度上有低報收入的傾向。其中,最高收入組的居民對收入有大幅度的低報。這一判斷是否可信?這從下面的調查結果可以得到相當程度的證實。
在調查問卷中,我們設計了如下問題:“如果一個不認識的統計局調查員來找您進行家庭收入和消費調查,您愿意把您的家庭年收入全都如實告訴他嗎?如果不愿意,您愿意告訴他/她的收入是多少?”
我們發現,中等以下各收入組的多數人愿意報告真實收入;其中最低收入組只有31%的人表示不愿意如實報告收入,而這其中還有一部分人是傾向于多報收入(因為他們認為收入太低“面子上不好看”)。在少報和多報兩相抵消后,最低收入組表示愿意報告的收入略微超過了實際收入。但隨著收入水平的提高,隱瞞收入的傾向和隱瞞的程度都明顯上升。其中的最高收入組中有高達70%的被調查者表示不愿意報告真實收入(見圖3)。他們表示愿意報告的收入平均只相當于他們真實收入的34%。
圖3 各收入組中有多少人不愿報告真實收入?
資料來源:調查樣本(有效樣本數:2052)。
上述調查結果說明,本報告前面關于高收入居民的實際收入存在嚴重統計遺漏的判斷是符合實際的。不過上面的校正數僅僅是一個粗略的初步結果,可能存在誤差,需要進一步核實;而且如果相信我國國民總收入數據基本準確,那么用上述調查數據推算,得到的居民可支配收入總額占國民總收入的比例偏高。這有以下幾種可能的原因:
第一,關于居民收入的統計調查除了可能存在對高收入居民的遺漏外,也會存在對低收入居民的一定程度遺漏。因此就對人均收入水平的影響而言,這可能在一定程度上抵消高收入居民遺漏帶來的影響(但程度較小)。
各種居民收入調查,包括本項調查在內,都有可能遺漏一些特定的人群,包括因身體、智力殘疾和疾病而影響閱讀、聽力、書寫、記賬和語言交流能力的人,文盲和半文盲,流動人口,生活不能自理的老年人等等。因為這些人很難順利地接受調查和提供所需要的信息。而這些人中,有相當大的比例屬于低收入人口或者依靠救濟生活的貧困人口。
最新的抽樣調查結果顯示,我國殘疾人占總人口的比重為6.34%。而如果采用更嚴格的國外標準,這個比例有可能達到10%(第二次全國殘疾人抽樣調查領導小組、國家統計局,2006)。而一項更早些的調查顯示,在殘疾人中有超過五分之一是貧困人口(中國殘疾人聯合會扶貧處,1998)。在此外根據衛生部2003年的調查,我國城市居民慢性病患病率為17.7%(衛生部,2006)。而在城鄉居民家庭收支調查樣本中,殘疾人和慢性疾病患者比例都非常低,說明這兩類人大部分都沒有被包括在統計局樣本中。在我們的調查中沒有采集健康狀況的信息,但估計也會對上述人群發生很多遺漏。
根據以上信息,我們不妨近似地假定上述這些被遺漏的殘疾或患病的低收入人群占城鎮人口的比例大約為10%,他們的人均收入相當于最低收入10%居民家庭的平均收入,那么把這些人計算在內,需要進一步把城鎮人均收入水平從上面的估計下調8%左右。由于分組的變動,每個收入組的人均收入也都需要進行相應的調整。
第二,我們的居民收入調查樣本較小,雖然所覆蓋的城市面相當廣,但為了獲得真實信息而采用了定向調查方法而不是隨機抽樣方法,這可能會帶來某種程度的估計偏差;另外,收入和支出數據來自被調查者的記憶和逐項估計,而不是來自詳細的收支賬目。這些也會影響到推算數據的準確度。
根據世界各國居民可支配收入占國民總收入的通常水平來考慮,我國城鎮居民2005年的人均可支配收入可能在接近2萬元的水平。在對低收入居民的統計遺漏進行了調整后,調查的誤差因素有可能導致所估計的平均收入水平偏高20%-30%。
考慮到這些因素,作者假定低收入人口統計遺漏的因素對所估計的收入水平有8%的影響,調查誤差因素有25%的影響,兩者綜合考慮,將除了最低收入組以外的各組調查樣本收入數據都按31%的幅度做同樣的下調(最低收入組只調整8%),據此計算各收入組的人均收入水平。
4.關于城鎮各組別居民收入的推算結果
在進行了上述調整后,城鎮人均可支配收入為1.96萬元(而原有統計局數據是1.05萬元)。其中,10%城鎮最高收入家庭的人均可支配收入是9.71萬元(而在原有統計局樣本中是2.88萬元)。這一組居民的人均收入下限大約在4萬元。城鎮最高和最低10%收入組之間的收入差距是31倍(而在統計局原有樣本中兩者的差距只有9倍)。調整后的各參照組收入數據,及其與統計局樣本數據的比較,在圖4中表示。按家庭年收入計算,10%城鎮最高收入家庭的平均年收入為25.6萬元,下限約為10.5萬元。
圖4 校正前后的城鎮的各階層居民收入統計數據比較(2005年)
注:各居民收入組占城鎮居民戶的近似比重是,最高收入組、高收入組、低收入組、最低收入組各為10%,其余三組各為20%。
資料來源:同表3。
從圖4可以看到,目前關于城鎮居民收入統計的主要遺漏發生在10%的城鎮最高收入居民,約占全部遺漏收入的四分之三。這部分居民的實際收入遠遠高于原有的統計水平。這一情況將不但使實際的城鎮居民收入差距遠遠大于原來的估計,也會使實際的全國居民收入差距遠遠大于原來的估計。
本項調查只涉及城鎮居民。關于農村居民的實際收入水平,我們目前還沒有進行調查。但農村居民中,高收入者比城鎮少得多,統計遺漏也相應會比較小。在與農村低收入居民可能發生的統計遺漏相抵消后,我們假定農村居民人均收入可以基本保持不變。
如果我們近似地用城鎮20%高收入家庭(約占全國家庭數的10.2%,他們2005年的人均收入調整后約6.05萬元)和農村20%低收入家庭(約占全國家庭數的9.8%,仍按統計局數據,2005年人均收入約1100元)的收入水平來代表全國10%最高收入和10%最低收入家庭的人均收入,那么這最高和最低收入的兩組家庭之間,實際人均收入差距大約是55倍,而不是根據原來的收入統計數據推算得到的21倍。
本報告后面的部分,將對這些估計進行進一步的驗證。如果根據以上這些估計來推算,2005年全國居民收入總額應當是13.5萬億元,約占當年國民總收入的73%,與美國2005年居民可支配收入占國民總收入的比例相同(但國民總收入也有可能需要相應調整;這樣的話,居民收入占國民總收入的實際比例可能低于這里計算的73%)(注5)。
而根據現有的統計局城鄉家庭收支調查數據推算,2005年全國居民收入總額只有8.7萬億元,占國民總收入的47%。前者比后者多出4.8萬億元。根據上面的推算結果,我國城鎮居民內部、城鄉之間以及全國居民收入分配差距都顯著大于原來的數據。
另外,根據上述調查推算,城鎮居民的平均儲蓄率也需要作大幅度的上調,大約需要從根據現有的城鎮居民收入和消費統計數據推算的24.3%調整到41.2%。其中10%城鎮最高收入居民家庭的儲蓄率超過60%。■
相關文章
「 支持烏有之鄉!」
您的打賞將用于網站日常運行與維護。
幫助我們辦好網站,宣傳紅色文化!