對三組數據基尼系數的估算
【內容提要】本文介紹一個粗略估算基尼系數的方法,并根據三組公開的經濟數據,對其基尼系數進行了估算。
1.從三張截圖談起
先看下面 三張截圖:
第一張,是來自于國家統計局2024年2月29日發布的2023年經濟數據。這里把全國居民人均年收入按居民5等份分組。
第二張,是中金公司給出的中國總財富分布數據(分4組)。
第三張,是美聯儲統計的全美總財富的分布數據(分4組)。
面對截圖中的數據,作為外行的我們,能不能設法估量一下國民收入(或財富)貧富差距的大小呢?這就不能不談到基尼系數和洛倫茲曲線。
2.關于洛倫茲曲線
大家知道,基尼系數G是用來衡量某國或某地貧富差距的一個比值。一般認為:G<0.2時居民收入過于平均;0.2-0.3之間時較為平均;0.3-0.4時比較合理;0.4-0.5時差距過大;G>0.5時差距懸殊。
其正規的計算方法是通過洛倫茲(M·O·Lorenz)曲線來進行的(如圖):
要得到這條曲線:(1)首先要通過大量的調查研究,去得知某地全體(或樣本)每一個人的收入數;(2)計算出每個人的收入在總收入中所占的百分比;(3)把這些百分比由低到高排成一行數據;(4)計算這些百分比數據累計之和y ;(5)計算累計人數百分比x ;(6)建立直角坐標系XOY,將這些點(x,y) 一個一個標在坐標系上;(7)積點成線 ,得到圖中的洛倫茲曲線。
然后才能求圖中B、(A+B)、A的面積,計算基尼系數G。如此海量的調查 、統計、計算、繪圖工作,不是專業人士操作電腦,是 很難完成的。
那么,對于非專業的普通大眾,面對別人調查研究后給出的有限數據,有沒有簡單的、粗略的、估算基尼系數的方法呢?這里介紹一個主要用加減乘除的估算方法——“折線法”(當然還有一點技巧)。
3.舉個簡單例子
【引例】假定有100個人平均分成5組,各組人均月收入分別是1、2、3、4、5(千元)。試求其月收入的基尼系數。
萬事起頭難,下面的計算比較瑣細,要耐下心來看。對算法不感興趣的讀者不妨跳過這兩節,直接看最后一節“算法應用舉例”。
(1)首先算人數百分比:各小組都占20%,那么累計百分比依次就是20%、40%、60%、80%、100%。
(2)再算收入百分比。各組收入合計數分別為2萬元、4萬元、 6萬元、8萬元、10萬元,總計30萬元。各組占比分別為:2÷30=6.67%,4÷30=13.33%,20%,26.67%,33.33%。累計收入百分比 依次為:6.67%, 20%,40%,66.67%,100%。
(3)因此,尚未畫出的坐標系中關鍵點的坐標(化成小數后)分別是A(0.2,0.0667)、B(0.4,0.2)、C(0.6,0.4)、D(0.8,0.6667)、E(1,1)。
充分準備后,方可畫出直角坐標系(如圖):
由于數據太少,得不出洛倫茲曲線,只能畫出一條折線(這意味著假定各小組內部成員收入絕對平均)來逼近它。圖中一個三角形和四個梯形的面積之和相當于彩圖中的B的面積。
計算S1=0.0667×0.2÷2=0.0067;
S2=(0.0667+0.2)×0.2÷2=0.0267;
S3=(0.2+0.4)×0.2÷2=0.06 ;
S4=0.1067 ; S5=0.1667 ;
SB=S1+S2+S3+S4+S5=0.3667 。
而 SA+B= 1×1÷2=0.5,
所以 SA=0.5-0.3667=0.1333。
G=SA÷SA+B= 0.1333÷0.5=0.2667。
以上,通過不厭其煩的百分比運算,得出這100個人月收入的基尼系數為0.2667。但這只是用“折線法”計算出來的近似值,它小于真正的基尼系數G(估計能小5%-10%)。
事實上,如果不把人數和月收入數都計算出百分比,而是適當改變一下原始數據,并不會影響計算的結果。比如我們把橫坐標擴大5倍,縱坐標擴大15倍,則得到一個新坐標系(圖略)。那么圖中6個點的新坐標將分別是:O(0,0)、A(1,1)、B(2,3)、C(3,6)、D(4,10)、E(5,15)。在新坐標系中 :
S1=(0+1)×(1-0)÷2=0.5 ; S2=(1+3)×(2-1)÷2=2;
S3=4.5 ;S4=8,S5=12.5,SB=27.5 ; SA+B=(15×5)÷2=37.5。
所以,基尼系數G = SA÷SA+B=(37.5-27.5)÷37.5=0.2667。這樣計算就簡單多了。
4.總結估算方法
從上面例子可以看出,本文介紹的估算方法不僅在于用“折線法”求梯形類面積之和去逼近SB(這是大家都采用的方法),還在于:在兩坐標軸上(人數和收入)的標注方法不拘泥于百分比:(1)既可以用百分比;(2)也可以用原始數據;(3)又可以適當擴大或縮小原數據。這并不會影響計算結果的正確性。用哪種數據計算,僅僅為了方便。
下面把算法步驟總結一下 :
1.題目中一般都按人們收入由少到多把總人數分成了n個小組,并給出了各小組人數以及各小組人均收入數。第一步先要考慮是否改變人數和收入數的原數據(上面三法選一),并確定下來,用新數據進行計算;
2.計算出前若干個小組人數累計數x;
3.計算各小組的總收入數;
4.計算前若干個小組總收入累計數y;
5.寫出未來圖中各點的坐標:A(x1,y1),B(x2,y2),C(x3,y3),……;
6.畫出直角坐標系XOY,標注坐標軸上的刻度,在圖中標出關鍵點A、B、C……,畫出折線及各個梯形等等;
7.計算各梯形類圖形面積S1、S2、…,Sn;
8.計算SB、SA+B、SA和基尼系數G(算法見前面例子)。
5.算法應用舉例
【例1】2024年2月29日,國家統計局發布了許多經濟數據。截圖1是其中的我國2023年“按居民五等分年收入分組”。抄寫數據如下:
低收入20%人口 9215元;中下收入20%人口20442元;
中等收入20%人口32195元; 中上收入20%人口 50220元;
高收入20%人口95055元。
但國家統計局并沒有公布2023年居民收入的基尼系數G。(自2016年后再沒公布過。 據說是因為無法得知某些高收入人士的真實收入,所以計算的基尼系數偏離實際,不宜公布。)
下面,我們試用這些數據估算一下2023年我國居民年收入的基尼系數,看看這個G大概是多少?
(1)首先,這里給出的原始人口數據的各組百分比都是0.2,我們可以把0.2作為標注X軸的刻度,但我們也不妨擴大5倍,令它們都變成1,計算會更簡單(縱坐標Y就用原始數據)。
(2)列表計算(設我國總人口為14億)
(3)寫出未來坐標系中各點坐標:
A(1,9215) B(2,29657) C(3,61852)
D(4,112072) E(5,207127)
(4)畫出直角坐標系以及各圖形:
(5)根據圖形計算SB、SA+B、SA以及基尼系數G:
S1=9215×1÷2=4607.5 ,
S2=(9215+29657)×(2-1)÷2=19436,
S3=45754.5,S4=86962,S5=159599.5.
求和得SB=316359.5, 然后求得SA+B=517817.5, SA=201458 。
所以,估算的基尼系數G=SA÷SA+B=0.38905(明顯偏小!)
【例2】根據截圖2里中金公司報告的數據(不再重抄了),估算中國民間總財富430萬億劃分的基尼系數(國資類360萬億已除外)。
然而,什么是“財富”呢?是使用價值還是交換價值?只是現金、存款和證券?或是包括房地產在內的資產?還是泛指“所有值錢的東西”(包括服務、知識、健康、青春、關系等等)?這些,在經濟學上并無定論。這里的財富大概是指物質方面。但有一點是肯定的:財富不是指年收入,而是指多年(收入減支出后)結余的存量,還有可能是負值。現在不是有個時髦的詞叫“負產階級”嗎?
拋開這一切,我們只估算基尼系數G。
先列表并作圖(用百分比):
計算面積S1=0.0698×0.9262÷2=0.03232
S2=(0.0698+0.3256)×0.0705 ÷2=0.01394
S3=(0.3256+1)×0.0033÷2=0.002187
所以SB=0.03232+0.01394+0.002187=0.048447
SA=0.5-0.048447 =0.45155
基尼系數 G=0.45155÷0.5=0.9031.
可見財富集聚比起收入分配來,基尼系數要高得多!
【例3】截圖3是美聯儲的統計數據(不再重新抄寫),試據此估算截止2021年底全美總財富劃分的基尼系數。
由于大家對計算方法已經比較熟悉,這里只列表不畫圖。
計算如下:
S1=2.65%×50%÷2=0.006625;
S2=(2.65+30.3)%×40%÷2=0.0659;
S3=(30.3+67.8) %×9%÷2=0.04415;
S4=(67.8+99.99)%×1%÷2=0.00839;
SB=0.1251;SA=0.5-0.1251=0.3749;
G=0.3749÷0.5=0.7498。
即:截止2021年底全美總財富劃分的基尼系數約為0.7498.
看完例2和例3,不知你有何想法?
最后再重復一遍:用“折線法”估算出來的基尼系數,比真正的
基尼系數G要小一些。 【全文結束】
「 支持烏有之鄉!」
您的打賞將用于網站日常運行與維護。
幫助我們辦好網站,宣傳紅色文化!