Gini katsayısı

Gelir dağılımının Gini katsayısı (% olarak) (Dünya Bankası, 2018)
  • ≤ 30
  • 30-34.9
  • 35-39.9
  • 40-44.9
  • 45-49.9
  • 50-54.9
  • 55-59.9
  • 60-64.9
  • veri yok
  • Gini katsayısını ve ideal homojen dağılımın (siyah) hesaplanması için gerçek dağılımın Lorenz eğrisi (kırmızı)

    Gini katsayısı veya Gini endeksi bir olan istatistiki İtalyan istatistikçi tarafından geliştirilen önlem Corrado Gini temsil etmek eşitsizlikleri . Çeşitli nüfus gruplarının gelir paylarını gösterir ve bu nedenle bir toplumdaki eşitsizliğin bir ölçüsü olmalıdır. Eşit olmayan dağılım katsayıları herhangi bir dağılım için hesaplanabilir. Örneğin, Gini katsayısı ekonomide, fakat aynı zamanda coğrafyada, tek tek ülkelerdeki gelir ve refah dağılımı için bir ölçüt olarak ve böylece ülkeleri ve ilgili kalkınma düzeylerini sınıflandırmaya yardımcı olarak kullanılır.

    Gini katsayısı Lorenz eğrisinden türetilir ve 0 (eşit dağılımla) ile 1 (yalnızca bir kişi tam geliri aldığında, yani maksimum eşit olmayan dağılımla) arasında bir değere sahiptir. Bir ile tekdüze dağılım değil üniforma dağılımı olasılık anlamda geliyordu ama bir dağıtım varyans en yaygın kullanımı durumunda 0 dır, gelir dağılımı bir ülkede, o her yetişkinin geliri aynı olduğu anlamına gelir ve farklı gelirlerin (sınıfların) eşit sıklıkta olduğu değil.

    Başvurular

    Ekonomi

    Gini katsayısı, özellikle refah ekonomisinde , örneğin servet veya gelir dağılımındaki eşitlik veya eşitsizlik derecesini tanımlamak için kullanılır. Katsayı, AB istatistiklerinde kullanılan S80 / S20 gelir beşte birlik oranına bir alternatiftir.

    Bilgi teorisi

    Gelen bilgi teorisi , bir "saflık" ölçü veya bilginin "safsızlık" olarak kullanılır.

    Makine öğrenme

    Makine öğrenimi alanında, bir karar ağacı oluştururken , Gini indeksi veya daha doğrusu "Gini Gain" olarak da adlandırılan Gini indeksindeki değişiklik, alt düğümlerin bulunduğu karar kuralını seçmek için bir kriter olarak kullanılabilir. olabildiğince "saf". Buradaki fikir, "saf" bir kararla ağacın hazır olmasıdır, bu nedenle Gini endeksini değiştirmek bir ölçü olarak uygundur.

    Bankacılık

    In bankacılık , Gini katsayısı bir ne kadar iyi bir ölçüsü olarak kullanılır derecelendirme sistemi kötü müşterilerden (dan iyi ayırabilirsiniz seçicilik ).

    Normalleştirme

    Olası değerlerin ölçeği, uygulamaya bağlı olarak 0 ile 1 arasında, 0 ile 100 arasında, 0 ile 10000 arasındadır.Uygulamaya bağlı olarak, en küçük veya en büyük değer eşit dağılım anlamına gelir. Mutlak eşitsizliğin değerine genellikle ancak asimptotik olarak ulaşılabilir. Bu, yeniden normalleştirilerek önlenebilir.

    tanım

    Genel dava

    Artan şekilde sıralanmış, ayrı ayrı dağıtılmış bir miktar için (örnek: hane geliri) Lorenz eğrisi şu şekilde verilir:

    Gelir dağılımındaki pozisyon için Lorenz eğrisi bu nedenle toplam gelirin kümülatif payını gösterir. aritmetik ortalamayı belirtir. Düzgün bir dağılımla, 45 derece çizgisi ile Lorenz eğrisi arasındaki alan 0 değerine karşılık gelir ve daha eşitsiz dağılımlar için artar. Bu düşünceden ve aralığa normalize edilmiş bir ölçü elde etme amacından hareketle , Gini eşitsizliği katsayısı , elde edilen alanı geometrik olarak ayrıştırarak şu şekilde sonuçlanır :

    Gerçek bir dağılım için, Gini katsayısı doğrudan aşağıdaki gibi hesaplanabilir (kullanılarak ):

    Verilerin sıralanmasını gerektirmeyen alternatif bir formülasyon, sözde göreceli ortalama mutlak farka dayanır . Ortalama mutlak fark, bir popülasyonda bulunan tüm gözlem çiftlerinin ortalama farkını ifade eder. Bu, ortalama gelirle ilgilidir. Gini katsayısının istenen değer aralığını varsayması için fark 2'ye bölünür:

    Miktarlara dayalı hesaplama

    Bir A kümesinin belirli bir bölümü, başka bir B kümesinin bir bölümüne atanır. Bu, ör. B. İnsanların parası (A) (B) veya şehirlerdeki elektrik tüketimi (A) (B). A'nın homojen, kolayca bölünebilen bir kümeyi temsil etmesi çok önemlidir. Örneğin, bir motorlu araca sahip olmak uygun olmayacaktır çünkü motorlu araçlar ne homojen değildir - bireysel tipler önemli ölçüde farklılık gösterir - ne de küçük birimlere bölünemezler.

    Gini katsayısı, üniform bir dağılıma sahip Lorenz eğrileri ile gözlemlenen dağılım arasındaki üniform dağılıma normalize edilmiş alandır .

    Gini eşitsizlik katsayısı GUK, üniform dağılımın Lorenz eğrisi altındaki alan ve gözlemlenen dağılım için Lorenz eğrisi altındaki alan.

    misal

    A, B'ye dağıtılır, örneğin zenginlik (A) nüfusa (B) dağıtılır.

    50 Prozent von B (b1) wird  2,5 Prozent von A zugeordnet (v1).
    40 Prozent von B (b2) wird 47,5 Prozent von A zugeordnet (v2).
     9 Prozent von B (b3) wird 27,0 Prozent von A zugeordnet (v3).
     1 Prozent von B (b4) wird 23,0 Prozent von A zugeordnet (v4).
    

    İlk adımda, veriler "normalleştirilmiş" olarak görüntülenir:

    b1 = 0,50     v1 = 0,025          v1/b1 =  0,05
    b2 = 0,40     v2 = 0,475          v2/b2 =  1,188
    b3 = 0,09     v3 = 0,270          v3/b3 =  3
    b4 = 0,01     v4 = 0,230          v4/b4 = 23
    

    İkinci adımda Gini katsayısı hesaplanır.

    Gini eşit olmayan dağılım katsayısı (GUK), bir Lorenz eğrisi değerlendirilerek elde edilir .

    Gerçekten bir Lorenz eğrisi üretmek için, yukarıdaki değerlerin yeniden düzenlenmesi gerekebilir. Tüm değer çiftleri önce şu şekilde önceden sıralanmalıdır:

    Yukarıdaki örnekte, doğru sıralama zaten mevcuttur, böylece yeniden sıralamaya gerek yoktur.

    Bir Kartezyen koordinat sisteminde noktalar olarak (x i , y i ) çiftleri girdiğinizde ve ardından komşu noktaları düz bir çizgiyle bağladığınızda , aradığınız Lorenz eğrisi oluşturulur . Çiftlerine sonucu aşağıdaki hesaplama kuralına göre çiftlerine:

    İkinci adımda, aşağıdaki veriler birinci adımın verilerinden toplanarak belirlenir ((0, 0) başlangıçta sabit bir değer olarak eklenir):

    x0 = 0,00     y0 = 0
    x1 = 0,50     y1 = 0,025
    x2 = 0,90     y2 = 0,5    (da 0,5 + 0,4 = 0,9 und 0,025 + 0,475 = 0,5 ist)
    x3 = 0,99     y3 = 0,77
    x4 = 1,00     y4 = 1
    

    Servetin toplam eşit dağılımıyla , Lorenz eğrisi (0 | 0) noktasından (1 | 1) noktasına kadar düz bir çizgidir.

    Gini katsayısını belirlemek için, önce grafik olarak görüntülenen alanlar olan iki miktar belirlenir. Düzgün dağılım çizgisinin altındaki alan bir kez, bu miktarı A diyelim. İkinci alan, gerçek dağılım eğrisinin altındaki alandır, bu miktarı B olarak adlandıralım. Bu iki nicelikle, Gini eşitsizlik katsayısı aşağıdaki gibi hesaplanır:

    B koyu gri alandır; A, açık ve koyu gri alanlardan oluşur.

    Gerçek dağılımın Lorenz eğrisinin y-değerlerinin hesaplanması:

    y0 = 0,000
    y1 = v1 = 0,025
    y2 = v1 + v2 = 0,500
    y3 = v1 + v2 + v3 = 0,770
    y4 = v1 + v2 + v3 + v4 = 1,000
    

    Gerçek dağılımın Lorenz eğrisi altındaki B alanının hesaplanması (aşağıya bakınız):

    (y1 - 0,5 · v1) · b1 = 0,00625
    (y2 - 0,5 · v2) · b2 = 0,105
    (y3 - 0,5 · v3) · b3 = 0,05715
    (y4 - 0,5 · v4) · b4 = 0,00885
    
    B = 0,17725
    

    Standartlaştırılmış bir gösterim kullanıldığından, toplam düzgün dağılımın eğrisi, köşe noktalarını (0 | 0) ve (1 | 1) birbirine bağlar. A alanına sahip üçgen bu nedenle 0,5'tir. Bu nedenle aşağıdakiler Gini eşitsizlik katsayısı için geçerlidir:

    Grafiksel olarak bakıldığında, Gini katsayısı, düzgün dağılım çizgisi ile Lorenz eğrisi (AB) arasındaki alanın, tekdüze dağıtım çizgisinin (A) altındaki alana oranıdır.

    Hesaplamanın açıklaması

    Tüm Gini alanı, yan zamanları olan bir dikdörtgendir . Eşit dağılımın Gini alanı, toplam Gini alanının yarısıdır. Eğrinin altındaki alanı hesaplamak için tüm ayrı alanlar eklenir. Örneğin alın . Yüksekliği ve genişliği olan dikdörtgen (yani, - arası ) tamamen hesaba katılır . Sadece yarım dikdörtgen gider yükseklikten yüksekliğe Gini çizgisinin üzerinde diğer yarısı Gini alana aittir yok gibidir, alınacak. Öyle

    veya

    Alan hesaplamasının alternatif görünümü: Bireysel alan , (x 1 , y 0 = 0), (x 2 , y 0 = 0), (x 2 , y 2 noktalarıyla belirlenen dikdörtgen alan arasındaki farktır ) ), (x 1 , y 1 ) sınırlıdır (içerik :) , eksi dik üçgenin (x 1 , y 1 ), (x 2 , y 1 ), (x 1 , y 2 ) (içerik :) , aynı sonuçla.

    Veri azaltma

    Gini katsayısı, eşitsizliğin dağılımını hesaplamak için kullanılan istatistiksel bir ölçüdür. Bu tür önlemler genellikle az çok karmaşık bir veri setini basit bir anahtar şekle indirger. Bu metrik, doğru kullanılmazsa yanlış yorumlamaya neden olabilir.

    Şekil 1: Farklı Lorenz eğrileri - aynı Gini katsayısı

    Örneğin Gini katsayısı durumunda, hemen hemen her Lorenz eğrisi için tam olarak aynı Gini değerine sahip en az bir başka Lorenz eğrisi vardır. Bu, (0 | 1) ve (1 | 0) noktalarından geçen çizgi üzerindeki orijinal Lorenz eğrisinin aynalanmasıyla elde edilir. % 10 /% 90 miktarları,% 50 /% 50 üzerine dağıtılacaksa, bu, özellik taşıyıcılarının% 50 /% 50 ila% 90 /% 10'u arasındaki miktarların dağılımı ile aynı Lorenz eğrisiyle sonuçlanır. Bu iki Lorenz eğrisi Şekil 1'de gösterilmektedir. Tek istisna, başlangıçtan itibaren bu çizgiye simetrik olan Lorenz eğrileridir.

    İki farklı eğri için ortak bir Gini katsayısı 0,4'tür. Aslında, bir Gini katsayısı için sonsuz sayıda olası Lorenz eğrisi bile vardır (mutlak eşit veya mutlak eşit olmayan dağılım durumu hariç). Bu noktada, Gini katsayısı, büyük miktarda veri biriktirmekten türetilen diğer herhangi bir ölçü ile aynıdır. Gini katsayısı gibi eşit olmayan dağılım göstergeleri, karmaşıklığı azaltmak amacıyla verilerin toplanmasından ortaya çıkar. İlişkili bilgi kaybı bu nedenle istenmeyen bir yan etki değildir. Karmaşıklığı azaltmak söz konusu olduğunda, genel kural, yalnızca kökenlerini ve haritalama işlevlerini unutursanız bir dezavantaj haline gelmeleridir.

    Karşılaştırmalarda hata kaynağı

    Eşitsizlik katsayılarının birbiriyle karşılaştırıldığı ifadeler, bireysel katsayıların hesaplanmasının özellikle eleştirel bir incelemesini gerektirir. Doğru bir karşılaştırma için bu katsayıların her durumda eşit olarak hesaplanmış olması gerekir. Örneğin, giriş verilerinin farklı tanecikliği, eşit olmayan dağılımı hesaplarken farklı sonuçlara yol açar. Birkaç nicelikle hesaplanan bir Gini katsayısı , genellikle daha fazla nicelikle hesaplanan bir katsayıdan biraz daha küçük bir eşitsiz dağılım gösterir, çünkü ikinci durumda, daha yüksek ölçüm çözünürlüğü sayesinde, düzensiz dağılım, aralıklar dahilinde (yani ilk Durumdaki miktarlar arasında), daha kaba ölçüm çözünürlüğü nedeniyle değerlendirilmemiş olarak kalır.

    Basit bir ifadeyle: daha yüksek bir veri çözünürlüğü (neredeyse her zaman) daha düşük bir tekdüze dağılım sağlar.

    Ayrıca bakınız

    İnternet linkleri

    Bireysel kanıt

    1. Eurostat web sitesi ( içinde Memento orijinal 4 Aralık 2016 , Internet Archive ) Bilgi: arşiv bağlantısı otomatik olarak sokulmuş ve henüz kontrol edilmedi. Lütfen orijinal ve arşiv bağlantısını talimatlara göre kontrol edin ve ardından bu uyarıyı kaldırın. @ 1@ 2Şablon: Webachiv / IABot / ec.europa.eu
    2. Breiman, L. ve Friedman, JH ve Olshen, RA ve Stone, CJ: Sınıflandırma ve regresyon ağaçları . Chapman ve Hall, New York 1984.
    3. Kredi riski üzerine bir dizi kılavuz: Derecelendirme modelleri ve doğrulama, Avusturya Ulusal Bankası ve Finansal Piyasa Otoritesi, 2004. Arşiv bağlantısı ( İnternet Arşivinde 4 Aralık 2011 tarihli Memento )
    4. ^ PJ Lambert (2001): Gelir Dağılımı ve Yeniden Dağıtımı. Manchester University Press, s. 31ff.
    5. ^ Ochmann, R. ve A. Peichl (2006): Mali Reformların Dağılımsal Etkilerinin Ölçülmesi. Mali bilimsel tartışma katkıları No. 06-9 , Köln Üniversitesi'nde mali bilimsel araştırma enstitüsü.
    6. Çevrimiçi hesap makinesi: eşit olmayan dağılım
    7. Karşılaştırma: www.umversorgung.de/rechner/?quantiles=50,10|50.90 (mavi eğri) ve www.umversorgung.de/rechner/?quantiles=90.50|10.50 (kırmızı eğri)