- Definitie
- Formules en vergelijkingen
- - Kurtosis volgens de presentatie van de gegevens
- Gegevens niet gegroepeerd of gegroepeerd in frequenties
- Gegevens gegroepeerd in intervallen
- Overmatige kurtosis
- Waar is kurtosis voor?
- De salarissen van 3 afdelingen
- De resultaten van een examen
- Uitgewerkt voorbeeld van kurtosis
- Oplossing
- Stap 1
- Stap 2
- Stap 3
- Referenties
De kurtosis of kurtosis is een statistische parameter die wordt gebruikt om de kansverdeling van een willekeurige variabele te karakteriseren en de mate van concentratie van waarden rond de centrale omvang aangeeft. Dit staat ook bekend als "piekcijfer".
De term komt van het Griekse "kurtos" wat gebogen betekent, daarom geeft de kurtosis de mate van aanwijzen of afvlakken van de verdeling aan, zoals te zien is in de volgende afbeelding:
Figuur 1. Verschillende soorten kurtosis. Bron: F. Zapata.
Bijna alle waarden van een willekeurige variabele hebben de neiging om te clusteren rond een centrale waarde, zoals het gemiddelde. Maar in sommige distributies zijn de waarden meer verspreid dan in andere, wat resulteert in vlakkere of slankere curven.
Definitie
De kurtosis is een numerieke waarde die kenmerkend is voor elke frequentieverdeling, die volgens de concentratie van de waarden rond het gemiddelde in drie groepen wordt ingedeeld:
- Leptokurtic: waarin de waarden erg geclusterd zijn rond het gemiddelde, dus de verdeling is vrij spits en slank (figuur 1, links).
- Mesocúrtic: het heeft een matige concentratie van waarden rond het gemiddelde (figuur 1 in het midden).
- Platicúrtica: deze verdeling heeft een bredere vorm, aangezien de waarden meer verspreid zijn (figuur 1 rechts).
Formules en vergelijkingen
De kurtosis kan elke waarde hebben, zonder beperkingen. De berekening wordt uitgevoerd afhankelijk van de manier waarop de gegevens worden aangeleverd. De notatie die in elk geval wordt gebruikt, is de volgende:
-Coëfficiënt van kurtosis: g 2
- Rekenkundig gemiddelde: X of x met staaf
-Een i-de waarde: x i
-Standaardafwijking: σ
-Het aantal gegevens: N
-De frequentie van de i-de waarde: f i
-Klasse merk: mx i
Met deze notatie presenteren we enkele van de meest gebruikte formules om kurtosis te vinden:
- Kurtosis volgens de presentatie van de gegevens
Gegevens niet gegroepeerd of gegroepeerd in frequenties
Gegevens gegroepeerd in intervallen
Overmatige kurtosis
Ook wel Fisher's richtcoëfficiënt of Fisher's maat genoemd, het wordt gebruikt om de bestudeerde verdeling te vergelijken met de normale verdeling.
Wanneer de overtollige kurtosis 0 is, bevinden we ons in de aanwezigheid van een normale distributie of Gaussiaanse bel. Op deze manier vergelijken we, telkens wanneer de overmatige kurtosis van een verdeling wordt berekend, deze met de normale verdeling.
Voor zowel de niet-gegroepeerde als de gepoolde gegevens is de aanwijscoëfficiënt van Fisher, aangeduid met K,:
K = G 2 - 3
Nu kan worden aangetoond dat de kurtosis van de normale verdeling 3 is, dus als de Fisher-richtcoëfficiënt 0 of dichtbij 0 is en er een mesocructische verdeling is. Als K> 0 is de verdeling leptokurtisch en als K <0 platicúrtisch.
Waar is kurtosis voor?
Kurtosis is een maatstaf voor variabiliteit die wordt gebruikt om de morfologie van een distributie te karakteriseren. Op deze manier kunnen symmetrische verdelingen met hetzelfde gemiddelde en dezelfde spreiding (gegeven door de standaarddeviatie) worden vergeleken.
Het hebben van variabiliteitsmetingen zorgt ervoor dat de gemiddelden betrouwbaar zijn en helpt variaties in de verdeling te beheersen. Laten we als voorbeeld naar deze twee situaties kijken.
De salarissen van 3 afdelingen
Stel dat de volgende grafiek de salarisverdelingen toont van 3 afdelingen van hetzelfde bedrijf:
Figuur 2. Drie verdelingen met verschillende kurtosis illustreren praktische situaties. (Opgesteld door Fanny Zapata)
Curve A is de smalste van allemaal, en uit zijn vorm kan worden afgeleid dat de meeste salarissen van die afdeling zeer dicht bij het gemiddelde liggen, waardoor de meeste werknemers een vergelijkbare vergoeding ontvangen.
Van zijn kant, in afdeling B, volgt de looncurve een normale verdeling, aangezien de curve mesocurtisch is, waarbij we aannemen dat de lonen willekeurig werden verdeeld.
En tot slot hebben we curve C die erg vlak is, een teken dat op deze afdeling het salarisbereik veel breder is dan op de andere.
De resultaten van een examen
Stel nu dat de drie curven in figuur 2 de resultaten weergeven van een examen dat is toegepast op drie groepen studenten van hetzelfde onderwerp.
De groep waarvan de beoordelingen worden weergegeven door de leptokurtische curve A, is vrij homogeen, de meerderheid behaalde een gemiddelde of bijna-beoordeling.
Het is ook mogelijk dat het resultaat te wijten was aan het feit dat de toetsvragen ongeveer dezelfde moeilijkheidsgraad hadden.
Aan de andere kant wijzen de resultaten van groep C op een grotere heterogeniteit in de groep, die waarschijnlijk gemiddelde studenten, enkele meer bevoordeelde studenten en zeker dezelfde minder oplettende studenten bevat.
Of het zou kunnen betekenen dat de testvragen heel verschillende moeilijkheidsgraden hadden.
Curve B is mesocutisch, wat aangeeft dat de testresultaten een normale verdeling volgden. Dit is meestal het meest voorkomende geval.
Uitgewerkt voorbeeld van kurtosis
Zoek de scorecoëfficiënt van de Fisher voor de volgende cijfers, behaald in een natuurkunde-examen voor een groep studenten, met een schaal van 1 tot 10:
Oplossing
De volgende uitdrukking wordt gebruikt voor niet-gegroepeerde gegevens, gegeven in de voorgaande secties:
K = G 2 - 3
Met deze waarde weet u het type distributie.
Om g 2 te berekenen is het handig om dit op een ordelijke manier te doen, stap voor stap, aangezien er verschillende rekenkundige bewerkingen moeten worden opgelost.
Stap 1
Eerst wordt het gemiddelde van de cijfers berekend. Er zijn N = 11 gegevens.
Stap 2
De standaarddeviatie wordt gevonden, waarvoor deze vergelijking wordt gebruikt:
σ = 1.992
Of je kunt ook een tabel bouwen, die ook nodig is voor de volgende stap en waarin elke term van de sommaties die nodig zijn, wordt geschreven, beginnend met (x i - X), dan (x i - X) 2 en dan (x i - X) 4 :
Stap 3
Voer de som uit die wordt aangegeven in de teller van de formule voor g 2 . Hiervoor wordt het resultaat van de rechterkolom van de vorige tabel gebruikt:
∑ (X ik - X) 4 = 290,15
Dus:
g 2 = (1/11) x 290,15 / 1,992 4 = 1,675
De aanwijscoëfficiënt van Fisher is:
K = G 2 - 3 = 1,675-3 = -1,325
Wat interessant is, is het teken van het resultaat, dat negatief is en overeenkomt met een platicúrtische verdeling, die kan worden geïnterpreteerd zoals in het vorige voorbeeld: mogelijk is het een heterogene cursus met studenten met verschillende gradaties of zijn de examenvragen met verschillende moeilijkheidsgraden.
Het gebruik van een spreadsheet zoals Excel vergemakkelijkt het oplossen van dit soort problemen enorm en biedt ook de mogelijkheid om de verdeling grafisch te maken.
Referenties
- Levin, R. 1988. Statistieken voor beheerders. 2e. Editie. Prentice Hall.
- Marco, F. Curtosis. Hersteld van: economipedia.com.
- Oliva, J. Asymmetrie en kurtosis. Hersteld van: statisticaucv.files.wordpress.com.
- Spurr, W. 1982. Besluitvorming in management. Limusa.
- Wikipedia. Kurtosis. Hersteld van: en.wikipedia.org.