- Gegroepeerde gegevens
- Voorbeeld
- De 3 belangrijkste maten van centrale tendens
- 1- Rekenkundig gemiddelde
- 2- Gemiddeld
- 3- Mode
- Referenties
De metingen van centrale tendens van gegroepeerde gegevens worden in statistieken gebruikt om bepaald gedrag van een groep aangeleverde gegevens te beschrijven, zoals welke waarde ze dicht bij, wat is het gemiddelde van de verzamelde gegevens, onder andere.
Bij het nemen van een grote hoeveelheid gegevens is het handig om ze te groeperen om ze beter te ordenen en zo bepaalde maten van centrale tendens te kunnen berekenen.

Tot de meest gebruikte maten van centrale tendens behoren het rekenkundig gemiddelde, de mediaan en de modus. Deze cijfers vertellen bepaalde eigenschappen over de gegevens die in een bepaald experiment zijn verzameld.
Om deze metingen te kunnen gebruiken, moet u eerst weten hoe u een dataset groepeert.
Gegroepeerde gegevens
Om gegevens te groeperen, moet u eerst het bereik van de gegevens berekenen, dat wordt verkregen door de grootste waarde minus de kleinste waarde van de gegevens af te trekken.
Vervolgens wordt een nummer "k" gekozen, dat is het aantal klassen waarin we de gegevens willen groeperen.
Het bereik wordt gedeeld door "k" om de amplitude te verkrijgen van de klassen die moeten worden gegroepeerd. Dit aantal is C = R / k.
Ten slotte begint de groepering, waarvoor een getal kleiner dan de laagste waarde van de verkregen gegevens wordt gekozen.
Dit aantal is de ondergrens van de eerste klas. Hieraan wordt C toegevoegd. De verkregen waarde wordt de bovengrens van de eerste klasse.
Vervolgens wordt C bij deze waarde opgeteld en wordt de bovengrens van de tweede klasse verkregen. Op deze manier gaan we verder om de bovengrens van de laatste les te verkrijgen.
Nadat de gegevens zijn gegroepeerd, kunnen het gemiddelde, de mediaan en de modus worden berekend.
Om te illustreren hoe het rekenkundig gemiddelde, de mediaan en de modus worden berekend, gaan we verder met een voorbeeld.
Voorbeeld

Daarom wordt bij het groeperen van de gegevens een tabel zoals de volgende verkregen:

De 3 belangrijkste maten van centrale tendens
Nu gaan we verder met het berekenen van het rekenkundig gemiddelde, de mediaan en de modus. Het bovenstaande voorbeeld zal worden gebruikt om deze procedure te illustreren.
1- Rekenkundig gemiddelde
Het rekenkundig gemiddelde bestaat uit het vermenigvuldigen van elke frequentie met het gemiddelde van het interval. Vervolgens worden al deze resultaten opgeteld en ten slotte gedeeld door de totale gegevens.
Met behulp van het vorige voorbeeld zou worden verkregen dat het rekenkundig gemiddelde gelijk is aan:
(4 * 2 + 4 * 4 + 6 * 6 + 4 * 8) / 18 = (8 + 16 + 36 + 32) / 18 = 5.11111
Dit geeft aan dat de gemiddelde waarde van de gegevens in de tabel 5.11111 is.
2- Gemiddeld
Om de mediaan van een dataset te berekenen, rangschikken we eerst alle data van klein naar groot. Er kunnen zich twee gevallen voordoen:
- Als het aantal gegevens oneven is, is de mediaan de gegevens die precies in het midden staan.
- Als het aantal gegevens even is, is de mediaan het gemiddelde van de twee gegevens die in het midden staan.
Als het gaat om gegroepeerde gegevens, gebeurt de berekening van de mediaan als volgt:
- N / 2 wordt berekend, waarbij N de totale gegevens is.
- Het eerste interval waar de geaccumuleerde frequentie (de som van de frequenties) groter is dan N / 2 wordt doorzocht en de ondergrens van dit interval wordt geselecteerd, genaamd Li.
De mediaan wordt gegeven door de volgende formule:
Me = Li + (Ls-Li) * (N / 2 - geaccumuleerde frequentie vóór Li) / frequentie van [Li, Ls)
Ls is de bovengrens van het bovengenoemde interval.
Als de vorige gegevenstabel wordt gebruikt, is N / 2 = 18/2 = 9. De verzamelde frequenties zijn 4, 8, 14 en 18 (één voor elke rij van de tabel).
Daarom moet het derde interval worden geselecteerd, aangezien de cumulatieve frequentie groter is dan N / 2 = 9.
Dus Li = 5 en Ls = 7. Als u de hierboven beschreven formule toepast, moet u:
Me = 5 + (7-5) * (9-8) / 6 = 5 + 2 * 1/6 = 5 + 1/3 = 16/3 ≈ 5,3333.
3- Mode
De modus is de waarde met de hoogste frequentie van alle gegroepeerde gegevens; dat wil zeggen, het is de waarde die het vaakst wordt herhaald in de initiële gegevensset.
Als u een zeer grote hoeveelheid gegevens heeft, wordt de volgende formule gebruikt om de modus van de gegroepeerde gegevens te berekenen:
Mo = Li + (Ls-Li) * (frequentie van Li - frequentie van L (i-1)) / ((frequentie van Li - frequentie van L (i-1)) + (frequentie van Li - frequentie van L ( ik + 1)))
Het interval [Li, Ls) is het interval waarin de hoogste frequentie wordt gevonden. Voor het voorbeeld dat in dit artikel wordt gemaakt, wordt de modus gegeven door:
Mo = 5 + (7-5) * (6-4) / ((6-4) + (6-4)) = 5 + 2 * 2/4 = 5 + 1 = 6.
Een andere formule die wordt gebruikt om een geschatte waarde voor de modus te verkrijgen, is de volgende:
Mo = Li + (Ls-Li) * (frequentie L (i + 1)) / (frequentie L (i-1) + frequentie L (i + 1)).
Met deze formule zijn de rekeningen als volgt:
Mo = 5 + (7-5) * 4 / (4 + 4) = 5 + 2 * 4/8 = 5 + 1 = 6.
Referenties
- Bellhouse, DR (2011). Abraham De Moivre: de weg bereiden voor klassieke waarschijnlijkheid en haar toepassingen. CRC Press.
- Cifuentes, JF (2002). Inleiding tot de waarschijnlijkheidstheorie. Nationale Universiteit van Colombia.
- Daston, L. (1995). Klassieke waarschijnlijkheid in de verlichting. Princeton University Press.
- Larson, HJ (1978). Inleiding tot kansrekening en statistische gevolgtrekking. Redactioneel Limusa.
- Martel, PJ en Vegas, FJ (1996). Waarschijnlijkheids- en wiskundige statistiek: toepassingen in de klinische praktijk en gezondheidsmanagement. Díaz de Santos-edities.
- Vázquez, AL en Ortiz, FJ (2005). Statistische methoden om variabiliteit te meten, beschrijven en beheersen. Ed. Universiteit van Cantabrië.
- Vázquez, SG (2009). Handleiding voor wiskunde voor toegang tot de universiteit. Redactioneel Centro de Estudios Ramon Areces SA.
