- Formules en vergelijkingen
- Hoe de steekproeffout te berekenen
- Voor een zeker vertrouwen
- Voorbeelden
- - Voorbeeld 1
- Oplossing
- - Voorbeeld 2
- Oplossing
- - Voorbeeld 3
- Oplossing
- - Voorbeeld 4
- Oplossing
- - Oefening 5
- Oplossing
- Referenties
De steekproeffout of steekproeffout in statistieken is het verschil tussen de gemiddelde waarde van een steekproef en de gemiddelde waarde van de totale populatie. Om het idee te illustreren, stellen we ons voor dat de totale bevolking van een stad uit één miljoen mensen bestaat, waarvan u de gemiddelde schoenmaat wilt, waarvoor een willekeurige steekproef van duizend mensen wordt genomen.
De gemiddelde grootte die uit de steekproef naar voren komt, zal niet noodzakelijk samenvallen met die van de totale populatie, maar als de steekproef niet vertekend is, moet de waarde dichtbij zijn. Dit verschil tussen de gemiddelde waarde van de steekproef en die van de totale populatie is de steekproeffout.

Figuur 1. Aangezien de steekproef een subset is van de totale populatie, heeft het steekproefgemiddelde een foutmarge. Bron: F. Zapata.
Over het algemeen is de gemiddelde waarde van de totale populatie onbekend, maar er zijn technieken om deze fout te verminderen en formules om de steekproeffoutmarge te schatten die in dit artikel zullen worden besproken.
Formules en vergelijkingen
Laten we zeggen dat we de gemiddelde waarde van een bepaald meetbaar kenmerk x willen weten in een populatie van grootte N, maar aangezien N een groot getal is, is het niet haalbaar om de studie op de totale populatie uit te voeren, dan gaan we verder met het nemen van een willekeurige steekproef van maat n <
De gemiddelde waarde van het monster wordt aangegeven door
Stel dat er m monsters worden genomen van de totale populatie N, allemaal even groot n met gemiddelde waarden
Deze gemiddelde waarden zullen niet identiek zijn aan elkaar en zullen allemaal rond de populatiegemiddelde waarde μ liggen. De steekproeffoutmarge E geeft de verwachte scheiding van de gemiddelde waarden aan
De standaardfoutmarge ε van de steekproef van grootte n is:
ε = σ / √n
waarbij σ de standaarddeviatie is (de vierkantswortel van de variantie), die wordt berekend met behulp van de volgende formule:
σ = √
De betekenis van de standaardfoutmarge ε is als volgt:
Gemiddelde waarde
Hoe de steekproeffout te berekenen
In de vorige sectie werd de formule gegeven om de standaardfoutmarge van een steekproef van grootte n te vinden, waarbij het woord standaard aangeeft dat het een foutmarge is met een betrouwbaarheid van 68%.
Dit geeft aan dat als er veel monsters van dezelfde grootte n zijn genomen, 68% daarvan gemiddelde waarden zullen geven
Er is een eenvoudige regel, de 68-95-99,7-regel genaamd, die ons in staat stelt om de marge van steekproeffout E gemakkelijk te vinden voor betrouwbaarheidsniveaus van 68%, 95% en 99,7%, aangezien deze marge 1 ⋅ ε, 2 is. ⋅ ε en 3⋅ ε respectievelijk.
Voor een zeker vertrouwen
Als het betrouwbaarheidsniveau γ niet een van de bovenstaande is, dan is de steekproeffout de standaarddeviatie σ vermenigvuldigd met de factor Zγ, die wordt verkregen door de volgende procedure:
1.- Eerst wordt het significantieniveau α bepaald, dat wordt berekend uit het betrouwbaarheidsniveau γ via de volgende relatie: α = 1 - γ
2.- Vervolgens moeten we de waarde 1 - α / 2 = (1 + γ) / 2 berekenen, die overeenkomt met de geaccumuleerde normale frequentie tussen -∞ en Zγ, in een normale of Gaussische verdeling getypeerd F (z), waarvan de definitie is te zien in figuur 2.
3.- De vergelijking F (Zγ) = 1 - α / 2 wordt opgelost door middel van de tabellen van de normale verdeling (cumulatief) F, of door middel van een computerapplicatie die de inverse Gaussische functie F -1 heeft .
In het laatste geval hebben we:
Zγ = G -1 (1 - α / 2).
4.- Ten slotte wordt deze formule toegepast voor de steekproeffout met een betrouwbaarheidsniveau γ:
E = Zγ ⋅ (σ / √n)

Figuur 2. Tabel met normale verdeling. Bron: Wikimedia Commons.
Voorbeelden
- Voorbeeld 1
Bereken de standaardfoutmarge in het gemiddelde gewicht van een steekproef van 100 pasgeborenen. De berekening van het gemiddelde gewicht was
Oplossing
De standaard foutmarge is ε = σ / √n = (1.500 kg) / √100 = 0,15 kg. Dit betekent dat met deze gegevens kan worden geconcludeerd dat het gewicht van 68% van de pasgeborenen tussen 2.950 kg en 3,25 kg ligt.
- Voorbeeld 2
Bepaal de steekproefmarge van fout E en het gewichtsbereik van 100 pasgeborenen met een betrouwbaarheidsniveau van 95% als het gemiddelde gewicht 3100 kg is met standaarddeviatie σ = 1500 kg.
Oplossing
Als regel 68 van toepassing is; 95; 99,7 → 1⋅ ε; 2⋅ ε; 3⋅ ε, we hebben:
E = 2⋅ε = 2⋅0,15 kg = 0,30 kg
Met andere woorden, 95% van de pasgeborenen zal een gewicht hebben tussen 2.800 kg en 3.400 kg.
- Voorbeeld 3
Bepaal het gewichtsbereik van de pasgeborenen in Voorbeeld 1 met een betrouwbaarheidsmarge van 99,7%.
Oplossing
De steekproeffout met een betrouwbaarheid van 99,7% is 3 σ / √n, wat in ons voorbeeld E = 3 * 0,15 kg = 0,45 kg is. Hieruit volgt dat 99,7% van de pasgeborenen een gewicht tussen 2.650 kg en 3.550 kg zal hebben.
- Voorbeeld 4
Bepaal de factor Zγ voor een betrouwbaarheidsniveau van 75%. Bepaal de marge van de steekproeffout met dit betrouwbaarheidsniveau voor het geval dat in Voorbeeld 1 wordt gepresenteerd.
Oplossing
Het betrouwbaarheidsniveau is γ = 75% = 0,75, wat gerelateerd is aan het significantieniveau α via de relatie γ = (1 - α), zodat het significantieniveau α = 1 - 0,75 = 0 is , 25.
Dit betekent dat de cumulatieve normale kans tussen -∞ en Zγ is:
P (Z ≤ Zγ) = 1 - 0,125 = 0,875
Wat overeenkomt met een Zγ-waarde van 1,1503, zoals weergegeven in figuur 3.

Figuur 3. Bepaling van de Zγ-factor overeenkomend met een betrouwbaarheidsniveau van 75%. Bron: F. Zapata via Geogebra.
Met andere woorden, de steekproeffout is E = Zγ ⋅ (σ / √n) = 1,15 ⋅ (σ / √n).
Wanneer toegepast op de gegevens uit voorbeeld 1, geeft het een foutmelding van:
E = 1,15 * 0,15 kg = 0,17 kg
Met een betrouwbaarheidsniveau van 75%.
- Oefening 5
Wat is het betrouwbaarheidsniveau als Z α / 2 = 2,4?
Oplossing
P (Z ≤ Z α / 2 ) = 1 - α / 2
P (Z ≤ 2,4) = 1 - α / 2 = 0,9918 → α / 2 = 1 - 0,9918 = 0,0082 → α = 0,0164
Het significantieniveau is:
α = 0,0164 = 1,64%
En tot slot blijft het betrouwbaarheidsniveau:
1- α = 1 - 0,0164 = 100% - 1,64% = 98,36%
Referenties
- Canavos, G. 1988. Waarschijnlijkheid en statistiek: toepassingen en methoden. McGraw Hill.
- Devore, J. 2012. Waarschijnlijkheid en statistiek voor techniek en wetenschap. 8e. Editie. Cengage.
- Levin, R. 1988. Statistieken voor beheerders. 2e. Editie. Prentice Hall.
- Sudman, S. 1982. Vragen stellen: een praktische gids voor het ontwerpen van vragenlijsten. San Francisco. Jossey Bass.
- Walpole, R. 2007. Waarschijnlijkheid en statistiek voor techniek en wetenschappen. Pearson.
- Wonnacott, TH en RJ Wonnacott. 1990. Inleidende statistieken. 5e Ed. Wiley
- Wikipedia. Bemonsteringsfout. Hersteld van: en.wikipedia.com
- Wikipedia. Foutmarge. Hersteld van: en.wikipedia.com
