NORMALE VERDELING: FORMULE, KENMERKEN, VOORBEELD, OEFENING - WISKUNDE

De normale verdeling of Gaussiaanse verdeling is de kansverdeling in een continue variabele, waarin de kansdichtheidsfunctie wordt beschreven door een exponentiële functie van kwadratisch en negatief argument, wat aanleiding geeft tot een belvorm.

De naam van normale verdeling komt van het feit dat deze verdeling degene is die van toepassing is op het grootste aantal situaties waarin een continue willekeurige variabele betrokken is bij een bepaalde groep of populatie.

Figuur 1. Normale verdeling N (x; μ, σ) en de kansdichtheid f (s; μ, σ). (Eigen uitwerking)

Voorbeelden waarbij de normale verdeling wordt toegepast, zijn: de lengte van mannen of vrouwen, variaties in de mate van fysieke omvang of in meetbare psychologische of sociologische kenmerken zoals het intellectuele quotiënt of de consumptiegewoonten van een bepaald product.

Aan de andere kant wordt het een Gauss-distributie of Gaussiaanse klok genoemd, omdat het dit Duitse wiskundige genie is aan wie zijn ontdekking wordt toegeschreven voor het gebruik dat hij eraan gaf om de statistische fout van astronomische metingen in het jaar 1800 te beschrijven.

Er wordt echter beweerd dat deze statistische distributie al in 1733 werd gepubliceerd door een andere grote wiskundige van Franse afkomst, zoals Abraham de Moivre.

Formule

De normale verdelingsfunctie in de continue variabele x, met parameters μ en σ, wordt aangegeven door:

N (x; μ, σ)

en het is expliciet als volgt geschreven:

N (x; μ, σ) = ∫ _-∞ ^X f (s; μ, σ) ds

waarbij f (u; μ, σ) de kansdichtheidsfunctie is:

f (s; μ, σ) = (1 / (σ√ (2π)) Exp (- s ² / (2σ ² ))

De constante die de exponentiële functie in de kansdichtheidsfunctie vermenigvuldigt, wordt de normalisatieconstante genoemd en is zo gekozen dat:

N (+ ∞, μ, σ) = 1

De vorige uitdrukking zorgt ervoor dat de kans dat de willekeurige variabele x tussen -∞ en + ∞ ligt 1 is, dat wil zeggen 100% kans.

De parameter μ is het rekenkundig gemiddelde van de continue willekeurige variabele x en σ de standaarddeviatie of vierkantswortel van de variantie van diezelfde variabele. In het geval dat μ = 0 en σ = 1 dan hebben we de standaard normale verdeling of typische normale verdeling:

N (x; μ = 0, σ = 1)

Kenmerken van de normale distributie

1- Als een willekeurige statistische variabele een normale verdeling van kansdichtheid f (s; μ, σ) volgt, worden de meeste gegevens gegroepeerd rond de gemiddelde waarde μ en zijn ze er zo omheen verspreid dat er weinig meer dan ⅔ van de gegevens zijn tussen μ - σ en μ + σ.

2- De standaarddeviatie σ is altijd positief.

3- De vorm van de dichtheidsfunctie f is vergelijkbaar met die van een klok, daarom wordt deze functie vaak een Gaussische klok of Gaussische functie genoemd.

4- In een Gauss-verdeling vallen het gemiddelde, de mediaan en de modus samen.

5- De buigpunten van de kansdichtheidsfunctie liggen precies op μ - σ en μ + σ.

6- De functie f is symmetrisch ten opzichte van een as die door zijn gemiddelde waarde μ gaat en asymptotisch nul voor x ⟶ + ∞ en x ⟶ -∞.

7- Hoe hoger de waarde van σ, hoe groter de spreiding, ruis of afstand van de gegevens rond de gemiddelde waarde. Met andere woorden, hoe hoger σ de belvorm meer open is. Aan de andere kant geeft σ klein aan dat de dobbelstenen dicht bij het gemiddelde liggen en dat de vorm van de bel meer gesloten of puntig is.

8- De verdelingsfunctie N (x; μ, σ) geeft de kans aan dat de willekeurige variabele kleiner is dan of gelijk is aan x. In figuur 1 (hierboven) is de kans P dat de variabele x kleiner is dan of gelijk aan 1,5 bijvoorbeeld 84% en komt overeen met het gebied onder de kansdichtheidsfunctie f (x; μ, σ) van -∞ tot x.

Betrouwbaarheidsintervallen

9- Als de gegevens een normale verdeling volgen, ligt 68,26% hiervan tussen μ - σ en μ + σ.

10-95,44% van de gegevens die een normale verdeling volgen, zijn tussen μ - 2σ en μ + 2σ.

11-99,74% van de gegevens die een normale verdeling volgen, liggen tussen μ - 3σ en μ + 3σ.

12- Als een willekeurige variabele x een verdeling N (x; μ, σ) volgt, dan is de variabele

z = (x - μ) / σ volgt de standaard normale verdeling N (z; 0,1).

Het wijzigen van de variabele x naar z wordt standaardisatie of typen genoemd en is erg handig bij het toepassen van de tabellen van de standaarddistributie op de gegevens die een niet-standaard normale distributie volgen.

Toepassingen van de normale distributie

Om de normale verdeling toe te passen, is het noodzakelijk om de berekening van de integraal van de waarschijnlijkheidsdichtheid te doorlopen, wat vanuit analytisch oogpunt niet eenvoudig is en er niet altijd een computerprogramma is dat de numerieke berekening mogelijk maakt. Hiervoor worden tabellen met genormaliseerde of gestandaardiseerde waarden gebruikt, wat niets meer is dan de normale verdeling in het geval μ = 0 en σ = 1.

Gestandaardiseerde normale verdeeltafel (deel 1/2)

Gestandaardiseerde normale verdeeltafel (deel 2/2)

Opgemerkt moet worden dat deze tabellen geen negatieve waarden bevatten. Met behulp van de symmetrie-eigenschappen van de Gaussiaanse kansdichtheidsfunctie kunnen de overeenkomstige waarden worden verkregen. De onderstaande opgeloste oefening geeft het gebruik van de tabel in deze gevallen aan.

Voorbeeld

Stel dat u een set willekeurige gegevens x heeft die een normale verdeling van gemiddelde 10 en standaarddeviatie 2 volgen. U wordt gevraagd de kans te vinden dat:

a) De willekeurige variabele x is kleiner dan of gelijk aan 8.

b) Is kleiner dan of gelijk aan 10.

c) Dat de variabele x lager is dan 12.

d) De kans dat een x-waarde tussen 8 en 12 ligt.

Oplossing:

a) Om de eerste vraag te beantwoorden, hoeft u alleen maar te berekenen:

N (x; μ, σ)

Met x = 8, μ = 10 en σ = 2. We realiseren ons dat het een integraal is die geen analytische oplossing heeft in elementaire functies, maar de oplossing wordt uitgedrukt als een functie van de foutfunctie erf (x).

Aan de andere kant is er de mogelijkheid om de integraal in numerieke vorm op te lossen, wat veel rekenmachines, spreadsheets en computerprogramma's zoals GeoGebra doen. De volgende afbeelding toont de numerieke oplossing die overeenkomt met het eerste geval:

Figuur 2. Waarschijnlijkheidsdichtheid f (x; μ, σ). Het gearceerde gebied vertegenwoordigt P (x ≤ 8). (Eigen uitwerking)

en het antwoord is dat de kans dat x lager is dan 8 is:

P (x ≤ 8) = N (x = 8; μ = 10, σ = 2) = 0,1587

b) In dit geval proberen we de waarschijnlijkheid te vinden dat de willekeurige variabele x onder het gemiddelde ligt, wat in dit geval 10 waard is. Het antwoord vereist geen berekening, aangezien we weten dat de helft van de gegevens onder gemiddeld en de andere helft boven het gemiddelde. Daarom is het antwoord:

P (x ≤ 10) = N (x = 10; μ = 10, σ = 2) = 0,5

c) Om deze vraag te beantwoorden, moeten we N (x = 12; μ = 10, σ = 2) berekenen, wat kan worden gedaan met een rekenmachine met statistische functies of via software zoals GeoGebra:

Figuur 3. Waarschijnlijkheidsdichtheid f (x; μ, σ). Het gearceerde gebied vertegenwoordigt P (x ≤ 12). (Eigen uitwerking)

Het antwoord op deel c is te zien in figuur 3 en is:

P (x ≤ 12) = N (x = 12; μ = 10, σ = 2) = 0,8413.

d) Om de kans te vinden dat de willekeurige variabele x tussen 8 en 12 ligt, kunnen we de resultaten van de delen a en c als volgt gebruiken:

P (8 ≤ x ≤ 12) = P (x ≤ 12) - P (x ≤ 8) = 0,8413 - 0,1587 = 0,6826 = 68,26%.

Oefening opgelost

De gemiddelde prijs van de aandelen van een bedrijf is $ 25 met een standaarddeviatie van $ 4. Bepaal de kans dat:

a) Een actie kost minder dan $ 20.

b) Dat kost meer dan $ 30.

c) De prijs ligt tussen $ 20 en $ 30.

Gebruik de standaard normale verdelingstabellen om de antwoorden te vinden.

Oplossing:

Om gebruik te kunnen maken van de tabellen, is het nodig om naar de genormaliseerde of getypte z-variabele te gaan:

$ 20 in de genormaliseerde variabele is gelijk aan z = ($ 20 - $ 25) / $ 4 = -5/4 = -1,25 en

$ 30 in de genormaliseerde variabele is gelijk aan z = ($ 30 - $ 25) / $ 4 = +5/4 = +1,25.

a) $ 20 is gelijk aan -1,25 in de genormaliseerde variabele, maar de tabel heeft geen negatieve waarden, dus zoeken we de waarde +1,25 die de waarde 0,8944 oplevert.

Als 0,5 van deze waarde wordt afgetrokken, is het resultaat het gebied tussen 0 en 1,25 dat overigens identiek is (door symmetrie) aan het gebied tussen -1,25 en 0. Het resultaat van de aftrekking is 0,8944 - 0,5 = 0,3944, het gebied tussen -1,25 en 0.

Maar het gebied van -∞ tot -1,25 is van belang, wat 0,5 - 0,3944 = 0,1056 zal zijn. Daarom wordt geconcludeerd dat de kans dat een aandeel onder de $ 20 staat 10,56% is.

b) $ 30 in de getypte variabele z is 1,25. Voor deze waarde toont de tabel het getal 0,8944, wat overeenkomt met het gebied van -∞ tot +1,25. Het gebied tussen +1,25 en + ∞ is (1 - 0,8944) = 0,1056. Met andere woorden, de kans dat een aandeel meer dan $ 30 kost, is 10,56%.

c) De kans dat een actie tussen $ 20 en $ 30 kost, wordt als volgt berekend:

100% -10,56% - 10,56% = 78,88%

Referenties

Statistiek en waarschijnlijkheid. Normale verdeling. Hersteld van: projectdescartes.org
Geogebra. Klassieke geogebra, kansrekening. Opgehaald van geogebra.org
MathWorks. Gaussische verdeling. Hersteld van: es.mathworks.com
Mendenhall, W. 1981. Statistieken voor management en economie. 3e. editie. Grupo Hoofdartikel Iberoamérica.
Stat Trek. Leer jezelf statistieken. Poisson-distributie. Hersteld van: stattrek.com,
Triola, M. 2012. Elementaire statistieken. 11e. Ed. Pearson Education.
Universiteit van Vigo. Belangrijkste continue distributies. Hersteld van: anapg.webs.uvigo.es
Wikipedia. Normale verdeling. Hersteld van: es.wikipedia.org

NORMALE VERDELING: FORMULE, KENMERKEN, VOORBEELD, OEFENING - WISKUNDE - 2026