Normale verdeling

De normale verdeling is een kansverdeling die beschrijft hoe data verspreid zijn. Normaal verdeelde data heeft de volgende eigenschappen:

  • Observaties rond het gemiddelde zijn het waarschijnlijkst
  • Hoe verder waardes van het gemiddelde af liggen, hoe onwaarschijnlijker het is deze waarden te observeren
  • Waardes boven en onder het gemiddelde zijn even waarschijnlijk.

Wanneer is een normale verdeling belangrijk?

De aanname van een normale verdeling wordt bij veel statistische toetsen gemaakt. Bij het uitvoeren van een t-toets of anova is de aanname dat de data normaal verdeeld zijn. Bij een regressieanalyse nemen we aan dat fouttermen normaal verdeeld zijn.

De aanname van een normale verdeling is vooral belangrijk bij steekproeven kleiner dan 30 observaties. Bevat jouw steekproef meer dan 30 observaties dan kun je volgens de Centrale Limietstelling aannemen dat aan de aanname van normaliteit wordt voldaan.

Hoe ziet een normale verdeling eruit?

Er zijn twee parameters die bepalen hoe de normale verdeling eruitziet: het gemiddelde en de standaarddeviatie. Het onderstaande figuur laat zien wat de waarschijnlijkheid is voor observaties binnen drie standaarddeviaties van het gemiddelde.

Binnen één standaarddeviatie liggen 68,2% van de observaties (34,1% + 34,1%), binnen twee standaarddeviaties 95,2% en binnen drie standaarddeviaties 99,6%.
Normale verdeling

Voorbeeld van een normaal verdeelde variabele:
Stel dat de variabele SAT-score normaal verdeeld is met een gemiddelde van 1075 en een standaarddeviatie van 200. Een SAT-score van 200 punten boven het gemiddelde (1275) is dan even waarschijnlijk als het observeren van een score 200 punten onder het gemiddelde (875). De verwachting is dat 68% van de respondenten in steekproef tussen de 875 en 1275 scoort.

Kijk jij ook zo uit naar afstuderen?

We helpen je graag een handje!

  • Minder stress
  • Hulp binnen handbereik
  • 100% tevredenheidsgarantie

Ontdek hoe we jou kunnen helpen

Testen voor normale verdeling met SPSS

Download het SPSS-bestand om met de data uit het voorbeeld te oefenen.

Om te onderzoeken of je variabele normaal verdeeld is, kun je in SPSS verschillende plots maken of statistische toetsen uitvoeren. Klik in de menubalk op:

  • Analyze
  • Descriptive Statistics
  • Explore

In het scherm dat nu verschijnt, voeg je de variabele lengte toe aan de ‘dependent list’ en de variabele geslacht aan de ‘factor list’. Bij ‘Plots…’ vink je ‘Normality Plots with tests’ aan. Klik op Continue en vervolgens op OK om de normaliteitstoets uit te voeren.

In de output vind je de resultaten van de algemene Kolmogorov-Smirnov en de voor normaliteit specifieke Shapiro-Wilk-toets. De nulhypothese is dat de data normaal verdeeld zijn. Een significantie kleiner dan 0,05 duidt er dus op dat het onwaarschijnlijk is dat de data normaal verdeeld zijn. De Shapiro-Wilk-toets is over het algemeen strenger en kan dus het beste worden aangehouden.

Output normaliteit

Niet normaal verdeeld, wat nu?

Als je variabele niet normaal verdeeld is, kun je kijken of je de data kunt transformeren. Het kan namelijk zijn dat een variabele zelf niet normaal verdeeld is, maar het logaritme of het kwadraat wel. Wanneer ook dit niet het geval is, kun je niet-parametrische toetsen gebruiken zoals de Wilcoxon- of Mann-Whitney-toets in plaats van de t-toets.

Wat vind jij van dit artikel?
Lars van Heijst

Lars schrijft artikelen over statistiek. Hij heeft psychologie en economie gestudeerd en is dus goed op de hoogte van de vele statistiek die binnen deze disciplines wordt gebruikt.

10 reacties

Mees
13 juni 2020 om 20:02

Hoi,

Ik heb een variabele die ordinaal is (intrinsieke motivatie): deze is niet normaal verdeeld (smirnov wel; skewinis kurtonis weer niet). De andere variabele is interval/ratio en wel normaal verdeeld (fysieke activiteit). Ik wil de samenhang onderzoeken tussen intrinsieke motivatie en fysieke activiteit.
Wat voor statistiek moet ik dan toepassen? Een spearman/pearson, een regressieanalyse of iets anders?

groet,
mees

Beantwoorden

Leon Smits
Leon Smits (Scribbr-team)
15 juni 2020 om 19:32

Hoi Mees,

Ik denk dat je hiervoor het beste een Pearson kan gebruiken! Ik raad je wel aan om dit nog even met je begeleider te checken.

Groetjes,
Leon

Beantwoorden

Stefanie
11 juni 2020 om 16:57

Hallo Leon, Voor het analyseren van de data moet ik eerst kijken of de data normaal verdeeld is of niet, welke toetsen middels SPSS moet ik hiervoor gebruiken?

Beantwoorden

Leon Smits
Leon Smits (Scribbr-team)
11 juni 2020 om 19:00

Hoi Stefanie,

Zoals hierboven beschreven kun je gebruik maken van de Shapiro-Wilk toets.

Groetjes,
Leon

Beantwoorden

Femke
6 juni 2020 om 18:02

Hoi, ik heb de Shapiro-Wilk test toegepast op een aantal variabelen met 4 verschillende groepen. Nu is de Shipiro-Wilk test bij een variabele voor één groep significant (p<0.05). Dus stel voor de variabele gewicht; groep 1: p=0.354, groep 2: p<0.001, groep 3: p=0.472 en groep 4: p=0.142. Ik wil graag weten of het gewicht significant verschilt tussen deze vier groepen. Moet ik dan de Kruskal Wallis test doen omdat 1 groep significant was (dus niet de normale verdeling volgt) of mag ik gewoon een One-way ANOVA gebruiken?

Beantwoorden

Leon Smits
Leon Smits (Scribbr-team)
10 juni 2020 om 19:33

Hoi Femke,

Oef, lastige vraag! Ik durf het niet met zekerheid te zeggen, maar ik denk dat je inderdaad een Kruskal Wallis test moet gebruiken!

Ik hoop dat het lukt. :)

Groetjes,
Leon

Beantwoorden

Sarah
7 mei 2020 om 17:39

Hoi,

ik ben een schaal aan de valideren en controleren op betrouwbaarheid. Hiervoor ben ik onder andere de crohnbach's alfa aan het berekenen (van subschalen en volledige schaal). Nu heb ik een goede score voor mijn alfa (0,814), maar mijn correlatiematrix is zeer vreemd. Er zijn maar twee items die goed correleren met aan aantal andere items.

Zou dit kunnen komen omdat mijn data niet normaal verdeeld is? En moet ik deze verdeling controleren met de somscore van mijn schaal, of met de individuele items?

groetjes,
Sarah

Beantwoorden

Leon Smits
Leon Smits (Scribbr-team)
25 mei 2020 om 15:10

Hoi Sarah,

Zonder de data is het wat lastig om hier een antwoord op te geven. Maar het kan zeker dat dit komt omdat je data niet normaal verdeeld is.
Ik raad je aan om dit even met je begeleider te overleggen, die kan je hier een stuk beter bij helpen.

Groetjes,
Leon

Beantwoorden

emmaly
15 april 2020 om 15:44

Hoe rapporteer ik de skewness en de Skurtosis in mijn paper (APA?)

Beantwoorden

Leon Smits
Leon Smits (Scribbr-team)
15 april 2020 om 18:18

Hoi Emmaly,

Ik help je graag met de bronvermelding, maar dan moet ik wel weten waarnaar je wilt verwijzen.
Heb je een linkje voor me? Je kunt anders ook even contact opnemen via onze live chat.

Groetjes,
Leon

Beantwoorden

Stel een vraag of reageer.

Please click the checkbox on the left to verify that you are a not a bot.