Wat is correlatie en hoe bereken je het?

Correlatie geeft de mate van samenhang tussen twee variabelen weer, ofwel in hoeverre twee variabelen elkaar beïnvloeden. De correlatie wordt uitgedrukt in de correlatiecoëfficiënt. De waarde van de correlatiecoëfficiënt ligt altijd tussen -1 en +1.

Een positieve correlatiecoëfficiënt dicht bij de waarde 1 geeft bijvoorbeeld aan dat langere studenten ook zwaarder zijn. Een correlatiecoëfficiënt dichter bij de 0 geeft aan dat het verband tussen gewicht en lengte zwakker is.

Wanneer gebruik je de correlatiecoëfficiënt?

Met de correlatiecoëfficiënt kun je de verbanden tussen de onafhankelijke en de afhankelijke variabelen in je conceptueel model testen. Je kunt bijvoorbeeld het verband testen tussen lengte (onafhankelijke variabele) en gewicht (afhankelijke variabele).

De correlatiecoëfficiënt kan ook gebruikt worden voor de selectie van variabelen voor een regressieanalyse.

Correlatiecoëfficiënt berekenen

Voor het bereken van de correlatiecoëfficiënt kun je gebruikmaken van Excel of SPSS.

Download het SPSS-bestand om met dezelfde data te oefenen.

Om de correlatiecoëfficiënt te bereken met SPSS klik je in de menubalk op:

  1. Analyze
  2. Correlate
  3. Bivariate.

Er verschijnt een scherm waarin je de variabelen selecteert die je wilt analyseren (gewicht en lengte). Kijk of ‘Pearson’ staat aangevinkt bij ‘Correlation Coefficients’, aangezien je op zoek bent naar de lineaire correlatie. Klik vervolgens op ‘ok’ om de analyse uit te voeren.

Correlatie berekenen SPSS

Pearson’s r vs. Spearman’s rs

Voor het berekenen van de correlatiecoëfficiënt kun je in SPSS twee toesten gebruiken, namelijk ‘Pearson’s r’ en ‘Spearman’s rs’.

  1. Pearson’s r is de meest gebruikte correlatiecoëfficiënt. Pearson’s r meet lineaire correlatie en kan gebruikt worden wanneer de variabelen op een continue schaal (‘scale’) gemeten worden, zoals gewicht en lengte.
  2. Spearman’s rkan gebruikt worden wanneer variabelen op de ordinale schaal gemeten worden zoals een 5-puntsschaal van ‘zeer mee oneens’ tot ‘zeer mee eens’.

Download het Excel-bestand om met dezelfde data te oefenen.

Ga in een lege cel staan en vul de formule =correlatie() of =correl() in. Tussen de haakjes selecteer je de gegevens uit beide kolommen, gescheiden door een komma of puntkomma, waarna Excel de correlatiecoëfficiënt van gewicht en lengte zal teruggeven.

Correlatie berekenen Excel

Correlatiecoëfficiënt interpreteren

Nadat SPSS of Excel de correlatiecoëfficiënt heeft berekend, moet je deze interpreteren. Let bij het interpreteren op:

  • Of het verband positief of negatief is
  • De grootte van de correlatiecoëfficiënt (tussen -1 en +1)
  • De p-waarde (of Sig.) die de significantie van het verband aangeeft (alleen in SPSS)

Je kunt de grootte van de correlatiecoëfficiënt als volgt interpreteren:

0.00 – 0.30 nauwelijks of geen correlatie
0.30 – 0.50 lage of zwakke correlatie
0.50 – 0.70 middelmatige correlatie
0.70 – 0.90 hoge of sterke correlatie
0.90 – 1.00 zeer hoge of zeer sterke correlatie

Correlatie interpreteren met spreidingsdiagrammen

Naast het berekenen van de correlatiecoëfficiënt kun je ook een spreidingsdiagram of scatterplot genereren. Dit geeft je een beeld van de relatie tussen twee variabelen.

Genereer zelf een spreidingsdiagram in Excel of SPSS door de onderstaande stappen te volgen:

Excel: Invoegen → grafiek → spreidingsdiagram
SPSS: Graph → chart builder → scatterplot → sleep de variabelen naar de grafiek

De onderstaande spreidingsdiagrammen tonen een zeer hoge positieve correlatie (links) en een hoge negatieve correlatie (rechts).

De observaties liggen in het spreidingsdiagram aan de linkerkant beter op één lijn dan de observaties in het spreidingsdiagram aan de rechterkant, wat duidt op een sterker verband en dus een hogere ‘r-waarde’.

spreidingsdiagram

Hoewel de correlatiecoëfficiënt een beeld geeft van de samenhang tussen variabelen, kun je niet zomaar conclusies trekken op basis van de correlatiecoëfficiënt.

Correlatie en causaliteit

Correlatie duidt slechts op een samenhang en niet op een oorzakelijk verband. Op basis van de correlatiecoëfficiënt is alleen te zeggen of gewicht en lengte samenhangen, niet of het één het ander veroorzaakt. Het is ook mogelijk dat een andere variabele zowel het gewicht als de lengte beïnvloedt.

Als je wilt bepalen of er een oorzakelijk verband bestaat, dan kun je beter experimenteel onderzoek, of regressie met meerdere controlevariabelen gebruiken.

Een gebrek aan correlatie betekent onafhankelijkheid

Pearson’s r en Excel testen alleen of er een lineair verband bestaat tussen twee variabelen. Een gebrek aan correlatie betekent echter niet dat er geen enkel verband bestaat tussen de variabelen.

In het spreidingsdiagram aan de linkerkant bestaat er geen verband tussen de variabelen, maar in het spreidingsdiagram aan de rechterkant is er wel degelijk sprake van een duidelijk (kwadratisch) verband. Dit is te herkennen aan de omgekeerde u-vorm.Kwadratisch verband spreidingsdiagram

Voorbeeld kwadratisch verband
Twee variabelen met een kwadratisch verband zijn een tennisnet en de hoogte van de tennisbal. In het midden bij het tennisnet is de bal op z’n hoogst, maar de hoogte neemt af nadat deze het tennisnet is gepasseerd.

Het is daarom verstandig om naast een test voor correlatie ook een spreidingsdiagram te maken, waar je mogelijk een niet-lineair verband kunt zien.

Correlatie rapporteren

De correlatiecoëfficiënt vermeld je in het resultatenhoofdstuk. Wanneer je de correlatiecoëfficiënt rapporteert, meld je in ieder geval:

  • Of de correlatiecoëfficiënt positief of negatief is
  • De p-waarde (significantie) van de correlatiecoëfficiënt, p < 0.05 is significant
  • Of er sprake is van sterke of zwakke samenhang (hoge of lage ‘r-waarde’)
  • De steekproefgrootte N in haakjes achter r

In formules wordt de correlatiecoëfficiënt aangeduid met de Griekse letter ‘’ (rho). Als je het echter hebt over de correlatiecoëfficiënt van een steekproef (in plaats van de hele populatie) gebruik je de letter ‘r’ in formules en tekst. Let op: de APA-stijl heeft nog meer richtlijnen voor het rapporteren van statistische resultaten.

Voorbeeldzinnen die je kunt gebruiken zijn:

  • Er was sprake van een niet-significante, hoge positieve correlatie tussen gewicht en lengte (r = .72; p = .172; N = 5)
  • De Pearson-correlatie wees uit dat er een niet-significant, sterk verband bestaat tussen gewicht en lengte r = .72; p = .172.

Formule correlatiecoëfficiënt

Hoewel programma’s als Excel en SPSS de correlatiecoëfficiënt voor je kunnen berekenen, kan het soms ook handig zijn om zelf de formule te kennen. De formule is als volgt:

Formule correlatie

De symbolen hebben de volgende betekenis:

Cov(x,y) = De covariantie tussen variabelen x en y
Σ = Som van alles wat tussen de haakjes volgt.
xi = De observatie
x = Gemiddelde van de steekproef
s(x) = De standaarddeviatie van de steekproef
N = De steekproefgrootte

Wat vind jij van dit artikel?
Lars van Heijst

Lars schrijft artikelen over statistiek. Hij heeft psychologie en economie gestudeerd en is dus goed op de hoogte van de vele statistiek die binnen deze disciplines wordt gebruikt.

25 reacties

Britt
20 oktober 2020 om 12:59

Hoi!

Ik heb de volgende deelvraag: 'Wat is het verschil tussen het spellen van woorden en het spellen van werkwoorden in relatie tot het lezen van losse woorden?'

Ik heb de correlatie geanalyseerd tussen het spellen van woorden en het lezen van losse woorden en dat heb ik ook voor het spellen van werkwoorden gedaan. De correlaties waren, 0,33 en 0,42 n = 49.

Kan ik met spss analyseren of er een significant verschil is tussen deze 2 correlaties?

Alvast bedankt!

Beantwoorden

Leon Smits
Leon Smits (Scribbr-team)
20 oktober 2020 om 13:14

Hoi Britt,

Dat kan, maar met de n van 49 weet ik niet of je er dan echt goede uitspraken over kan doen, de correlatiewaarden zijn immers ook al erg laag.
In dit (Engelse) artikel wordt het uitgelegd. Ik raad je aan om even met je begeleider te overleggen over de resultaten!

Groetjes,
Leon

Beantwoorden

Janneke
12 oktober 2020 om 19:10

Hoi,

hoe kan ik de p-waarde bepalen?

Beantwoorden

Leon Smits
Leon Smits (Scribbr-team)
20 oktober 2020 om 13:44

Hoi Janneke,

Je kiest de p-waarde zelf. Meestal is deze 0,05 (foutmarge van 5%, ofwel betrouwbaarheidspercentage van 95%).
Andere veelgebruikte waardes zijn 0,01 of 0,1.
Het is dus aan jou om te beslissen hoe 'streng' je wilt zijn.

Groetjes,
Leon

Beantwoorden

Sanne
2 oktober 2020 om 18:03

Hoi! wij hebben een pearson van 0,457 en een significantie van 0,00. Wat betekent dit?

Beantwoorden

Leon Smits
Leon Smits (Scribbr-team)
20 oktober 2020 om 16:18

Hoi Sanne,

Dat betekent dat je resultaat significant is, maar dat er geen grote correlatie is.

Groetjes,
Leon

Beantwoorden

Brent
9 september 2020 om 15:53

Ik heb een correlatie gemaakt tussen aanvangstijd voor een evenement en leeftijd.
De pearson correlatie is -.194 en de 2 tailed significantie is 0.00; wat voor uitspraken kan ik hier over doen?

Beantwoorden

Leon Smits
Leon Smits (Scribbr-team)
9 september 2020 om 16:58

Hoi Brent,

Dit betekent dat de uitkomst significant is, maar dat er slechts een hele kleine (negatieve) lineaire correlatie is.
De twee variabelen hangen dus zeer beperkt met elkaar samen.

Groetjes,
Leon

Beantwoorden

Vincent van der Zee
2 september 2020 om 16:53

De grootte van mijn correlatiecoëfficiënt bedraagt: -0.5.

Is dit significant of niet significant?

Het is dus een negatief verband.

Wordt hierbij nauwelijks of geen correlatie vastgesteld of juist middelmatige correlatie? In de tabel betreft het interpreteren worden namelijk geen waardes gegeven voor negatieve correlatiecoëfficiënt.

Ik hoor het graag!

Beantwoorden

Leon Smits
Leon Smits (Scribbr-team)
3 september 2020 om 17:11

Hoi Vincent,

Het is inderdaad een negatieve correlatie, de variabelen die je met elkaar vergeleken hebt hebben dus een tegengesteld effect (bijv. als het ene meer wordt, wordt het andere minder).
Of het resultaat significant is hangt af van de p-waarde die erbij staat.

Groetjes,
Leon

Beantwoorden

Julie
31 augustus 2020 om 14:52

Hallo,

Wanneer de correlatiecoefficient 0.80 is, hebben we een positief sterk verband en betekent dit als x stijgt zal y ook stijgen of omgekeerd? Maar als de p-waarde hierbij 0.06 is, is het verband niet significant, kan je dan nog steeds zeggen als x stijgt dat y ook zal stijgen of mag je daar geen uitspraken over doen (aangezien het niet significant is)?

En mag je dan zeggen dat de schaal valide is (hoge correlatie) of niet meer aangezien het niet significant is?

Alvast bedankt!

Beantwoorden

Leon Smits
Leon Smits (Scribbr-team)
31 augustus 2020 om 15:01

Hoi Julie,

Het is inderdaad niet significant, dus je kunt geen harde uitspraken doen over de resultaten. Echter, je zit wel enorm in de buurt van een significant resultaat.
Je kunt daarom wel iets zeggen over je resultaten en bijvoorbeeld aangeven dat het met iets meer gegevens misschien wel significant geweest was.
Dit doet inderdaad ook af aan de validiteit van je onderzoek, maar ook hierbij geldt dat je in de goede richting gaat.

Overleg dit voor de zekerheid even met je begeleider, hij/zij moet jou uiteindelijk beoordelen.

Groetjes,
Leon

Beantwoorden

Julie
31 augustus 2020 om 18:21

Hallo,

Ik ben even in de war met verband/samenhang en significantie.

Wanneer het verband niet significant is, maar zoals in mijn voorbeeld de correlatiecoefficient positief en hoog is, mag ik dan ook niet zeggen dat het een positief sterk verband is (aangezien de nulhypothese wordt aanvaard die zegt dat er geen verband is tussen de variabelen)?

Maw indien er geen significantie is, betekent de correlatiecoefficient niets?

Beantwoorden

Leon Smits
Leon Smits (Scribbr-team)
31 augustus 2020 om 19:39

Hoi Julie,

Dat de correlatie/samenhang hoog is kun je gewoon benoemen, maar omdat het resultaat niet significant is kun je geen harde conclusies trekken.
Die correlatiecoëfficiënt betekent zeker iets, alleen zul je altijd als kanttekening moeten benoemen dat je niet genoeg data had om een significant resultaat te vinden.

Ik hoop dat het zo duidelijk is!

Groetjes,
Leon

Beantwoorden

iris
17 augustus 2020 om 15:55

Hallo,

Ik heb een lezersonderzoek met totaal 150 personen onderverdeeld in drie groepen. Elke groep leest één van de drie teksten: 50 personen leest tekst 1, 50 tekst 2 en 50 tekst 3. Nu krijgen ze allemaal dezelfde vragen over de tekst en moeten ze antwoorden op een 4-punts likertschaal (helemaal mee eens, een beetje mee eens, een beetje mee oneens, helemaal mee oneens).

Met welke test kan ik het verband uitrekenen tussen de teksten (3 rijen) en hun oordeel over deze teksten (4 kolommen)?

Groet, Iris

Beantwoorden

Leon Smits
Leon Smits (Scribbr-team)
18 augustus 2020 om 13:35

Hoi Iris,

Je kunt de correlatie berekenen met de Spearman's R (voor een ordinale schaal), zoals uitgelegd in het artikel!

Groetjes,
Leon

Beantwoorden

S
13 augustus 2020 om 13:32

Hoihoi,

Als ik een variabele meet met behulp van 4 items (Likert schaal) en ik voeg deze items samen tot deze variabelen. Spreek ik dan nog steeds van een variabele op ordinale schaal? Of wordt het dan een continue schaal "scale"?

Beantwoorden

Leon Smits
Leon Smits (Scribbr-team)
13 augustus 2020 om 16:50

Hoi Stephanie,

Ik begrijp niet helemaal wat je bedoelt met het samenvoegen van de items?
Als je gebruik maakt van een Likert-schaal is het wel een ordinale schaal, hij wordt echter ook vaak als interval-schaal gebruikt.

Groetjes,
Leon

Beantwoorden

Ellen
21 juni 2020 om 19:06

Hoe komen jullie aan de Correlatiecoëfficiënt tabel. Kan ik deze ook ergens anders vinden? Er zijn zo veel verschillende bronnen voor deze interpretatie, welke hebben jullie gebruikt?

Beantwoorden

Leon Smits
Leon Smits (Scribbr-team)
22 juni 2020 om 20:03

Hoi Eileen,

Wij hebben de tabel op onze eigen ervaringen gebaseerd.

Groetjes,
Leon

Beantwoorden

Merel
15 juni 2020 om 15:50

Mijn enquete bestaat uit een Likertschaal. Klopt het dat de Spearman toets dan het meest voor de hand liggend is?

Beantwoorden

Judith
10 juni 2020 om 16:51

Wij leren dat we de steekproefgrootte met n moeten schrijven, hier staat N, dat moeten wij gebruiken voor de populatiegrootte. Wat is de juiste manier?

Beantwoorden

Leon Smits
Leon Smits (Scribbr-team)
10 juni 2020 om 18:45

Hoi Judith,

Hou vooral de methode van jouw opleiding aan! Wij geven slechts een algemene uitleg.

Groetjes,
Leon

Beantwoorden

T
5 juni 2020 om 00:19

ik heb een Pearson van -.101 en een sig. van .324.. dus ik heb een P waarde groter dan 0.05..... wat betekent dit?

Beantwoorden

Leon Smits
Leon Smits (Scribbr-team)
6 juni 2020 om 19:43

Hoi Thirsa,

Als de P waarde groter is dan 0.05 betekent dat dat je resultaat niet significant is.
Je kunt dan dus geen betrouwbare uitspraak doen over het resultaat.

Groetjes,
Leon

Beantwoorden

Stel een vraag of reageer.

Please click the checkbox on the left to verify that you are a not a bot.