Wat is correlatie en hoe bereken je het?

Correlatie geeft de mate van samenhang tussen twee variabelen weer, ofwel in hoeverre twee variabelen elkaar beïnvloeden. De correlatie wordt uitgedrukt in de correlatiecoëfficiënt. De waarde van de correlatiecoëfficiënt ligt altijd tussen -1 en +1.

Een positieve correlatiecoëfficiënt dicht bij de waarde 1 geeft bijvoorbeeld aan dat langere studenten ook zwaarder zijn. Een correlatiecoëfficiënt dichter bij de 0 geeft aan dat het verband tussen gewicht en lengte zwakker is.

Wanneer gebruik je de correlatiecoëfficiënt?

Met de correlatiecoëfficiënt kun je de verbanden tussen de onafhankelijke en de afhankelijke variabelen in je conceptueel model testen. Je kunt bijvoorbeeld het verband testen tussen lengte (onafhankelijke variabele) en gewicht (afhankelijke variabele).

De correlatiecoëfficiënt kan ook gebruikt worden voor de selectie van variabelen voor een regressieanalyse.

Correlatiecoëfficiënt berekenen

Voor het bereken van de correlatiecoëfficiënt kun je gebruikmaken van Excel of SPSS.

Download het SPSS-bestand om met dezelfde data te oefenen.

Om de correlatiecoëfficiënt te bereken met SPSS klik je in de menubalk op:

  1. Analyze
  2. Correlate
  3. Bivariate.

Er verschijnt een scherm waarin je de variabelen selecteert die je wilt analyseren (gewicht en lengte). Kijk of ‘Pearson’ staat aangevinkt bij ‘Correlation Coefficients’, aangezien je op zoek bent naar de lineaire correlatie. Klik vervolgens op ‘ok’ om de analyse uit te voeren.

Correlatie berekenen SPSS

Pearson’s r vs. Spearman’s rs

Voor het berekenen van de correlatiecoëfficiënt kun je in SPSS twee toesten gebruiken, namelijk ‘Pearson’s r’ en ‘Spearman’s rs’.

  1. Pearson’s r is de meest gebruikte correlatiecoëfficiënt. Pearson’s r meet lineaire correlatie en kan gebruikt worden wanneer de variabelen op een continue schaal (‘scale’) gemeten worden, zoals gewicht en lengte.
  2. Spearman’s rkan gebruikt worden wanneer variabelen op de ordinale schaal gemeten worden zoals een 5-puntsschaal van ‘zeer mee oneens’ tot ‘zeer mee eens’.

Download het Excel-bestand om met dezelfde data te oefenen.

Ga in een lege cel staan en vul de formule =correlatie() of =correl() in. Tussen de haakjes selecteer je de gegevens uit beide kolommen, gescheiden door een komma of puntkomma, waarna Excel de correlatiecoëfficiënt van gewicht en lengte zal teruggeven.

Correlatie berekenen Excel

Correlatiecoëfficiënt interpreteren

Nadat SPSS of Excel de correlatiecoëfficiënt heeft berekend, moet je deze interpreteren. Let bij het interpreteren op:

  • Of het verband positief of negatief is
  • De grootte van de correlatiecoëfficiënt (tussen -1 en +1)
  • De p-waarde (of Sig.) die de significantie van het verband aangeeft (alleen in SPSS)

Je kunt de grootte van de correlatiecoëfficiënt als volgt interpreteren:

0.00 – 0.30nauwelijks of geen correlatie
0.30 – 0.50lage of zwakke correlatie
0.50 – 0.70middelmatige correlatie
0.70 – 0.90hoge of sterke correlatie
0.90 – 1.00zeer hoge of zeer sterke correlatie

Correlatie interpreteren met spreidingsdiagrammen

Naast het berekenen van de correlatiecoëfficiënt kun je ook een spreidingsdiagram of scatterplot genereren. Dit geeft je een beeld van de relatie tussen twee variabelen.

Genereer zelf een spreidingsdiagram in Excel of SPSS door de onderstaande stappen te volgen:

Excel: Invoegen → grafiek → spreidingsdiagram
SPSS: Graph → chart builder → scatterplot → sleep de variabelen naar de grafiek

De onderstaande spreidingsdiagrammen tonen een zeer hoge positieve correlatie (links) en een hoge negatieve correlatie (rechts).

De observaties liggen in het spreidingsdiagram aan de linkerkant beter op één lijn dan de observaties in het spreidingsdiagram aan de rechterkant, wat duidt op een sterker verband en dus een hogere ‘r-waarde’.

spreidingsdiagram

Hoewel de correlatiecoëfficiënt een beeld geeft van de samenhang tussen variabelen, kun je niet zomaar conclusies trekken op basis van de correlatiecoëfficiënt.

Correlatie en causaliteit

Correlatie duidt slechts op een samenhang en niet op een oorzakelijk verband. Op basis van de correlatiecoëfficiënt is alleen te zeggen of gewicht en lengte samenhangen, niet of het één het ander veroorzaakt. Het is ook mogelijk dat een andere variabele zowel het gewicht als de lengte beïnvloedt.

Als je wilt bepalen of er een oorzakelijk verband bestaat, dan kun je beter experimenteel onderzoek, of regressie met meerdere controlevariabelen gebruiken.

Een gebrek aan correlatie betekent onafhankelijkheid

Pearson’s r en Excel testen alleen of er een lineair verband bestaat tussen twee variabelen. Een gebrek aan correlatie betekent echter niet dat er geen enkel verband bestaat tussen de variabelen.

In het spreidingsdiagram aan de linkerkant bestaat er geen verband tussen de variabelen, maar in het spreidingsdiagram aan de rechterkant is er wel degelijk sprake van een duidelijk (kwadratisch) verband. Dit is te herkennen aan de omgekeerde u-vorm.Kwadratisch verband spreidingsdiagram

Voorbeeld kwadratisch verband
Twee variabelen met een kwadratisch verband zijn een tennisnet en de hoogte van de tennisbal. In het midden bij het tennisnet is de bal op z’n hoogst, maar de hoogte neemt af nadat deze het tennisnet is gepasseerd.

Het is daarom verstandig om naast een test voor correlatie ook een spreidingsdiagram te maken, waar je mogelijk een niet-lineair verband kunt zien.

Correlatie rapporteren

De correlatiecoëfficiënt vermeld je in het resultatenhoofdstuk. Wanneer je de correlatiecoëfficiënt rapporteert, meld je in ieder geval:

  • Of de correlatiecoëfficiënt positief of negatief is
  • De p-waarde (significantie) van de correlatiecoëfficiënt, p < 0,05 is significant
  • Of er sprake is van sterke of zwakke samenhang (hoge of lage ‘r-waarde’)
  • De steekproefgrootte N in haakjes achter r

In formules wordt de correlatiecoëfficiënt aangeduid met de Griekse letter ‘’ (rho). Als je het echter hebt over de correlatiecoëfficiënt van een steekproef (in plaats van de hele populatie) gebruik je de letter ‘r’ in formules en tekst. Let op: de APA-stijl heeft nog meer richtlijnen voor het rapporteren van statistische resultaten.

Voorbeeldzinnen die je kunt gebruiken zijn:

  • Er was sprake van een niet-significante, hoge positieve correlatie tussen gewicht en lengte (r = ,72; p = ,172; N = 5)
  • De Pearson-correlatie wees uit dat er een niet-significant, sterk verband bestaat tussen gewicht en lengte r = ,72; p = ,172.

Formule correlatiecoëfficiënt

Hoewel programma’s als Excel en SPSS de correlatiecoëfficiënt voor je kunnen berekenen, kan het soms ook handig zijn om zelf de formule te kennen. De formule is als volgt:

Formule correlatie

De symbolen hebben de volgende betekenis:

Cov(x,y) = De covariantie tussen variabelen x en y
Σ = Som van alles wat tussen de haakjes volgt.
xi = De observatie
x = Gemiddelde van de steekproef
s(x) = De standaarddeviatie van de steekproef
N = De steekproefgrootte

Wat vind jij van dit artikel?
Lars van Heijst

Lars schrijft artikelen over statistiek. Hij heeft psychologie en economie gestudeerd en is dus goed op de hoogte van de vele statistiek die binnen deze disciplines wordt gebruikt.

1 reactie

Lars van Heijst
Lars van Heijst (Scribbr-team)
12 oktober 2018 om 10:38

Ik hoop dat dit artikel je heeft geholpen. Heb je nog vragen? Ik doe mijn best om ze zo snel mogelijk te beantwoorden. :)

Stel een vraag of reageer.