Correlatie Begrijpen en Berekenen met SPSS en Excel | Stappenplan

Correlatie geeft de mate van samenhang tussen twee variabelen weer, ofwel in hoeverre twee variabelen elkaar beïnvloeden. De correlatie wordt uitgedrukt in de correlatiecoëfficiënt. De waarde van de correlatiecoëfficiënt ligt altijd tussen -1 en +1.

Een positieve correlatiecoëfficiënt dicht bij de waarde 1 geeft bijvoorbeeld aan dat langere studenten ook zwaarder zijn. Een correlatiecoëfficiënt dichter bij de 0 geeft aan dat het verband tussen gewicht en lengte zwakker is.

Wanneer gebruik je de correlatiecoëfficiënt?

Met de correlatiecoëfficiënt kun je de verbanden tussen de onafhankelijke en de afhankelijke variabelen in je conceptueel model testen. Je kunt bijvoorbeeld het verband testen tussen lengte (onafhankelijke variabele) en gewicht (afhankelijke variabele).

De correlatiecoëfficiënt kan ook gebruikt worden voor de selectie van variabelen voor een regressieanalyse.

Correlatiecoëfficiënt berekenen

Voor het bereken van de correlatiecoëfficiënt kun je gebruikmaken van Excel of SPSS.

Download het SPSS-bestand om met dezelfde data te oefenen.

Om de correlatiecoëfficiënt te bereken met SPSS klik je in de menubalk op:

  1. Analyze
  2. Correlate
  3. Bivariate.

Er verschijnt een scherm waarin je de variabelen selecteert die je wilt analyseren (gewicht en lengte). Kijk of ‘Pearson’ staat aangevinkt bij ‘Correlation Coefficients’, aangezien je op zoek bent naar de lineaire correlatie. Klik vervolgens op ‘ok’ om de analyse uit te voeren.

Correlatie berekenen SPSS

Pearson’s r vs. Spearman’s rs

Voor het berekenen van de correlatiecoëfficiënt kun je in SPSS twee toesten gebruiken, namelijk ‘Pearson’s r’ en ‘Spearman’s rs’.

  1. Pearson’s r is de meest gebruikte correlatiecoëfficiënt. Pearson’s r meet lineaire correlatie en kan gebruikt worden wanneer de variabelen op een continue schaal (‘scale’) gemeten worden, zoals gewicht en lengte.
  2. Spearman’s rkan gebruikt worden wanneer variabelen op de ordinale schaal gemeten worden zoals een 5-puntsschaal van ‘zeer mee oneens’ tot ‘zeer mee eens’.

Download het Excel-bestand om met dezelfde data te oefenen.

Ga in een lege cel staan en vul de formule =correlatie() of =correl() in. Tussen de haakjes selecteer je de gegevens uit beide kolommen, gescheiden door een komma of puntkomma, waarna Excel de correlatiecoëfficiënt van gewicht en lengte zal teruggeven.

Correlatie berekenen Excel

Correlatiecoëfficiënt interpreteren

Nadat SPSS of Excel de correlatiecoëfficiënt heeft berekend, moet je deze interpreteren. Let bij het interpreteren op:

  • Of het verband positief of negatief is
  • De grootte van de correlatiecoëfficiënt (tussen -1 en +1)
  • De p-waarde (of Sig.) die de significantie van het verband aangeeft (alleen in SPSS)

Je kunt de grootte van de correlatiecoëfficiënt als volgt interpreteren:

0.00 – 0.30 nauwelijks of geen correlatie
0.30 – 0.50 lage of zwakke correlatie
0.50 – 0.70 middelmatige correlatie
0.70 – 0.90 hoge of sterke correlatie
0.90 – 1.00 zeer hoge of zeer sterke correlatie

Correlatie interpreteren met spreidingsdiagrammen

Naast het berekenen van de correlatiecoëfficiënt kun je ook een spreidingsdiagram of scatterplot genereren. Dit geeft je een beeld van de relatie tussen twee variabelen.

Genereer zelf een spreidingsdiagram in Excel of SPSS door de onderstaande stappen te volgen:

Excel: Invoegen → grafiek → spreidingsdiagram
SPSS: Graph → chart builder → scatterplot → sleep de variabelen naar de grafiek

De onderstaande spreidingsdiagrammen tonen een zeer hoge positieve correlatie (links) en een hoge negatieve correlatie (rechts).

De observaties liggen in het spreidingsdiagram aan de linkerkant beter op één lijn dan de observaties in het spreidingsdiagram aan de rechterkant, wat duidt op een sterker verband en dus een hogere ‘r-waarde’.

spreidingsdiagram

Hoewel de correlatiecoëfficiënt een beeld geeft van de samenhang tussen variabelen, kun je niet zomaar conclusies trekken op basis van de correlatiecoëfficiënt.

Correlatie en causaliteit

Correlatie duidt slechts op een samenhang en niet op een oorzakelijk verband. Op basis van de correlatiecoëfficiënt is alleen te zeggen of gewicht en lengte samenhangen, niet of het één het ander veroorzaakt. Het is ook mogelijk dat een andere variabele zowel het gewicht als de lengte beïnvloedt.

Als je wilt bepalen of er een oorzakelijk verband bestaat, dan kun je beter experimenteel onderzoek, of regressie met meerdere controlevariabelen gebruiken.

Een gebrek aan correlatie betekent onafhankelijkheid

Pearson’s r en Excel testen alleen of er een lineair verband bestaat tussen twee variabelen. Een gebrek aan correlatie betekent echter niet dat er geen enkel verband bestaat tussen de variabelen.

In het spreidingsdiagram aan de linkerkant bestaat er geen verband tussen de variabelen, maar in het spreidingsdiagram aan de rechterkant is er wel degelijk sprake van een duidelijk (kwadratisch) verband. Dit is te herkennen aan de omgekeerde u-vorm.Kwadratisch verband spreidingsdiagram

Voorbeeld kwadratisch verband
Twee variabelen met een kwadratisch verband zijn een tennisnet en de hoogte van de tennisbal. In het midden bij het tennisnet is de bal op z’n hoogst, maar de hoogte neemt af nadat deze het tennisnet is gepasseerd.

Het is daarom verstandig om naast een test voor correlatie ook een spreidingsdiagram te maken, waar je mogelijk een niet-lineair verband kunt zien.

Correlatie rapporteren

De correlatiecoëfficiënt vermeld je in het resultatenhoofdstuk. Wanneer je de correlatiecoëfficiënt rapporteert, meld je in ieder geval:

  • Of de correlatiecoëfficiënt positief of negatief is
  • De p-waarde (significantie) van de correlatiecoëfficiënt, p < 0.05 is significant
  • Of er sprake is van sterke of zwakke samenhang (hoge of lage ‘r-waarde’)
  • De steekproefgrootte N in haakjes achter r

In formules wordt de correlatiecoëfficiënt aangeduid met de Griekse letter ‘’ (rho). Als je het echter hebt over de correlatiecoëfficiënt van een steekproef (in plaats van de hele populatie) gebruik je de letter ‘r’ in formules en tekst. Let op: de APA-stijl heeft nog meer richtlijnen voor het rapporteren van statistische resultaten.

Voorbeeldzinnen die je kunt gebruiken zijn:

  • Er was sprake van een niet-significante, hoge positieve correlatie tussen gewicht en lengte (r = .72; p = .172; N = 5)
  • De Pearson-correlatie wees uit dat er een niet-significant, sterk verband bestaat tussen gewicht en lengte r = .72; p = .172.

Formule correlatiecoëfficiënt

Hoewel programma’s als Excel en SPSS de correlatiecoëfficiënt voor je kunnen berekenen, kan het soms ook handig zijn om zelf de formule te kennen. De formule is als volgt:

Formule correlatie

De symbolen hebben de volgende betekenis:

Cov(x,y) = De covariantie tussen variabelen x en y
Σ = Som van alles wat tussen de haakjes volgt.
xi = De observatie
x = Gemiddelde van de steekproef
s(x) = De standaarddeviatie van de steekproef
N = De steekproefgrootte

Veelgestelde vragen

Wat is een correlatie?

Een correlatie laat zien of er een verband is tussen twee of meerdere variabelen. Een correlatiecoëfficiënt kan de richting van het verband (positief, negatief) laten zien en geeft ook aan hoe sterk het verband is.

  • Een positieve correlatie betekent dat beide variabelen samen toenemen of afnemen.
  • Een negatieve correlatie betekent dat de ene variabele toeneemt, terwijl de andere variabele afneemt.
  • Als de correlatiecoëfficiënt gelijk is aan 0, is er geen verband tussen de variabelen (zero correlation).

Correlationeel onderzoek is een niet-experimentele variant van kwantitatief onderzoek.

Wat is het verschil tussen correlatie en causaliteit?

Een correlatie is een statistische indicator voor een verband tussen variabelen: als de ene variabele verandert, verandert de andere variabele ook, maar er hoeft geen oorzaak-gevolgrelatie te zijn. Correlaties worden onderzocht in correlationeel onderzoek.

Causaliteit betekent dat een verandering in de ene variabele een verandering in de andere variabele veroorzaakt. Er is dus wel sprake van een oorzaak-gevolgrelatie. De variabelen correleren én er is een causaal verband. Causaliteit wordt onderzocht in experimenteel onderzoek.

Wat is correlationeel onderzoek?

Correlationeel onderzoek wordt gebruikt om de relatie tussen twee (of meer) variabelen te onderzoeken zonder dat de onderzoeker de variabelen manipuleert of controleert. Het is een niet-experimentele variant van kwantitatief onderzoek, waardoor je geen causaliteit kunt vaststellen.

 

Waarom impliceert een correlatie geen causaliteit?

Er zijn twee hoofdredenen voor het gebrek aan causaliteit bij correlaties.

  1. Andere variabelen (third variable problem): er zijn confounding variabelen die de twee onderzochte variabelen kunnen beïnvloeden, waardoor er onterecht een causaal verband lijkt te bestaan.
  2. Directionaliteit of richting (directionality problem): twee variabelen correleren en zouden een causale relatie kunnen hebben, maar het is niet mogelijk om vast te stellen of variabele A invloed uitoefent op variabele B, of andersom.

Citeer dit Scribbr-artikel

Als je naar deze bron wilt verwijzen, kun je de bronvermelding kopiëren of op “Citeer dit Scribbr-artikel” klikken om de bronvermelding automatisch toe te voegen aan onze gratis Bronnengenerator.

van Heijst, L. (2022, 22 augustus). Correlatie Begrijpen en Berekenen met SPSS en Excel | Stappenplan. Scribbr. Geraadpleegd op 22 april 2024, van https://www.scribbr.nl/statistiek/correlatie/

Wat vind jij van dit artikel?
Lars van Heijst

Lars schrijft artikelen over statistiek. Hij heeft psychologie en economie gestudeerd en is dus goed op de hoogte van de vele statistiek die binnen deze disciplines wordt gebruikt.