Correlatie Begrijpen en Berekenen met SPSS en Excel | Stappenplan
Correlatie geeft de mate van samenhang tussen twee variabelen weer, ofwel in hoeverre twee variabelen elkaar beïnvloeden. De correlatie wordt uitgedrukt in de correlatiecoëfficiënt. De waarde van de correlatiecoëfficiënt ligt altijd tussen -1 en +1.
Een positieve correlatiecoëfficiënt dicht bij de waarde 1 geeft bijvoorbeeld aan dat langere studenten ook zwaarder zijn. Een correlatiecoëfficiënt dichter bij de 0 geeft aan dat het verband tussen gewicht en lengte zwakker is.
Wanneer gebruik je de correlatiecoëfficiënt?
Met de correlatiecoëfficiënt kun je de verbanden tussen de onafhankelijke en de afhankelijke variabelen in je conceptueel model testen. Je kunt bijvoorbeeld het verband testen tussen lengte (onafhankelijke variabele) en gewicht (afhankelijke variabele).
De correlatiecoëfficiënt kan ook gebruikt worden voor de selectie van variabelen voor een regressieanalyse.
Correlatiecoëfficiënt berekenen
Voor het bereken van de correlatiecoëfficiënt kun je gebruikmaken van Excel of SPSS.
Om de correlatiecoëfficiënt te bereken met SPSS klik je in de menubalk op:
- Analyze
- Correlate
- Bivariate.
Er verschijnt een scherm waarin je de variabelen selecteert die je wilt analyseren (gewicht en lengte). Kijk of ‘Pearson’ staat aangevinkt bij ‘Correlation Coefficients’, aangezien je op zoek bent naar de lineaire correlatie. Klik vervolgens op ‘ok’ om de analyse uit te voeren.
Pearson’s r vs. Spearman’s rs
Voor het berekenen van de correlatiecoëfficiënt kun je in SPSS twee toesten gebruiken, namelijk ‘Pearson’s r’ en ‘Spearman’s rs’.
- Pearson’s r is de meest gebruikte correlatiecoëfficiënt. Pearson’s r meet lineaire correlatie en kan gebruikt worden wanneer de variabelen op een continue schaal (‘scale’) gemeten worden, zoals gewicht en lengte.
- Spearman’s rs kan gebruikt worden wanneer variabelen op de ordinale schaal gemeten worden zoals een 5-puntsschaal van ‘zeer mee oneens’ tot ‘zeer mee eens’.
Download het Excel-bestand om met dezelfde data te oefenen.
Ga in een lege cel staan en vul de formule =correlatie() of =correl() in. Tussen de haakjes selecteer je de gegevens uit beide kolommen, gescheiden door een komma of puntkomma, waarna Excel de correlatiecoëfficiënt van gewicht en lengte zal teruggeven.
Correlatiecoëfficiënt interpreteren
Nadat SPSS of Excel de correlatiecoëfficiënt heeft berekend, moet je deze interpreteren. Let bij het interpreteren op:
- Of het verband positief of negatief is
- De grootte van de correlatiecoëfficiënt (tussen -1 en +1)
- De p-waarde (of Sig.) die de significantie van het verband aangeeft (alleen in SPSS)
Je kunt de grootte van de correlatiecoëfficiënt als volgt interpreteren:
0.00 – 0.30 | nauwelijks of geen correlatie |
---|---|
0.30 – 0.50 | lage of zwakke correlatie |
0.50 – 0.70 | middelmatige correlatie |
0.70 – 0.90 | hoge of sterke correlatie |
0.90 – 1.00 | zeer hoge of zeer sterke correlatie |
Correlatie interpreteren met spreidingsdiagrammen
Naast het berekenen van de correlatiecoëfficiënt kun je ook een spreidingsdiagram of scatterplot genereren. Dit geeft je een beeld van de relatie tussen twee variabelen.
Genereer zelf een spreidingsdiagram in Excel of SPSS door de onderstaande stappen te volgen:
Excel: Invoegen → grafiek → spreidingsdiagram
SPSS: Graph → chart builder → scatterplot → sleep de variabelen naar de grafiek
De onderstaande spreidingsdiagrammen tonen een zeer hoge positieve correlatie (links) en een hoge negatieve correlatie (rechts).
De observaties liggen in het spreidingsdiagram aan de linkerkant beter op één lijn dan de observaties in het spreidingsdiagram aan de rechterkant, wat duidt op een sterker verband en dus een hogere ‘r-waarde’.
Hoewel de correlatiecoëfficiënt een beeld geeft van de samenhang tussen variabelen, kun je niet zomaar conclusies trekken op basis van de correlatiecoëfficiënt.
Correlatie en causaliteit
Correlatie duidt slechts op een samenhang en niet op een oorzakelijk verband. Op basis van de correlatiecoëfficiënt is alleen te zeggen of gewicht en lengte samenhangen, niet of het één het ander veroorzaakt. Het is ook mogelijk dat een andere variabele zowel het gewicht als de lengte beïnvloedt.
Als je wilt bepalen of er een oorzakelijk verband bestaat, dan kun je beter experimenteel onderzoek, of regressie met meerdere controlevariabelen gebruiken.
Een gebrek aan correlatie betekent onafhankelijkheid
Pearson’s r en Excel testen alleen of er een lineair verband bestaat tussen twee variabelen. Een gebrek aan correlatie betekent echter niet dat er geen enkel verband bestaat tussen de variabelen.
In het spreidingsdiagram aan de linkerkant bestaat er geen verband tussen de variabelen, maar in het spreidingsdiagram aan de rechterkant is er wel degelijk sprake van een duidelijk (kwadratisch) verband. Dit is te herkennen aan de omgekeerde u-vorm.
Voorbeeld kwadratisch verband
Twee variabelen met een kwadratisch verband zijn een tennisnet en de hoogte van de tennisbal. In het midden bij het tennisnet is de bal op z’n hoogst, maar de hoogte neemt af nadat deze het tennisnet is gepasseerd.
Het is daarom verstandig om naast een test voor correlatie ook een spreidingsdiagram te maken, waar je mogelijk een niet-lineair verband kunt zien.
Correlatie rapporteren
De correlatiecoëfficiënt vermeld je in het resultatenhoofdstuk. Wanneer je de correlatiecoëfficiënt rapporteert, meld je in ieder geval:
- Of de correlatiecoëfficiënt positief of negatief is
- De p-waarde (significantie) van de correlatiecoëfficiënt, p < 0.05 is significant
- Of er sprake is van sterke of zwakke samenhang (hoge of lage ‘r-waarde’)
- De steekproefgrootte N in haakjes achter r
In formules wordt de correlatiecoëfficiënt aangeduid met de Griekse letter ‘⍴’ (rho). Als je het echter hebt over de correlatiecoëfficiënt van een steekproef (in plaats van de hele populatie) gebruik je de letter ‘r’ in formules en tekst. Let op: de APA-stijl heeft nog meer richtlijnen voor het rapporteren van statistische resultaten.
Voorbeeldzinnen die je kunt gebruiken zijn:
- Er was sprake van een niet-significante, hoge positieve correlatie tussen gewicht en lengte (r = .72; p = .172; N = 5)
- De Pearson-correlatie wees uit dat er een niet-significant, sterk verband bestaat tussen gewicht en lengte r = .72; p = .172.
Formule correlatiecoëfficiënt
Hoewel programma’s als Excel en SPSS de correlatiecoëfficiënt voor je kunnen berekenen, kan het soms ook handig zijn om zelf de formule te kennen. De formule is als volgt:
De symbolen hebben de volgende betekenis:
Cov(x,y) = De covariantie tussen variabelen x en y
Σ = Som van alles wat tussen de haakjes volgt.
xi = De observatie
x = Gemiddelde van de steekproef
s(x) = De standaarddeviatie van de steekproef
N = De steekproefgrootte
Veelgestelde vragen
- Wat is een correlatie?
-
Een correlatie laat zien of er een verband is tussen twee of meerdere variabelen. Een correlatiecoëfficiënt kan de richting van het verband (positief, negatief) laten zien en geeft ook aan hoe sterk het verband is.
- Een positieve correlatie betekent dat beide variabelen samen toenemen of afnemen.
- Een negatieve correlatie betekent dat de ene variabele toeneemt, terwijl de andere variabele afneemt.
- Als de correlatiecoëfficiënt gelijk is aan 0, is er geen verband tussen de variabelen (zero correlation).
Correlationeel onderzoek is een niet-experimentele variant van kwantitatief onderzoek.
- Wat is het verschil tussen correlatie en causaliteit?
-
Een correlatie is een statistische indicator voor een verband tussen variabelen: als de ene variabele verandert, verandert de andere variabele ook, maar er hoeft geen oorzaak-gevolgrelatie te zijn. Correlaties worden onderzocht in correlationeel onderzoek.
Causaliteit betekent dat een verandering in de ene variabele een verandering in de andere variabele veroorzaakt. Er is dus wel sprake van een oorzaak-gevolgrelatie. De variabelen correleren én er is een causaal verband. Causaliteit wordt onderzocht in experimenteel onderzoek.
- Wat is correlationeel onderzoek?
-
Correlationeel onderzoek wordt gebruikt om de relatie tussen twee (of meer) variabelen te onderzoeken zonder dat de onderzoeker de variabelen manipuleert of controleert. Het is een niet-experimentele variant van kwantitatief onderzoek, waardoor je geen causaliteit kunt vaststellen.
- Waarom impliceert een correlatie geen causaliteit?
-
Er zijn twee hoofdredenen voor het gebrek aan causaliteit bij correlaties.
- Andere variabelen (third variable problem): er zijn confounding variabelen die de twee onderzochte variabelen kunnen beïnvloeden, waardoor er onterecht een causaal verband lijkt te bestaan.
- Directionaliteit of richting (directionality problem): twee variabelen correleren en zouden een causale relatie kunnen hebben, maar het is niet mogelijk om vast te stellen of variabele A invloed uitoefent op variabele B, of andersom.
Citeer dit Scribbr-artikel
Als je naar deze bron wilt verwijzen, kun je de bronvermelding kopiëren of op “Citeer dit Scribbr-artikel” klikken om de bronvermelding automatisch toe te voegen aan onze gratis Bronnengenerator.