Correlatie versus causaliteit: de verschillen | Met voorbeelden
Correlatie betekent dat er een statistisch verband is tussen variabelen. Causaliteit betekent dat een verandering in de ene variabele een verandering in de andere variabele veroorzaakt.
Tijdens colleges of tijdens je onderzoek zul je misschien weleens hebben gelezen dat “correlatie geen causaliteit of oorzakelijk verband impliceert”. Het is belangrijk om te begrijpen hoe de twee termen van elkaar verschillen, zodat je beter in staat bent wetenschappelijk onderzoek te interpreteren en evalueren.
Wat is het verschil tussen correlatie en causaliteit?
Als er sprake is van correlatie is er een statistisch verband tussen variabelen: als de ene variabele verandert, verandert de andere ook. De variabelen veranderen dus samen (covariëren), maar dat hoeft niet te komen door een (indirect) oorzakelijk verband. Dit betekent dat een verandering in de ene variabele niet per se de verandering in de andere variabele hoeft te veroorzaken.
Causaliteit betekent dat een verandering in de ene variabele de verandering in de andere variabele veroorzaakt. Er is dus een oorzaak-gevolgrelatie tussen variabelen. De twee variabelen zijn gecorreleerd én er is sprake van een causale relatie.
Een correlatie impliceert dus geen causaliteit, maar causaliteit impliceert wel altijd een correlatie.
Waarom staat een correlatie niet gelijk aan causaliteit?
Er zijn twee redenen waarom een correlatie niet hetzelfde is als causaliteit. Het is belangrijk om die twee redenen te begrijpen, omdat je anders verkeerde conclusies kunt trekken op basis van je data.
Het eerste probleem is de derde variabele (third variable problem). Dit betekent dat een confounding variabele beide variabelen beïnvloedt, waardoor er een causale relatie lijkt te bestaan die er niet is.
Het tweede probleem is de directionaliteit of richting (directionality problem). In dat geval correleren twee variabelen en zou er sprake kunnen zijn van een causale relatie, maar het is onmogelijk om vast te stellen welke variabele de oorzaak is en welke het gevolg.
Je moet het juiste type onderzoek en een goed design gebruiken om een onderscheid te kunnen maken tussen correlaties en causale relaties.
Correlationeel onderzoek kan alleen correlaties tussen variabelen vaststellen, terwijl experimentele onderzoeken gebruikt kunnen worden om causaliteit te toetsen.
Correlationeel onderzoek
Bij correlationeel onderzoek verzamel je data zonder je variabelen te manipuleren.
Correlationeel onderzoek gaat vaak gepaard met een hoge externe validiteit, waardoor je je resultaten meestal kunt generaliseren naar een grotere populatie. De interne validiteit van dit soort onderzoeken is echter laag, waardoor het moeilijk is om een oorzakelijk verband aan te tonen.
Deze onderzoeksdesigns worden vaak gebruikt als het te duur of niet ethisch is om gecontroleerde experimenten uit te voeren. Ze worden ook gebruikt om onderzoek te doen naar relaties waarbij geen causaliteit wordt vermoed.
Probleem 1: De derde variabele
Zonder een gecontroleerd experiment is het moeilijk om te bepalen of de variabele waarin je geïnteresseerd bent de verandering in een andere variabele heeft veroorzaakt. Externe variabelen (extraneous variables) zijn alle variabelen die ook invloed kunnen hebben op je resultaten, maar waarin je niet geïnteresseerd bent.
De beperkte mate van controle bij correlationeel onderzoek betekent dat externe of confounding variabelen alternatieve verklaringen kunnen vormen voor de gevonden resultaten. Confounding variabelen kunnen ervoor zorgen dat een relatie causaal lijkt, terwijl de relatie niet causaal is.
Als twee variabelen gecorreleerd zijn, kun je alleen zeggen dat een verandering in de ene variabele gepaard gaat met een verandering in de andere variabele.
Valse correlaties
Er is sprake van een valse correlatie (spurious correlation) als twee variabelen samen lijken te hangen door een verborgen derde variabele of door toeval.
Als je correlaties onderzoekt in een grote dataset met veel variabelen is de kans dat je minimaal één statistisch significant verband vindt heel groot. In dit geval maak je mogelijk een type I-fout waarbij je vanwege vertekende data de foutieve conclusie trekt dat er een correlatie bestaat tussen variabelen in je populatie.
Probleem 2: Directionaliteit
Om causaliteit aan te tonen moet je in staat zijn een directioneel verband tussen variabelen vast te stellen waarvoor geen alternatieve verklaringen te vinden zijn. Het verband kan uni-directioneel zijn (de ene variabele beïnvloedt de andere variabele) of bi-directioneel (beide variabelen beïnvloeden elkaar).
Met een correlationeel onderzoek kun je geen onderscheid maken tussen deze mogelijkheden, maar met een experimenteel design kan iedere mogelijke richting individueel worden getoetst.
Bij correlationeel onderzoek is de richting (directionaliteit) van het verband onduidelijk, omdat je niet voor alles hebt kunnen controleren. Daarom mag je bij correlationeel onderzoek geen conclusies trekken over causaliteit. Je zou per ongeluk omgekeerde causaliteit kunnen veronderstellen, waarbij je denkt dat variabele A een effect heeft op variabele B, terwijl in werkelijkheid variabele B invloed uitoefent op variabele A.
Causaal onderzoek
Causale verbanden tussen variabelen kunnen alleen worden aangetoond met gecontroleerde experimenten. In zulke onderzoeken toets je verwachtingen (hypothesen) om causaliteit te onderzoeken. Hierbij concentreer je je per keer op één richting van de relatie.
Experimenten worden gekenmerkt door een hoge interne validiteit, waardoor je met vrij grote zekerheid kunt stellen dat gevonden oorzaak-gevolgrelaties overeenstemmen met de werkelijkheid.
Je kunt de richting of directionaliteit van het verband aantonen, omdat je de onafhankelijke variabele manipuleert en de verandering in de afhankelijke variabele meet. Jouw manipulatie van de ene variabele leidt dus tot een verschil in de andere variabele.
In een gecontroleerd experiment kun je de invloed van andere variabelen minimaliseren door je participanten willekeurig te verdelen over experimentele groepen (randomiseren) en door een controlegroep te gebruiken.
Randomiseren helpt om ervoor te zorgen dat in iedere groep participanten met gelijke participant-eigenschappen zitten, zodat je groepen op elkaar lijken en vergelijkbaar zijn. Een controlegroep zorgt ervoor dat je je experimentele manipulatie kunt vergelijken met een soortgelijke behandeling of geen enkele behandeling.
Veelgestelde vragen
- Waarom impliceert een correlatie geen causaliteit?
-
Er zijn twee hoofdredenen voor het gebrek aan causaliteit bij correlaties.
- Andere variabelen (third variable problem): er zijn confounding variabelen die de twee onderzochte variabelen kunnen beïnvloeden, waardoor er onterecht een causaal verband lijkt te bestaan.
- Directionaliteit of richting (directionality problem): twee variabelen correleren en zouden een causale relatie kunnen hebben, maar het is niet mogelijk om vast te stellen of variabele A invloed uitoefent op variabele B, of andersom.
- Wat is het verschil tussen correlationeel en experimenteel onderzoek?
-
Met gecontroleerde experimenten kun je causaliteit aantonen, terwijl je met correlationeel onderzoek alleen verbanden tussen variabelen kunt aantonen.
- In een experimenteel onderzoek manipuleer je een onafhankelijke variabele en meet je de invloed op een afhankelijke variabele. Je controleert voor andere variabelen, zodat deze geen invloed kunnen uitoefenen op de resultaten.
- In correlationeel onderzoek meet je de variabelen zonder ze te manipuleren. Je kunt hierdoor vaststellen dat de variabelen samen veranderen (allebei toename, allebei afname of de een neemt toe en de ander neemt af), maar je kunt niet vaststellen of de verandering in variabele A de verandering in variabele B veroorzaakt.
Over het algemeen wordt correlationeel onderzoek gekenmerkt door een hoge externe validiteit, terwijl experimenteel onderzoek gepaard gaat met een hoge interne validiteit.
- Wat is het verschil tussen correlatie en causaliteit?
-
Een correlatie is een statistische indicator voor een verband tussen variabelen: als de ene variabele verandert, verandert de andere variabele ook, maar er hoeft geen oorzaak-gevolgrelatie te zijn. Correlaties worden onderzocht in correlationeel onderzoek.
Causaliteit betekent dat een verandering in de ene variabele een verandering in de andere variabele veroorzaakt. Er is dus wel sprake van een oorzaak-gevolgrelatie. De variabelen correleren én er is een causaal verband. Causaliteit wordt onderzocht in experimenteel onderzoek.
- Wat is een correlatie?
-
Een correlatie laat zien of er een verband is tussen twee of meerdere variabelen. Een correlatiecoëfficiënt kan de richting van het verband (positief, negatief) laten zien en geeft ook aan hoe sterk het verband is.
- Een positieve correlatie betekent dat beide variabelen samen toenemen of afnemen.
- Een negatieve correlatie betekent dat de ene variabele toeneemt, terwijl de andere variabele afneemt.
- Als de correlatiecoëfficiënt gelijk is aan 0, is er geen verband tussen de variabelen (zero correlation).
Correlationeel onderzoek is een niet-experimentele variant van kwantitatief onderzoek.
Citeer dit Scribbr-artikel
Als je naar deze bron wilt verwijzen, kun je de bronvermelding kopiëren of op “Citeer dit Scribbr-artikel” klikken om de bronvermelding automatisch toe te voegen aan onze gratis Bronnengenerator.