Correlatie versus causaliteit: de verschillen | Met voorbeelden

Correlatie betekent dat er een statistisch verband is tussen variabelen. Causaliteit betekent dat een verandering in de ene variabele een verandering in de andere variabele veroorzaakt.

Tijdens colleges of tijdens je onderzoek zul je misschien weleens hebben gelezen dat “correlatie geen causaliteit of oorzakelijk verband impliceert”. Het is belangrijk om te begrijpen hoe de twee termen van elkaar verschillen, zodat je beter in staat bent wetenschappelijk onderzoek te interpreteren en evalueren.

Wat is het verschil tussen correlatie en causaliteit?

Als er sprake is van correlatie is er een statistisch verband tussen variabelen: als de ene variabele verandert, verandert de andere ook. De variabelen veranderen dus samen (covariëren), maar dat hoeft niet te komen door een (indirect) oorzakelijk verband. Dit betekent dat een verandering in de ene variabele niet per se de verandering in de andere variabele hoeft te veroorzaken.

Causaliteit betekent dat een verandering in de ene variabele de verandering in de andere variabele veroorzaakt. Er is dus een oorzaak-gevolgrelatie tussen variabelen. De twee variabelen zijn gecorreleerd én er is sprake van een causale relatie.

Een correlatie impliceert dus geen causaliteit, maar causaliteit impliceert wel altijd een correlatie.

Ontvang feedback op taal, structuur, lay-out en bronvermelding

Professionele Scribbr-editors kijken je scriptie na op:

  • Academisch taalgebruik
  • Onduidelijke zinnen
  • Grammaticale fouten
  • Interpunctie
  • Verboden woorden

Bekijk het voorbeeld

Waarom staat een correlatie niet gelijk aan causaliteit?

Er zijn twee redenen waarom een correlatie niet hetzelfde is als causaliteit. Het is belangrijk om die twee redenen te begrijpen, omdat je anders verkeerde conclusies kunt trekken op basis van je data.

Het eerste probleem is de derde variabele (third variable problem). Dit betekent dat een confounding variabele beide variabelen beïnvloedt, waardoor er een causale relatie lijkt te bestaan die er niet is.

Voorbeeld: Een derde variabele
De verkoop van ijsjes is sterk gecorreleerd met het aantal misdaden. Des te meer ijsjes worden verkocht, des te meer misdaden worden gepleegd. Toch is hier geen sprake van een causaal verband. Een derde variabele, namelijk de temperatuur, zorgt zowel voor de verkoop van meer ijsjes als voor een toename in criminaliteit.

Het tweede probleem is de directionaliteit of richting (directionality problem). In dat geval correleren twee variabelen en zou er sprake kunnen zijn van een causale relatie, maar het is onmogelijk om vast te stellen welke variabele de oorzaak is en welke het gevolg.

Voorbeeld: Directionaliteit
Vitamine D-spiegels correleren met depressie. Het is mogelijk dat een verandering in de ene variabele een verandering in de andere variabele veroozaakt. Het is echter niet duidelijk of een lage vitamine D-spiegel bijdraagt aan depressie of dat een depressie zorgt voor een lagere vitamine D-inname.

Je moet het juiste type onderzoek en een goed design gebruiken om een onderscheid te kunnen maken tussen correlaties en causale relaties.

Correlationeel onderzoek kan alleen correlaties tussen variabelen vaststellen, terwijl experimentele onderzoeken gebruikt kunnen worden om causaliteit te toetsen.

Correlationeel onderzoek

Bij correlationeel onderzoek verzamel je data zonder je variabelen te manipuleren.

Voorbeeld: Correlationeel onderzoek
Je verzamelt enquêtedata om te onderzoeken of er een relatie is tussen fysieke activiteit en het zelfbeeld. Je vraagt participanten om aan te geven hoeveel ze bewegen en je gebruikt een gestandaardiseerde vragenlijst om het zelfbeeld te meten.

Je merkt op dat de mate van fysieke activiteit positief correleert met het zelfvertrouwen: minder fysieke activiteit hangt samen met een lager zelfbeeld, terwijl meer fysieke activiteit samenhangt met een hoger zelfbeeld.

Correlationeel onderzoek gaat vaak gepaard met een hoge externe validiteit, waardoor je je resultaten meestal kunt generaliseren naar een grotere populatie. De interne validiteit van dit soort onderzoeken is echter laag, waardoor het moeilijk is om een oorzakelijk verband aan te tonen.

Deze onderzoeksdesigns worden vaak gebruikt als het te duur of niet ethisch is om gecontroleerde experimenten uit te voeren. Ze worden ook gebruikt om onderzoek te doen naar relaties waarbij geen causaliteit wordt vermoed.

Voorbeeld: Correlationeel onderzoek
Om te onderzoeken of blootstelling aan gewelddadige videogames in verband staat met agressie, verzamel je data over het spelen van gewelddadige videogames en het gedrag van kinderen. Je vraagt ouders om aan te geven hoeveel uur per week hun kind gewelddadige videogames speelt en vervolgens neem je een vragenlijst over het gedrag af bij de ouders en leerkrachten.

Je ontdekt een positieve correlatie tussen de twee variabelen: kinderen die vaker gewelddadige videogames spelen vertonen over het algemeen vaker agressief gedrag dan kinderen die minder vaak gewelddadige videogames spelen.

Probleem 1: De derde variabele

Zonder een gecontroleerd experiment is het moeilijk om te bepalen of de variabele waarin je geïnteresseerd bent de verandering in een andere variabele heeft veroorzaakt. Externe variabelen (extraneous variables) zijn alle variabelen die ook invloed kunnen hebben op je resultaten, maar waarin je niet geïnteresseerd bent.

De beperkte mate van controle bij correlationeel onderzoek betekent dat externe of confounding variabelen alternatieve verklaringen kunnen vormen voor de gevonden resultaten. Confounding variabelen kunnen ervoor zorgen dat een relatie causaal lijkt, terwijl de relatie niet causaal is.

Voorbeeld: Externe en confounding variabelen
In je onderzoek naar gewelddadige videogames en agressie kan de mate van ouderlijke aandacht een confounding variabele zijn die invloed uitoefent op het aantal uren dat kinderen de videogames spelen én op het agressieve gedrag. Een lage mate van ouderlijke aandacht kan zowel het aantal uren dat kinderen videogames spelen en de mate van agressief gedrag verhogen.

Dit is niet iets waarvoor je hebt gecontroleerd in je onderzoek, waardoor je alleen uitspraken kunt doen over een correlatie tussen je hoofdvariabelen.

Als twee variabelen gecorreleerd zijn, kun je alleen zeggen dat een verandering in de ene variabele gepaard gaat met een verandering in de andere variabele.

Lees waarom zo veel studenten Scribbr inschakelen

Ontdek nakijken op taal

Valse correlaties

Er is sprake van een valse correlatie (spurious correlation) als twee variabelen samen lijken te hangen door een verborgen derde variabele of door toeval.

Voorbeeld: Valse correlatie
In Duitsland en Denemarken is er duidelijk statistisch bewijs voor een positieve correlatie tussen het aantal ooievaars en de geboortecijfers. Als het aantal ooievaars daalt, daalt ook het aantal geboortes en als het aantal ooievaars stijgt, stijgt het aantal geboortes. Hoe kan dit patroon worden verklaard?

In de Theory of the Stork wordt een simpele conclusie getrokken: ooievaars brengen baby’s naar de huizen van mensen. Dit satirische onderzoek laat zien waarom je geen causaliteit kunt afleiden uit enkel correlationeel onderzoek.

In werkelijkheid is het veel waarschijnlijker dat de correlatie wordt verklaard door andere variabelen (zoals het weer, veranderingen in de omgeving, et cetera) of dat het verband puur toeval is.

Als je correlaties onderzoekt in een grote dataset met veel variabelen is de kans dat je minimaal één statistisch significant verband vindt heel groot. In dit geval maak je mogelijk een type I-fout waarbij je vanwege vertekende data de foutieve conclusie trekt dat er een correlatie bestaat tussen variabelen in je populatie.

Probleem 2: Directionaliteit

Om causaliteit aan te tonen moet je in staat zijn een directioneel verband tussen variabelen vast te stellen waarvoor geen alternatieve verklaringen te vinden zijn. Het verband kan uni-directioneel zijn (de ene variabele beïnvloedt de andere variabele) of bi-directioneel (beide variabelen beïnvloeden elkaar).

Met een correlationeel onderzoek kun je geen onderscheid maken tussen deze mogelijkheden, maar met een experimenteel design kan iedere mogelijke richting individueel worden getoetst.

Voorbeeld: Directionaliteit
De variabelen “fysieke activiteit” en “zelfbeeld” kunnen op drie manieren een causale relatie hebben:

  • Fysieke activiteit beïnvloedt het zelfbeeld
  • Het zelfbeeld beïnvloedt fysieke activiteit
  • Fysieke activiteit en het zelfbeeld beïnvloeden elkaar

Bij correlationeel onderzoek is de richting (directionaliteit) van het verband onduidelijk, omdat je niet voor alles hebt kunnen controleren. Daarom mag je bij correlationeel onderzoek geen conclusies trekken over causaliteit. Je zou per ongeluk omgekeerde causaliteit kunnen veronderstellen, waarbij je denkt dat variabele A een effect heeft op variabele B, terwijl in werkelijkheid variabele B invloed uitoefent op variabele A.

Causaal onderzoek

Causale verbanden tussen variabelen kunnen alleen worden aangetoond met gecontroleerde experimenten. In zulke onderzoeken toets je verwachtingen (hypothesen) om causaliteit te onderzoeken. Hierbij concentreer je je per keer op één richting van de relatie.

Experimenten worden gekenmerkt door een hoge interne validiteit, waardoor je met vrij grote zekerheid kunt stellen dat gevonden oorzaak-gevolgrelaties overeenstemmen met de werkelijkheid.

Je kunt de richting of directionaliteit van het verband aantonen, omdat je de onafhankelijke variabele manipuleert en de verandering in de afhankelijke variabele meet. Jouw manipulatie van de ene variabele leidt dus tot een verschil in de andere variabele.

Voorbeeld: Directionaliteit toetsen in een experimenteel onderzoek
Je verwacht dat fysieke activiteit het zelfbeeld beïnvloedt, dus je toetst deze hypothese in een experiment. Je manipuleert het aantal uur per week dat iemand fysiek actief is en meet eventuele veranderingen in het zelfbeeld. Hiermee kun je aantonen of je hypothese klopt.

Als je wilt testen of dit verband bi-directioneel is, moet je een nieuw experiment ontwerpen waarbij je de invloed van het zelfbeeld op de hoeveelheid fysieke beweging onderzoekt. Je toetst dus maar één richting van het verband per experiment.

In een gecontroleerd experiment kun je de invloed van andere variabelen minimaliseren door je participanten willekeurig te verdelen over experimentele groepen (randomiseren) en door een controlegroep te gebruiken.

Randomiseren helpt om ervoor te zorgen dat in iedere groep participanten met gelijke participant-eigenschappen zitten, zodat je groepen op elkaar lijken en vergelijkbaar zijn. Een controlegroep zorgt ervoor dat je je experimentele manipulatie kunt vergelijken met een soortgelijke behandeling of geen enkele behandeling.

Voorbeeld: Controleren voor andere variabelen in een experimenteel onderzoek
Je plaatst iedere participant willekeurig in de controlegroep of experimentele groep. Door randomisatie voorkom je het effect van variabelen waarin je niet geïnteresseerd bent, zoals leeftijd of sociaal-economische status.

De controlegroep ondergaat een ongerelateerde, vergelijkbare interventie op het moment dat de experimentele groep fysiek actief is. Door alle variabelen constant te houden in beide groepen (op de manipulatie van je onafhankelijke variabele na), kun je concluderen dat de manipulatie heeft geleid tot een eventueel gevonden verschil in zelfbeeld.

Veelgestelde vragen

Waarom impliceert een correlatie geen causaliteit?

Er zijn twee hoofdredenen voor het gebrek aan causaliteit bij correlaties.

  1. Andere variabelen (third variable problem): er zijn confounding variabelen die de twee onderzochte variabelen kunnen beïnvloeden, waardoor er onterecht een causaal verband lijkt te bestaan.
  2. Directionaliteit of richting (directionality problem): twee variabelen correleren en zouden een causale relatie kunnen hebben, maar het is niet mogelijk om vast te stellen of variabele A invloed uitoefent op variabele B, of andersom.
Wat is het verschil tussen correlationeel en experimenteel onderzoek?

Met gecontroleerde experimenten kun je causaliteit aantonen, terwijl je met correlationeel onderzoek alleen verbanden tussen variabelen kunt aantonen.

  • In een experimenteel onderzoek manipuleer je een onafhankelijke variabele en meet je de invloed op een afhankelijke variabele. Je controleert voor andere variabelen, zodat deze geen invloed kunnen uitoefenen op de resultaten.
  • In correlationeel onderzoek meet je de variabelen zonder ze te manipuleren. Je kunt hierdoor vaststellen dat de variabelen samen veranderen (allebei toename, allebei afname of de een neemt toe en de ander neemt af), maar je kunt niet vaststellen of de verandering in variabele A de verandering in variabele B veroorzaakt.

Over het algemeen wordt correlationeel onderzoek gekenmerkt door een hoge externe validiteit, terwijl experimenteel onderzoek gepaard gaat met een hoge interne validiteit.

Wat is het verschil tussen correlatie en causaliteit?

Een correlatie is een statistische indicator voor een verband tussen variabelen: als de ene variabele verandert, verandert de andere variabele ook, maar er hoeft geen oorzaak-gevolgrelatie te zijn. Correlaties worden onderzocht in correlationeel onderzoek.

Causaliteit betekent dat een verandering in de ene variabele een verandering in de andere variabele veroorzaakt. Er is dus wel sprake van een oorzaak-gevolgrelatie. De variabelen correleren én er is een causaal verband. Causaliteit wordt onderzocht in experimenteel onderzoek.

Wat is een correlatie?

Een correlatie laat zien of er een verband is tussen twee of meerdere variabelen. Een correlatiecoëfficiënt kan de richting van het verband (positief, negatief) laten zien en geeft ook aan hoe sterk het verband is.

  • Een positieve correlatie betekent dat beide variabelen samen toenemen of afnemen.
  • Een negatieve correlatie betekent dat de ene variabele toeneemt, terwijl de andere variabele afneemt.
  • Als de correlatiecoëfficiënt gelijk is aan 0, is er geen verband tussen de variabelen (zero correlation).

Correlationeel onderzoek is een niet-experimentele variant van kwantitatief onderzoek.

Citeer dit Scribbr-artikel

Als je naar deze bron wilt verwijzen, kun je de bronvermelding kopiëren of op “Citeer dit Scribbr-artikel” klikken om de bronvermelding automatisch toe te voegen aan onze gratis Bronnengenerator.

Merkus, J. (2021, 13 juli). Correlatie versus causaliteit: de verschillen | Met voorbeelden. Scribbr. Geraadpleegd op 22 april 2024, van https://www.scribbr.nl/onderzoeksmethoden/correlatie-causaliteit/

Wat vind jij van dit artikel?
Julia Merkus

Julia heeft onder andere een bachelor in Nederlandse Taal en Cultuur en twee masters in Linguistics en Taal- en Spraakpathologie. Na enkele jaren als editor, onderzoeker en docent schrijft ze nu artikelen over scripties, taalkunde, methodologie en statistiek om studenten te helpen.