Chi-kwadraattoets (Chi-square Test) | Soorten & Voorbeelden

Een chi-kwadraattoets is een statistische toets voor categorische data. De toets wordt gebruikt om te bepalen of je nominale of ordinale data significant afwijken van wat je had verwacht. Er zijn twee belangrijke soorten chikwadraattoetsen:

  • De chi-kwadraattoets voor verdelingen (chi-square goodness of fit test) wordt gebruikt om te toetsen of de frequentieverdeling van een categorische variabele afwijkt van je verwachtingen.
  • De chi-kwadraattoets voor samenhang (chi-square test of independence) wordt gebruikt om te toetsen of twee categorische variabelen aan elkaar gerelateerd zijn. Deze toets wordt ook wel de onafhankelijkheidstoets genoemd.

Chi-kwadraat wordt vaak geschreven als Χ² (spreek uit als “gie-kwadraat”). Ook worden vaak de Engelse termen gebruikt. In dat geval spreek je het uit als “kai-square”.

Wat is een chi-kwadraattoets?

De chi-kwadraattoets is een van de meestgebruikte niet-parametrische toetsen. Niet-parametrische toetsen worden gebruikt voor gegevens die niet voldoen aan de aannames van parametrische toetsen. Hierbij gaat het vooral om de assumptie van een normale verdeling.

Als je een hypothese wil toetsen over de verdeling van een categorische variabele, moet je een chi-kwadraattoets of een andere niet-parametrische toets gebruiken. Categorische variabelen kunnen nominaal of ordinaal zijn en groepen vertegenwoordigen zoals diersoorten of nationaliteiten. Omdat ze maar een paar specifieke waarden kunnen hebben, kunnen ze geen normale verdeling hebben.

Let op
Parametrische toetsen (zoals een ANOVA) worden niet gebruikt om hypotheses te testen over de verdeling van categorische variabelen, maar de onafhankelijke variabele mag wel categorisch zijn.

Test hypothesen over frequentieverdelingen

Er zijn twee soorten chi-kwadraattoetsen, maar ze testen allebei of de waargenomen of geobserveerde frequentieverdeling van een categorische variabele significant afwijkt van de verwachte frequentieverdeling. Een frequentieverdeling beschrijft hoe waarnemingen zijn verdeeld over verschillende groepen.

Frequentieverdelingen worden vaak weergegeven met behulp van frequentietabellen. Een frequentietabel toont het aantal waarnemingen in elke groep. Als er twee categorische variabelen zijn kun je een contingentietabel gebruiken. Zo kun je het aantal waarnemingen in elke combinatie van groepen weergeven.

Voorbeeld: Frequentietabel voor soorten vogels
Frequentie waarmee bepaalde vogelsoorten een voederbak bezoeken
Vogelsoort Frequentie
Mus 15
Merel 12
Kraai 9
Specht 8
Duif 8
Ekster 6

Een chi-kwadraattoets voor verdelingen (chi-square goodness of fit test) can toetsen of deze geobserveerde frequenties significant verschillen van de verwachte frequenties.

Voorbeeld: Frequentietabel voor links- of rechtshandig zijn
Contingentietabel voor het aantal links- en rechtshandigen in Nederland en België
Rechtshandig Linkshandig
Nederlands 236 19
Belgisch 157 16

Een chi-kwadraattoets voor samenhang (chi-square test of independence) kan toetsen of deze waargenomen frequenties significant verschillen van de verwachte frequenties als links- of rechtshandigheid niet gerelateerd zou zijn aan nationaliteit.

De chi-kwadraatformule

Beide chi-kwadraattoetsen maken gebruik van dezelfde formule om de teststatistiek “chi-kwadraat (Χ²)” te berekenen:

    \begin{equation*} X^2=\sum{\frac{(O-E)^2}{E}} \end{equation*}

Hierbij geldt het volgende:

  • Χ² is de teststatistiek (ook toetsstatistiek genoemd) van de chi-kwadraattoets
  • Σ is de som (het betekent dat alles moet worden opgeteld)
  • O is de waargenomen (geobserveerde) frequentie
  • E is de verwachte frequentie

Hoe groter het verschil tussen de waarnemingen en de verwachtingen (O − E), hoe groter de chi-kwadraat. Om te bepalen of het verschil groot genoeg is om statistisch significant te zijn, vergelijk je de chi-kwadraatwaarde met een kritische waarde.

Wie helpt jou met nakijken?

Betrouwbare hulptroepen vinden is niet makkelijk...

  • Familie
  • Vrienden
  • Studiegenoten
  • Scribbr

We staan altijd voor je klaar

Wanneer gebruik je een chi-kwadraattoets?

Een chi-kwadraattoets kan een geschikte optie zijn voor je data als de volgende punten kloppen:

  • Je wilt een hypothese toetsen over een of meer categorische variabelen.
    • Als een of meer van je variabelen kwantitatief zijn, moet je een andere statistische test gebruiken.
    • Als alternatief kun je de kwantitatieve variabele omzetten in een categorische variabele door de waarnemingen op te splitsen in intervallen.
  • Je hebt een aselecte steekproef getrokken uit de populatie.
  • Er worden minimaal vijf waarnemingen verwacht in elke groep of combinatie van groepen.

Soorten chi-kwadraattoetsen

De twee soorten chi-kwadraattoetsen zijn:

Wiskundig gezien zijn dit eigenlijk dezelfde toetsen. We beschouwen ze vaak als verschillende toetsen, omdat ze voor verschillende doelen worden gebruikt.

Chi-kwadraattoets voor verdelingen (chi-square goodness of fit-test)

Je kunt een chi-kwadraat test voor verdelingen gebruiken als je één categorische variabele hebt. Hiermee kun je toetsen of de frequentieverdeling van de categorische variabele significant afwijkt van je verwachtingen. Vaak, maar niet altijd, is de verwachting dat de categorieën gelijke verdelingen zullen hebben.

Voorbeeld: Hypothesen voor de chi-kwadraattoets voor verdelingen
Verwachting: gelijke proporties

  • Nulhypothese (H0): De vogelsoorten bezoeken de voederbak in gelijke verhoudingen.
  • Alternatieve hypothese (H1 of HA): De vogelsoorten bezoeken de voederbak in verschillende verhoudingen.

Verwachting: verschillende proporties

  • Nulhypothese (H0): De vogelsoorten bezoeken de voederbak in dezelfde verhouding als het gemiddelde over de afgelopen vijf jaar.
  • Alternatieve hypothese (H1 of HA): De vogelsoorten bezoeken de voederbak in andere verhoudingen dan het gemiddelde over de afgelopen vijf jaar.

Chi-kwadraattoets voor samenhang (chi-square test of independence)

Je kunt een chi-kwadraattoets voor samenhang gebruiken als je twee categorische variabelen hebt. Hiermee kun je toetsen of de twee variabelen aan elkaar gerelateerd zijn. Als twee variabelen onafhankelijk (niet-gerelateerd) zijn, wordt de kans om tot een bepaalde groep van de ene variabele te behoren niet beïnvloed door de andere variabele.

Voorbeeld: Hypothesen voor de chi-kwadraattoets voor samenhang
  • Nulhypothese (H0): Het aandeel mensen dat linkshandig is, is hetzelfde voor Nederlanders en Belgen.
  • Alternatieve hypothese (H1 of HA): Het aandeel mensen dat linkshandig is, verschilt tussen nationaliteiten.

Andere soorten chi-kwadraattoetsen

De chi-kwadraattoets voor homogeniteit kan worden gezien als een derde soort chi-kwadraattoets. Deze toetst of twee populaties uit dezelfde verdeling komen door te bepalen of de twee populaties dezelfde proporties hebben. Het is een variatie op de chi-kwadraattoets voor samenhang.

De McNemar-toets maakt gebruik van de chi-kwadraatteststatistiek. Je kunt deze test uitvoeren als je een gerelateerd paar categorische variabelen hebt met elk twee groepen. Hiermee kun je bepalen of de verhoudingen van de variabelen gelijk zijn.

Voorbeeld: McNemar’s test
Stel dat een steekproef van 100 mensen twee smaken ijs krijgt aangeboden en dat aan ze wordt gevraagd of ze de smaak van iedere soort ijs lekker vinden.

Contingentietabel met voorkeur voor ijssmaak

  • Nulhypothese (H0): Het aandeel mensen dat van chocolade houdt, is hetzelfde als het aandeel mensen dat van vanille houdt.
  • Alternatieve hypothese (H1 of HA): Het aandeel mensen dat van chocolade houdt, verschilt van het aandeel mensen dat van vanille houdt.

Er zijn verschillende andere soorten chi-kwadraattoetsen, maar deze vallen niet onder Pearsons chi-kwadraattoetsen. Voorbeelden hiervan zijn de test of a single variance en de likelihood ratio chi-square test.

Een chi-kwadraattoets uitvoeren

De exacte procedure voor de uitvoering van een chi-kwadraattest is afhankelijk van het soort test, maar over het algemeen volg je deze stappen:

  1. Maak een tabel met de waargenomen en verwachte frequenties. Dit kan soms de moeilijkste stap zijn, omdat je zorgvuldig moet overwegen welke verwachte waarden het meest geschikt zijn voor je nulhypothese.
  2. Bereken de chi-kwadraatwaarde van je waargenomen en verwachte frequenties met behulp van de chi-kwadraatformule.
  3. Bepaal de kritieke waarde met een chi-kwadraattabel of gebruik statistische software (zoals SPSS of R).
  4. Vergelijk de chi-kwadraatwaarde met de kritieke waarde om te bepalen welke groter is.
  5. Bepaal of je de nulhypothese wilt verwerpen. Je moet de nulhypothese verwerpen als de chi-kwadraatwaarde groter is dan de kritieke waarde. Als je de nulhypothese verwerpt, kun je concluderen dat je data significant verschillen van je verwachte waarden.

Een chi-kwadraattoets rapporteren

Als je besluit een chi-kwadraattoets te gebruiken voor je scriptie, moet je de resultaten rapporteren in je resultatenhoofdstuk. Je kunt de volgende richtlijnen volgen als je wilt rapporteren volgens de APA-stijl:

  • Je gebruikt geen komma’s voor decimalen, maar punten (omdat het hier gaat om statistische waarden).
  • Je hoeft geen bronvermelding of chi-kwadraatformule te vermelden, omdat de chi-kwadraattoets heel veel wordt gebruikt.
  • Je verwijst naar chi-kwadraat met het Griekse symbool Χ². Het symbool lijkt heel erg op een “X” uit het Latijnse alfabet, maar het is een net iets andere letter. Griekse symbolen mogen niet worden gecursiveerd.
  • Je voegt aan beide kanten van het gelijkteken (=) een spatie toe.
  • Als je chi-kwadraat kleiner is dan nul, moet je een voorloopnul (een nul voor de punt) zetten, omdat chi-kwadraat groter kan zijn dan nul.
  • Je vermeldt twee cijfers achter de punt (bijvoorbeeld 3.34).
  • Je rapporteert niet alleen de chi-kwadraat, maar ook de vrijheidsgraden (df), steekproefomvang (N) en p-waarde.
    • Dat doe je volgens dit format: Χ² (vrijheidsgraden, N = steekproefomvang) = chi-kwadraatwaarde, p = p-waarde).
Voorbeeld: een chikwadraattoets rapporteren
Er was geen significant verband tussen links- of rechtshandig zijn en nationaliteit, Χ² (1, N = 428) = 0.44, p = .505.

Oefenvragen


Veel gestelde vragen over chi-kwadraatttoetsen

Wat zijn de twee belangrijkste soorten chi-kwadraattoetsen?

De twee meest belangrijke chi-kwadraattoetsen zijn:

Wat is het verschil tussen een chi-kwadraattoets en een t-toets?

Zowel de chi-kwadraattoets en een t-toets kunnen worden gebruikt om het verschil tussen twee groepen te onderzoeken.

Echter, een t-toets wordt gebruikt als je een kwantitatieve afhankelijke variabele hebt en een categorische onafhankelijke variabele (met twee groepen). Een chi-kwadraattoets voor samenhang wordt gebruikt bij twee categorische variabelen.

Wat is het verschil tussen een chi-kwadraattoets en een correlatie?

Zowel een correlatie als een chi-kwadraattoets kan worden gebruikt om de relatie tussen twee variabelen te onderzoeken.

Echter, een correlatie wordt gebruikt als je twee kwantitatieve variabelen hebt en een chi-kwadraattoets voor samenhang (chi-square test of independence) wordt gebruikt voor twee categorische variabelen.

Wat is het verschil tussen een kwantitatieve en categorische variabele?

Er kan een onderscheid worden gemaakt tussen kwantitatieve en categorische variabelen:

  • Bij kwantitatieve variabelen representeren de data hoeveelheden (zoals een lengte, gewicht, leeftijd).
  • Bij categorische variabelen representeren de data groepen, zoals een ranking (bijvoorbeeld de eindposities bij het songfestival), classificaties (bijvoorbeeld kledingmerken), en binaire verdelingen (zoals kop of munt).

Wat vind jij van dit artikel?
Julia Merkus

Julia heeft onder andere een bachelor in Nederlandse Taal en Cultuur en twee masters in Linguistics en Taal- en Spraakpathologie, waardoor ze heel wat scripties heeft geschreven. Na enkele jaren als editor schrijft ze nu artikelen over alles wat bij een scriptie komt kijken om zo studenten met succes te laten afstuderen.