De t-verdeling (t-distribution) begrijpen | Met voorbeelden

De t-verdeling (ook wel t-distribution of Student’s t-distribution genoemd) wordt gebruikt als de data bij benadering normaal verdeeld zijn (en dus een klokvorm volgen), maar waarbij de populatievariantie onbekend is. De variantie in een t-verdeling wordt geschat op basis van het aantal vrijheidsgraden van de dataset (totaal aantal waarnemingen min 1).

De t-verdeling is een variant op de normale verdeling, maar deze wordt gebruikt voor kleinere steekproeven, waarbij de variantie onbekend is.

De t-verdeling wordt gebruikt als de data bij benadering normaal verdeeld zijn

Bij statistiek wordt de t-verdeling meestal gebruikt om:

  • De kritische waarden voor een betrouwbaarheidsinterval te vinden als de data ongeveer normaal verdeeld zijn.
  • De corresponderende p-waarde te vinden van een statistische toets die de t-verdeling gebruikt (t-toets, regressieanalyse).

Wat is een t-verdeling?

De t-verdeling is een variant op de normale verdeling die wordt gebruikt voor kleinere steekproeven. Normaal verdeelde gegevens vormen een klokvorm als je ze plot in een grafiek. Hierbij zijn er meer waarnemingen in de buurt van het gemiddelde dan in de staarten.

Het is een meer conservatieve vorm van de standaardnormale verdeling (ook wel z-verdeling of standard normal distribution genoemd). Dit betekent dat de t-verdeling een lagere kansdichtheid geeft voor het centrum en een hogere kansdichtheid voor de staarten dan de standaard normaleverdeling.

Voorbeeld: t-verdeling vs z-verdeling
Als je de gemiddelde toetsscores verzamelt voor een steekproef van slechts 20 studenten, moet je de t-verdeling gebruiken om het betrouwbaarheidsinterval rond het gemiddelde te schatten. Pas als je steekproef 30 participanten (of meer) bevat, zou je de z-verdeling gebruiken.

t-verdeling vs z-verdeling

T-verdeling en de standaardnormale verdeling

Naarmate het aantal vrijheidsgraden (totaal aantal waarnemingen min 1) toeneemt, zal de t-verdeling steeds dichter bij de standaardnormale verdeling (z-verdeling) komen te liggen, totdat ze nagenoeg hetzelfde zijn.

Boven 30 vrijheidsgraden komt de t-verdeling ongeveer overeen met de z-verdeling. Daarom gebruik je voor grote steekproeven de z-verdeling in plaats van de t-verdeling.

De z-verdeling wordt verkozen boven de t-verdeling, omdat de variantie bekend is bij de z-verdeling. Bij de t-verdeling wordt de variantie slechts geschat op basis van het aantal vrijheidsgraden. Hierdoor kunnen nauwkeurigere schattingen worden gemaakt met behulp van de z-verdeling.

Studenten t-verdeling bij 1, 3, 8 en 20 vrijheidsgraden, en vergeleken met de z-verdeling

Kijk jij ook zo uit naar afstuderen?

We helpen je graag een handje!

  • Minder stress
  • Hulp binnen handbereik
  • 100% tevredenheidsgarantie

Ontdek hoe we jou kunnen helpen

T-verdeling en t-scores

Een t-score is het aantal standaarddeviaties van het gemiddelde in een t-verdeling. Je kunt een t-score opzoeken in een t-tabel of een online calculator voor de t-score gebruiken.

Bij statistiek worden t-scores voornamelijk gebruikt om de volgende waarden te bepalen:

  1. De boven- en ondergrenzen van een betrouwbaarheidsinterval als de data ongeveer normaal verdeeld zijn.
  2. De p-waarde van de teststatistiek voor t-toetsen en regressieanalyses.

T-scores en betrouwbaarheidsintervallen

Betrouwbaarheidsintervallen gebruiken t-scores om de boven- en ondergrenzen van het voorspellingsinterval te berekenen. De t-score die wordt gebruikt om de boven- en ondergrenzen te bepalen, wordt ook wel de kritische waarde van t of t* genoemd.

Voorbeeld: Betrouwbaarheidsinterval 
Je hebt 20 studenten uit twee werkgroepen geworven voor je steekproef om de gemiddelde toetsscores te schatten. Je wilt bepalen of er een verschil is tussen de twee groepen.

Met behulp van een tweezijdige t-toets schat je het verschil tussen de twee werkgroepen, evenals het betrouwbaarheidsinterval rond die schatting. Uit de t-toets blijkt dat het verschil in gemiddelde score tussen werkgroep 1 en werkgroep 2 gelijk is aan 4.61, met een 95% betrouwbaarheidsinterval van 3.87 tot 5.35.

Het betrouwbaarheidsinterval [3.87 – 5.35] bevat niet de waarde 0 (en ligt ver van 0 af), waardoor het onwaarschijnlijk is dat dit verschil in toetsscores wordt veroorzaakt door toeval of willekeurige factoren.

Met behulp van een tweezijdige t-toets schat je het verschil tussen de twee werkgroepen, evenals het betrouwbaarheidsinterval rond die schatting

T-scores en p-waarden

Statistische toetsen leveren een teststatistiek op die aangeeft hoe ver je data verwijderd zijn van de nulhypothese van de statistische toets. Vervolgens wordt een p-waarde berekend die uitdrukt hoe waarschijnlijk het is dat je data zouden voorkomen als de nulhypothese waar zou zijn.

De teststatistiek voor t-toetsen en regressieanalyses is de t-score. Hoewel de meeste statistische programma’s (zoals SPSS) automatisch de bijbehorende p-waarde voor de t-score berekenen, kun je de waarden ook opzoeken in een t-tabel, waarbij je de vrijheidsgraden en t-score gebruikt om de p-waarde te vinden.

De t-score die gepaard gaat met een p-waarde die kleiner is dan het significantieniveau alfa, wordt de kritische waarde van t, of t* genoemd.

Voorbeeld: P-waarde
De tweezijdige t-toets leverde een t-waarde van 12.79 op. Dit betekent dat het verschil in groepsgemiddelden 12.79 standaarddeviaties verwijderd is van het gemiddelde van de verdeling van de nulhypothese.

Het aantal vrijheidsgraden is 38 (n – 1 voor elke groep). Als je dit getal opzoekt in een t-tabel of SPSS gebruikt, vind je een p-waarde die kleiner is dan 0.001.

Dit suggereert (net als het betrouwbaarheidsinterval) dat het zeer onwaarschijnlijk is dat je dit grote verschil in toetsscores van de steekproef zou tegenkomen als het daadwerkelijke verschil in toetsscores van de populatie 0 zou zijn.

Veelgestelde vragen

Wat is een t-verdeling?

De t-verdeling (ook wel t-distribution of Student’s t-distribution genoemd) wordt gebruikt als de data bij benadering normaal verdeeld zijn (en dus een klokvorm volgen), maar waarbij de populatievariantie onbekend is. De variantie in een t-verdeling wordt geschat op basis van het aantal vrijheidsgraden van de dataset (totaal aantal waarnemingen min 1).

De t-verdeling is een variant op de normale verdeling, maar deze wordt gebruikt voor kleinere steekproeven, waarbij de variantie onbekend is.

Wat is een t-score?

Een t-score is het aantal standaarddeviaties van het gemiddelde in een t-verdeling. Je kunt een t-score opzoeken in een t-tabel of een online calculator voor de t-score gebruiken.

Bij statistiek worden t-scores voornamelijk gebruikt om de volgende waarden te bepalen:

  1. De boven- en ondergrenzen van een betrouwbaarheidsinterval als de data ongeveer normaal verdeeld zijn.
  2. De p-waarde van de teststatistiek voor t-toetsen en regressieanalyses.
Wat is het verschil tussen de t-verdeling en de standaardnormale verdeling?

De t-verdeling is een meer conservatieve vorm van de standaardnormale verdeling (ook wel z-verdeling of standard normal distribution genoemd). Dit betekent dat de t-verdeling een lagere kansdichtheid geeft voor het centrum en een hogere kansdichtheid voor de staarten dan de standaard normaleverdeling.

Hoe ziet een normale verdeling eruit?

Er zijn twee parameters die bepalen hoe de normale verdeling eruitziet: het gemiddelde en de standaarddeviatie.

Binnen één standaarddeviatie ligt 68,2% van de observaties (34,1% + 34,1%), binnen twee standaarddeviaties 95,2% en binnen drie standaarddeviaties 99,6%.
Normale verdeling

Wat vind jij van dit artikel?
Julia Merkus

Julia heeft onder andere een bachelor in Nederlandse Taal en Cultuur en twee masters in Linguistics en Taal- en Spraakpathologie, waardoor ze heel wat scripties heeft geschreven. Na enkele jaren als editor schrijft ze nu artikelen over alles wat bij een scriptie komt kijken om zo studenten met succes te laten afstuderen.
1