Betrouwbaarheidsinterval Berekenen | Formules & Voorbeelden

Het betrouwbaarheidsinterval (confidence interval) is het waardebereik waarbinnen je geschatte waarde naar verwachting een bepaald percentage van de keren ligt als je het experiment of de steekproef hetzelfde zou herhalen.

Als je een schatting maakt in de statistiek (bijvoorbeeld voor een samenvattende of teststatistiek), is er altijd onzekerheid over die schatting omdat het getal gebaseerd is op een steekproef van de populatie die je bestudeert.

Let op
Het betrouwbaarheidsniveau (confidence level) is het percentage van de keren dat je verwacht een schatting te reproduceren tussen de boven- en ondergrens van het betrouwbaarheidsinterval. Dit wordt bepaald door de alfawaarde (ook wel het significantieniveau ).

Wat is een betrouwbaarheidsinterval?

Een betrouwbaarheidsinterval is het gemiddelde van je schatting plus of min de variatie in die schatting. Dit is het bereik van waarden waartussen je verwacht dat je schatting zal vallen als je je test opnieuw doet, binnen een bepaald betrouwbaarheidsniveau.

Betrouwbaarheid is een andere manier om waarschijnlijkheid te beschrijven. Als je bijvoorbeeld een betrouwbaarheidsinterval met een betrouwbaarheidsniveau van 95% kiest, betekent dit dat je ervan overtuigd bent dat de schatting 95 van de 100 keer tussen de bovenste en onderste waarden van het betrouwbaarheidsinterval zal vallen.

Je gewenste betrouwbaarheidsniveau is normaal gesproken 1 min de alfawaarde (α) die je voor je statistische toets hebt gebruikt:

Betrouwbaarheidsniveau = 1 – α

Als je een alfawaarde van 0,05 gebruikt voor statistische significantie, dan is je betrouwbaarheidsniveau 1 – 0.05 = 0.95, of 95%.

Wanneer gebruik je een betrouwbaarheidsinterval?

Je kunt betrouwbaarheidsintervallen berekenen voor allerlei soorten statistische schattingen, waaronder:

  • Proporties (verhoudingen)
  • Populatiegemiddelden
  • Verschillen tussen populatiegemiddelden en proporties
  • Schattingen van de variatie tussen groepen

Dit zijn allemaal puntschattingen die geen informatie geven over de variatie rondom de waarde. Betrouwbaarheidsintervallen geven informatie over de variatie rondom een puntschatting.

Voorbeeld: Variatie rondom een schatting
Je ondervraagt 100 Britten en 100 Amerikanen over hun televisiegewoonten en je ontdekt dat beide groepen gemiddeld 35 uur per week televisie kijken. Er was echter veel meer variatie tussen de ondervraagde Britten, terwijl de Amerikanen allemaal ongeveer evenveel keken.

Hoewel beide groepen dezelfde puntschatting hebben (het gemiddelde aantal uren televisiekijken), zal de Britse schatting een breder betrouwbaarheidsinterval hebben dan de Amerikaanse schatting omdat er meer variatie in de data zit.

Voorbeeld Variatie rondom een schatting

Betrouwbaarheidsinterval berekenen

De meeste statistische programma’s zullen ook het betrouwbaarheidsinterval geven als je een statistische analyse uitvoert.

Als je zelf een betrouwbaarheidsinterval wilt berekenen, moet je het volgende weten:

  • De puntschatting waarvoor je het betrouwbaarheidsinterval opstelt;
  • De kritieke waarden voor de teststatistiek;
  • De standaarddeviatie van de steekproef;
  • De steekproefgrootte.

Zodra je deze dingen weet, kun je het betrouwbaarheidsinterval voor je schatting berekenen met de formule voor het betrouwbaarheidsinterval die geschikt is voor jouw data.

Puntschatting

De puntschatting van je betrouwbaarheidsinterval is de statistische schatting die je maakt (e.g., populatiegemiddelde, verschil tussen populatiegemiddelden, proporties, variatie tussen groepen).

Voorbeeld: Puntschatting
In het voorbeeld over televisiekijken, is de puntschatting het gemiddeld aantal uren dat er televisie wordt gekeken: 35.

De kritieke waarde bepalen

Kritieke waarden geven aan hoeveel standaarddeviaties je van het gemiddelde verwijderd moet zijn om het gewenste betrouwbaarheidsniveau van je betrouwbaarheidsinterval te bereiken.

Er zijn drie stappen om de kritieke waarde te vinden.

  1. Kies je alfawaarde α

De alfawaarde is de drempelwaarde voor statistische significantie. De meest gebruikte alfawaarde is 0.05, maar 0.1, 0.01 en 0.001 worden soms ook gebruikt. Je kunt het beste naar gepubliceerde artikelen uit je vakgebied kijken om te beslissen welke alfawaarde je gebruikt.

  1. Beslis of je een eenzijdig of tweezijdig interval nodig hebt

Waarschijnlijk wil je een tweezijdig interval gebruiken, tenzij je een eenzijdige t-test (one-tailed t-test) uitvoert. Voor een tweezijdig interval deel je je alfa door 2 om de alfawaarde voor de boven- en ondergrenzen te vinden.

  1. Zoek de kritieke waarde op die overeenkomt met je alfawaarde

Als je data normaal verdeeld zijn of als je een grote steekproef (n > 30) hebt die bij benadering normaal verdeeld is, kun je de z-verdeling gebruiken om je kritieke waarden te vinden.

Voor een z-statistiek worden de meest voorkomende waarden in onderstaande tabel weergeven:

Betrouwbaarheidsniveau 90% 95% 99%
Alfa voor eenzijdig BI 0.1 0.05 0.01
Alfa voor tweezijdig BI 0.05 0.025 0.005
z-statistiek 1.64 1.96 2.57

Let op: BI = betrouwbaarheidsinterval (of CI = confidence interval in het Engels).

Als je een kleine dataset (n ≤ 30) gebruikt die bij benadering normaal verdeeld is, gebruik je de t-verdeling.

De t-verdeling volgt dezelfde vorm als de z-verdeling maar corrigeert voor kleine steekproefgroottes. Voor de t-verdeling moet je je vrijheidsgraden kennen (steekproefgrootte min 1).

Bekijk deze t-tabel om je t-statistiek te vinden. Het betrouwbaarheidsniveau en de p-waarden voor zowel eenzijdige als tweezijdige toetsen zijn toegevoegd, zodat je de benodigde waarde kunt vinden.

Voor normale verdelingen, zoals de t-verdeling en de z-verdeling, is de kritieke waarde aan beide kanten van het gemiddelde gelijk.

Voorbeeld: Kritieke waarde
Het onderzoek naar televisiekijken bevat meer dan 30 waarnemingen en de data volgen ongeveer een normale verdeling (klokvorm). Dit betekent dat je de z-verdeling kunt gebruiken voor je teststatistieken.

Voor een tweezijdig 95%-betrouwbaarheidsinterval is de alfawaarde 0.025. De kritieke waarde die met deze alfawaarde overeenkomt is 1.96.

Dit betekent dat je de boven- en ondergrens van het betrouwbaarheidsinterval op +1.96 en -1.96 standaardafwijkingen van het gemiddelde kunt vaststellen.

De standaarddeviatie bepalen

De meeste statistische programma’s zullen een functie hebben om de standaarddeviatie te berekenen. Om deze handmatig te berekenen, moet je eerst de steekproefvariantie weten en hiervan de vierkantswortel nemen.

  1. Vind de steekproefvariantie

De steekproefvariantie wordt gedefinieerd als de som van de gekwadrateerde verschillen van het gemiddelde, ook wel bekend als de gemiddelde kwadratische fout (mean-squared-error, of MSE):

s^2 = {\sum}^n _{i=1} {\frac {(Xi - \bar{X})^2}{n-1}}

Om de MSE te bepalen, trek je het steekproefgemiddelde af van elke waarde in de dataset, kwadrateer je het resulterende getal en deel je dat getal door n – 1 (steekproefgrootte min 1).

Vervolgens tel je al deze getallen bij elkaar op om de totale steekproefvariantie (s2) te krijgen. Voor grotere steekproeven is het het makkelijkst om dit in Excel te doen.

  1. Vind de standaarddeviatie

De standaarddeviatie van je schatting (s) is gelijk aan de vierkantswortel van de steekproefvariantie (s2):

s = \sqrt{(s^2)}

Voorbeeld: Standaarddeviatie
In het onderzoek over televisiekijken is de variantie in de Britse schatting 100, terwijl de variantie in de Amerikaanse schatting 25 is. Als je de vierkantswortel van de variantie trekt, krijg je een standaarddeviatie van de steekproef (s) van:

  • √100 = 10 voor de Britse schatting.
  • √25 = 5 voor de Amerikaanse schatting.

Steekproefgrootte

De steekproefgrootte is het aantal observaties in je dataset.

Voorbeeld: Steekproefgrootte
In het onderzoek over Britten en Amerikanen is de steekproefgrootte 100 per groep.

Ontvang feedback op taal, structuur, lay-out en bronvermelding

Professionele Scribbr-editors kijken je scriptie na op:

  • Academisch taalgebruik
  • Onduidelijke zinnen
  • Grammaticale fouten
  • Interpunctie
  • Verboden woorden

Bekijk het voorbeeld

Betrouwbaarheidsinterval voor het gemiddelde van normaal verdeelde data

Normaal verdeelde data vormen een klokvorm als ze op een grafiek worden uitgezet, met het steekproefgemiddelde in het midden en de rest van de data ongeveer gelijk verdeeld aan beide kanten van het gemiddelde.

Het betrouwbaarheidsinterval voor data die de standaardnormale verdeling volgen is:

CI = \bar{X} \pm Z^* \frac {\sigma}{\sqrt{n}}

Waarbij:

  • CI = het betrouwbaarheidsinterval (confidence interval)
  • \bar{X} = het populatiegemiddelde
  • Z*= de kritieke waarde van de z-verdeling
  • σ = de standaarddeviatie van de populatie
  • \sqrt{n}= de vierkantswortel van de populatiegrootte

Het betrouwbaarheidsinterval voor de t-verdeling volgt dezelfde formule, maar je vervang Z* door t*.

In het echte leven weet je nooit de echte waarden voor de populatie (tenzij je een volledige populatie kunt onderzoeken). In plaats daarvan vervang je daarom de waarden van de populatie door de waarden van de steekproef, zodat de formule als volgt wordt:

CI = \hat{x} \pm Z^* \frac {s}{\sqrt{n}}

Waarbij:

  • \hat{x}= het steekproefgemiddelde
  • s = de standaarddeviatie van de steekproef
Voorbeeld: Betrouwbaarheidsinterval berekenen
In het onderzoek naar televisiekijken onder Britten en Amerikanen kun je het steekproefgemiddelde, de standaarddeviatie van de steekproef en de steekproefgrootte gebruiken in plaats van het populatiegemiddelde, de standaarddeviatie van de populatie en de populatiegrootte.

Om het 95%-betrouwbaarheidsinterval te berekenen, gebruik je de waarden voor de formule.

Voor Amerika:

    \begin{align*} CI &= 35 \pm 1.96 \dfrac{5}{\sqrt{100}} \\ &= 35 \pm 1.96(0.5) \\ &= 35 \pm 0.98 \end{align*}

Voor Amerika zijn de boven- en ondergrens van het 95%-betrouwbaarheidsinterval 34.02 en 35.98.

Voor het Verenigd Koninkrijk:

    \begin{align*} CI &= 35 \pm 1.96 \dfrac{10}{\sqrt{100}} \\ &= 35 \pm 1.96(1) \\ &= 35 \pm 1.96 \end{align*}

Voor het Verenigd Koninkrijk zijn de boven- en ondergrens van het 95%-betrouwbaarheidsinterval 33.04 en 36.98.

Betrouwbaarheidsinterval voor proporties

Het betrouwbaarheidsinterval voor een proportie volgt hetzelfde patroon als het betrouwbaarheidsinterval voor gemiddelden, maar in plaats van de standaarddeviatie gebruik je de steekproefproportie en vermenigvuldig je deze met 1 min de proportie:

CI = \hat{p} \pm Z^* \sqrt{\dfrac{{\hat{p}(1-\hat{p})}}{n}}

Waarbij:

  • \hat{p} = de proportie in je steekproef (e.g., het deel van respondenten dat aangaf überhaupt televisie te kijken)
  • Z* = de kritieke waarde van de z-verdeling
  • n = de steekproefgrootte

Betrouwbaarheidsinterval voor niet normaal verdeelde data

Als je het betrouwbaarheidsinterval rondom het gemiddelde van data die niet normaal verdeeld zijn wilt berekenen, heb je twee opties:

  1. Je kunt een verdeling vinden die overeenkomt met de vorm van je data en die verdeling gebruiken om je betrouwbaarheidsinterval te berekenen.
  1. Je kunt je data transformeren zodat ze bij een normale verdeling passen, en dan het betrouwbaarheidsinterval van de getransformeerde data vinden.

    Datatransformaties zijn heel gebruikelijk in de statistiek, bijvoorbeeld als je data een logaritmische curve volgen maar je ze wilt gebruiken naast lineaire data. Je moet alleen niet vergeten om je data weer terug te transformeren als je de boven- en ondergrens van je betrouwbaarheidsinterval berekent.

    Betrouwbaarheidsinterval rapporteren

    Betrouwbaarheidsintervallen worden soms vermeld in onderzoekspapers, hoewel onderzoekers vaker de standaardafwijking van hun schatting rapporteren.

    Als je het betrouwbaarheidsinterval wilt of moet rapporteren, is het belangrijk dat je de boven- en ondergrens van het betrouwbaarheidsinterval vermeld.

    Voorbeeld: Betrouwbaarheidsinterval rapporteren
    Uit dit onderzoek is gebleken dat zowel Amerikanen als Britten gemiddeld 35 uur per week televisiekijken, hoewel er meer variatie was in de schatting voor het Verenigd Koninkrijk (95% BI [33.04, 36.96]) dan voor Amerika (95% BI [34.02, 35.98]).

    Betrouwbaarheidsintervallen worden vaak gebruikt in grafieken. Bij het weergeven van verschillen tussen groepen of bij het plotten van een lineaire regressie vermelden onderzoekers vaak het betrouwbaarheidsinterval om een de variatie rondom de schatting te visualiseren.

    Voorbeeld: Betrouwbaarheidsinterval in een grafiek
    Je kunt besluiten om de puntschattingen van het gemiddeld aantal uren televisiekijken per week in Amerika en het Verenigd Koninkrijk te plotten (met het 95%-betrouwbaarheidsinterval rondom het gemiddelde).

    Voorbeeld-Betrouwbaarheidsinterval-in-een-grafiek

    Valkuil van een betrouwbaarheidsinterval

    Betrouwbaarheidsintervallen worden soms geïnterpreteerd als het waardebereik waarbinnen de “werkelijke waarde” van je schatting ligt.

    Dit is niet het geval. Het betrouwbaarheidsinterval kan je niet vertellen hoe waarschijnlijk het is dat je de echte waarde van je schatting hebt gevonden, omdat de schatting gebaseerd is op de steekproef en niet op de hele populatie.

    Het betrouwbaarheidsinterval vertelt je alleen binnen welk waardebereik je je waarde kan verwachten als je je steekproef opnieuw doet of je experiment op precies dezelfde manier uitvoert.

    Hoe nauwkeuriger je steekproeftrekking of hoe realistischer je onderzoek, hoe groter de kans dat je betrouwbaarheidsinterval de werkelijke waarde van je schatting bevat. Maar deze nauwkeurigheid wordt dus bepaald door je onderzoeksmethoden en niet door de statistieken die je berekent nadat je je data hebt verzameld.

    Veel gestelde vragen over betrouwbaarheidsintervallen berekenen

    Wat is een kritieke waarde?

    Een kritieke waarde is een waarde van de teststatistiek die de boven- en ondergrens van het betrouwbaarheidsinterval definieert, of de drempelwaarde van statistische significantie in een statistische test. Het beschrijft hoe ver je van het gemiddelde van de verdeling af moet liggen om een bepaalde hoeveelheid van de totale variatie in de data te dekken (i.e., 90%, 95%, 99%).

    Als je zowel een 95%-betrouwbaarheidsinterval als een drempelwaarde van statistische significantie van p = 0.05 aanhoudt, dan zullen je kritieke waarden in beide gevallen identiek zijn.

    Wat is het verschil tussen een betrouwbaarheidsinterval en een betrouwbaarheidsniveau?

    Het betrouwbaarheidsinterval bestaat uit de boven- en ondergrens van de schatting die je verwacht te vinden bij een gegeven betrouwbaarheidsniveau.

    Het betrouwbaarheidsniveau (confidence level) is het percentage van de keren dat je verwacht in de buurt van dezelfde schatting te komen als je je experiment nog een keer uitvoert of opnieuw op dezelfde manier een steekproef uit de populatie haalt.

    Voorbeeld
    Je wilt weten wat het gemiddelde aandeel is van het aantal meisjes dat elk jaar geboren wordt. Hiertoe gebruik je een willekeurige steekproef van baby’s. Met een 95%-betrouwbaarheidsinterval vind je een bovengrens van 0.56 en een ondergrens van 0.48. Het betrouwbaarheidsniveau is 95%.
    Wat betekent het als mijn betrouwbaarheidsinterval een nul bevat?

    Als je betrouwbaarheidsinterval voor het verschil tussen groepen een nul bevat, betekent dit dat er een grote kans bestaat dat je geen verschil vindt tussen de groepen als je het experiment nog een keer uitvoert.

    Als je betrouwbaarheidsinterval voor een correlatie of regressie nul bevat, betekent dit dat er een grote kans bestaat dat je geen correlatie vindt in je data als je het experiment nog een keert uitvoert.

    In beide gevallen zul je ook een hoge p-waarde vinden bij je statistische test. Dit houdt in dat je resultaten zouden kunnen voorkomen onder de nulhypothese. Dit zou betekenen dat de resultaten geen relatie tussen de variabelen ondersteunen.

    Hoe bereken je een betrouwbaarheidsinterval?

    Om het betrouwbaarheidsinterval te berekenen, moet je het volgende weten:

    • De puntschatting waarvoor je het betrouwbaarheidsinterval opzet
    • De kritieke waarden voor de teststatistiek
    • De standaarddeviatie van je steekproef
    • De steekproefgrootte

    Als je al deze dingen weet, kun je het betrouwbaarheidsinterval voor je schatting berekenen door ze in de formule voor het betrouwbaarheidsinterval te zetten die overeenkomt met je data. Wat de formule precies is hangt af van het type schatting (e.g., een gemiddelde of een proportie) en van de verdeling van je data.

    Wat vind jij van dit artikel?
    Veronique Scharwächter

    Veronique heeft twee bachelors: één in Taal- en Cultuurstudies en één in Philosophy, Politics and Economics. Daarnaast heeft zij een boek geschreven over hoe filosofie je kan helpen in je studentenleven. Ze hoopt haar brede, interdisciplinaire kennis in te kunnen zetten om zo veel mogelijk studenten te helpen met het schrijven van hun scriptie.