Variantie begrijpen en berekenen | Uitleg met voorbeelden

De variantie (variance) is een maat die iets zegt over de spreiding in een dataset. Hoe meer de data verspreid zijn, hoe groter de variantie ten opzichte van het gemiddelde.

De variantie is een van de vier meest gebruikte spreidingsmaten (measures of variability), samen met:

Je bepaalt de variantie door het rekenkundig gemiddelde van de gekwadrateerde afwijkingen van het gemiddelde te berekenen.

Verder lezen: Variantie begrijpen en berekenen | Uitleg met voorbeelden

Hoe bepaal je de interkwartielafstand (interquartile range)?

De interkwartielafstand (interquartile range) is een descriptieve statistiek die informatie geeft over de spreiding van de middelste helft van een verdeling. Deze maat behoort tot de vier meest gebruikte spreidingsmaten (measures of variability).

Iedere verdeling waarbij de waarden zijn gerangschikt van laag naar hoog kan worden verdeeld in vier gelijke delen (kwartielen). De interkwartielafstand (IQR) bevat het tweede en derde kwartiel, wat neerkomt op het middelste deel of de “middelste helft” van je dataset.

Kwartielen en de IQR

Het bereik (de range) geeft informatie over de spreiding in de gehele dataset, terwijl de interkwartielafstand gelijk is aan het bereik van de middelste helft.

Verder lezen: Hoe bepaal je de interkwartielafstand (interquartile range)?

Spreidingsmaten: Bereik, interkwartielafstand, standaarddeviatie en variantie

De spreiding geeft aan hoe ver datapunten van elkaar en van het centrum van een verdeling verwijderd zijn. Je gebruikt spreidingsmaten in combinatie met centrummaten om de data samen te vatten met beschrijvende statistieken.

Spreiding wordt ook wel variabiliteit genoemd. Meestal gebruik je een van de volgende spreidingsmaten (measures of variability):

  • Bereik (range): het verschil tussen de hoogste en laagste waarde.
  • Interkwartielafstand (interquartile range): het verschil tussen het eerste en derde kwartiel.
  • Standaarddeviatie (standard deviation): de gemiddelde afstand tot het gemiddelde.
  • Variantie (variance): het rekenkundig gemiddelde van de kwadratische afwijkingen van het gemiddelde.

Verder lezen: Spreidingsmaten: Bereik, interkwartielafstand, standaarddeviatie en variantie

Hoe bepaal je het bereik (range) van een dataset?

Het bereik (ook wel spreidingsbreedte of range genoemd) is het interval tussen de laagste en de hoogste waarde in de dataset. Het is een veelgebruikte maat voor de spreiding (variability).

Je gebruikt spreidingsmaten en centrummaten om je data samen te vatten met behulp van descriptieve of beschrijvende statistieken.

Het bereik wordt berekend door de laagste waarde van de hoogste waarde af te trekken. Als het bereik groot is, is er sprake van een hoge variabiliteit, terwijl een laag bereik gepaard gaat met een lage variabiliteit.

Verder lezen: Hoe bepaal je het bereik (range) van een dataset?

Hoe kun je de modus (mode) bepalen?

De modus (mode) of modale waarde van een dataset is de waarde die het vaakst voorkomt. Het is een centrummaat die laat zien wat de meest populaire antwoordoptie of het meest voorkomende kenmerk is voor de steekproef.

Centrummaten vallen onder beschrijvende (descriptieve) statistiek en helpen je het midden (of centrum) van de dataset te vinden. De drie meest voorkomende centrummaten zijn de modus, mediaan (median) en het gemiddelde (mean).

Verder lezen: Hoe kun je de modus (mode) bepalen?

Hoe kun je de mediaan (median) berekenen? | Voorbeelden

De mediaan (median) is de waarde die zich precies in het midden van een dataset bevindt als je de waarden van laag naar hoog zet. Het is een centrummaat die de laagste 50% van de waarden scheidt van de hoogste 50%.

De stappen om de mediaan te vinden zijn afhankelijk van het aantal waarden in de dataset. Bij een oneven aantal staat één waarde in het midden, maar bij een even aantal waarden moet je het gemiddelde van de twee middelste waarden berekenen om de mediaan te vinden.

De mediaan wordt meestal gebruikt voor kwantitatieve data (waarbij de waarden numeriek zijn), maar je kunt de mediaan soms ook gebruiken voor ordinale data (waarbij de waarden zijn verdeeld over categorieën).

Verder lezen: Hoe kun je de mediaan (median) berekenen? | Voorbeelden

Centrummaten: Modus, mediaan en gemiddelde | Met voorbeelden

Centrummaten (measures of central tendency) helpen je het midden of gemiddelde van een dataset te vinden. De drie meest voorkomende centrummaten zijn de modus (mode), mediaan (median) en het gemiddelde (mean).

  • Modus: de waarde die het vaakst voorkomt.
  • Mediaan: de middelste waarde als je de dataset van kleinste naar grootste waarde rangschikt.
  • Gemiddelde: de som van alle waarden, gedeeld door het totale aantal waarden.

Als je beschrijvende statistieken gebruikt om je data samen te vatten, kijk je niet alleen naar de centrale tendens (central tendency), maar ook naar de verdeling en spreiding of variabiliteit van je dataset.

Verder lezen: Centrummaten: Modus, mediaan en gemiddelde | Met voorbeelden

Descriptieve of beschrijvende statistiek | Uitleg & Voorbeelden

Met descriptieve of beschrijvende statistiek orden je de data en vat je de kenmerken van je dataset samen. Een dataset is een verzameling reacties of observaties van een steekproef of een hele populatie.

Bij kwantitatief onderzoek begin je aan je statistische analyse na afronding van de dataverzameling. Bij de eerste stap beschrijf je de kenmerken van de antwoorden, zoals het gemiddelde van een variabele (bijvoorbeeld leeftijd), of de relatie tussen twee variabelen (bijvoorbeeld tussen leeftijd en creativiteit).

Bij de volgende stap kijk je naar toetsende of inferentiële statistieken, die je helpen beslissen of de data je hypothese bevestigen en of het resultaat generaliseerbaar is naar een grotere populatie.

Verder lezen: Descriptieve of beschrijvende statistiek | Uitleg & Voorbeelden

Een introductie tot getrapte steekproeven (multistage sampling)

Bij getrapte steekproeven (ook wel multistage sampling of een meertrapssteekproef genoemd) trek je een steekproef uit een populatie, waarna je nog één of meerdere steekproeven trekt (met steeds kleinere eenheden in iedere fase).

getrapte steekproeven (multistage sampling)

Voorbeeld: Getrapte steekproef
Je doet onderzoek naar de tevredenheid over gemeentebeleid. Je kunt niet alle inwoners van alle gemeenten een enquête aanbieden. Daarom trek je eerst een aselecte steekproef om enkele provincies te kiezen. Vervolgens trek je nog een steekproef om gemeenten te selecteren. Ten slotte trek je nog een laatste aselecte steekproef om 200 huishoudens uit die gemeenten te selecteren voor de enquête.

Verder lezen: Een introductie tot getrapte steekproeven (multistage sampling)