Hoe kun je de modus (mode) berekenen? | Voorbeelden

De modus (mode) of modale waarde van een dataset is de waarde die het vaakst voorkomt. Het is een centrummaat die laat zien wat de meest populaire antwoordoptie of het meest voorkomende kenmerk is voor de steekproef.

Centrummaten vallen onder beschrijvende (descriptieve) statistiek en helpen je het midden (of centrum) van de dataset te vinden. De drie meest voorkomende centrummaten zijn de modus, mediaan (median) en het gemiddelde (mean).

Hoeveel modi kun je hebben?

Een dataset kan geen modus, één modus of meer dan één modus hebben:

  • geen enkele modus: alle waarden zijn anders
  • unimodaal: één modus
  • bimodaal: twee modi
  • trimodaal: drie modi
  • multimodaal: vier of meer modi

De modus bepalen

Je kunt de modus bepalen met behulp van de volgende stappen:

  1. Als je data numeriek van aard zijn, rangschik je de waarden van laag naar hoog. Als je data categorisch zijn, verdeel je de waarden over de juiste categorieën.
  2. Zoek de waarde of waarden die het vaakst voorkomen.

Voorbeeld van een numerieke modus

Je dataset bevat de leeftijden van 6 universitaire studenten.

Dataset
Participant A B C D E F
Leeftijd 19 22 20 21 22 23

Door de waarden van laag naar hoog te zetten, kun je makkelijker zien welke waarde het vaakst voorkomt.

Gesorteerde dataset
Leeftijd 19 20 21 22 22 23

De modus van deze dataset is 22.

Voorbeeld van een categorische modus

Je dataset bevat informatie over het opleidingsniveau van de ouders van participanten.

Dataset
Participant A B C D E F
Opleidingsniveau ouders Bachelor Master Middelbare school Bachelor PhD Master

Om de waarden te sorteren per groep, kun je een frequentietabel opvragen of zelf maken. Als je deze zelf maakt, zet je de categorieën in de linkerkolom en voeg je de frequenties toe in de rechterkolom.

Frequentietabel
Opleidingsniveau ouders Frequentie
Bachelor 2
Master 2
Middelbare school 1
PhD 1

De tabel laat zijn dat er twee modi zijn. Dit betekent dat je te maken hebt met een bimodale dataset.

De modi zijn bachelor en master.

Lees waarom zo veel studenten Scribbr inschakelen

Ontdek nakijken op taal

Bepaal de modus van gegroepeerde data

Bij een gegroepeerde frequentietabel wordt gebruikgemaakt van intervallen of klassen, waarbij je een gecombineerde (totaal)frequentie geeft voor alle waarden uit dat interval.

Voor gegroepeerde data kun je de modus op twee manieren rapporteren:

  • De modale klasse is het interval met de hoogste frequentie.
  • De modale waarde wordt geschat als het middelpunt van de modale klasse.

De modus is in dit geval slechts een schatting, omdat de werkelijke waarden binnen de modale klasse onbekend zijn.

Voorbeeld van modale klasse en modale waarde

Je dataset gaat onder andere over de gemiddelde reactietijden van participanten. Je vat de data samen door gebruik te maken van een frequentietabel.

De reactietijden zijn ingedeeld in klassen van 100 milliseconden. De kolom met frequenties laat zien hoeveel participanten in een bepaalde klasse vallen.

Gegroepeerde frequentietabel
Reactietijd (milliseconden) Frequentie
200–299 6
300–399 13
400–499 17
500–599 25
600–699 21
700–799 12
800–899 4

Je kunt je data visualiseren met behulp van een histogram of staafdiagram (bar chart). De modus is de waarde met de hoogste staaf.

Histogram dat de modus van een gegroepeerde dataset toont

De tabel en histogram laten zien dat de modale klasse het interval van 500–599 milliseconden is. De modus wordt geschat op het midden van deze klasse, namelijk op 550 milliseconden.

De keuze voor een interval kan de modus heel sterk beïnvloeden. Zo kun je een hele andere modus vinden als je geen intervallen van 100 ms gebruikt, maar bijvoorbeeld van 50 of 20 ms.

Wanneer gebruik je de modus?

Het meetniveau van je variabelen bepaalt of je de modus zou moeten gebruiken.

De modus werkt het beste als je gebruikmaakt van categorische data. Het is de enige centrummaat voor nominale variabelen, waar de modus het meest voorkomende kenmerk van de dataset laat zien (bijvoorbeeld demografische informatie).

De modus is ook handig als je variabelen van ordinaal niveau zijn, bijvoorbeeld om het meest populaire antwoord te bepalen (zoals bij een schaal over de mate van overeenstemming).

Als je kwantitatieve data gebruikt, zoals reactietijd of lengte, is de modus niet altijd een nuttige centrummaat. Dit komt doordat er veel meer mogelijke waarden zijn dan bij categorische data, waardoor het niet altijd zo is dat waarden meerdere keren voorkomen.

Voorbeeld van kwantitatieve data zonder modus

Je verzamelt reactietijden met behulp van een computertaak. Je dataset bevat waarden die allemaal van elkaar verschillen.

Dataset zonder modus
Reactietijd (milliseconden) 267 345 421 324 401 312 382 298 303

In deze dataset is er geen modus, omdat iedere waarde maar één keer voorkomt.

Veelgestelde vragen

Op welke manier kun je de modus (mode) bepalen?

Je kunt de modus bepalen met behulp van de volgende stappen:

  1. Als je data numeriek van aard zijn, rangschik je de waarden van laag naar hoog. Als je data categorisch zijn, verdeel je de waarden over de juiste categorieën.
  2. Zoek de waarde of waarden die het vaakst voorkomen.

 

Kan er meer dan één modus (mode) zijn?

Een dataset kan geen modus, één modus of meer dan één modus hebben:

  • geen enkele modus: alle waarden zijn anders
  • unimodaal: één modus
  • bimodaal: twee modi
  • trimodaal: drie modi
  • multimodaal: vier of meer modi
Wat zijn centrummaten (measures of central tendency)?

Centrummaten (measures of central tendency) helpen je het centrum of midden van een dataset te vinden.

De drie meest gebruikte centrummaten zijn het gemiddelde, de mediaan en de modus.

  • De modus is de waarde die het vaakst voorkomt
  • De mediaan is de middelste waarde als je de dataset van kleinste naar grootste waarde rangschikt.
  • Het gemiddelde is de som van alle waarden, gedeeld door het totale aantal waarden.
Welke centrummaten kan ik gebruiken met mijn data?

Welke centrummaten je kunt gebruiken, is afhankelijk van het meetniveau en de verdeling van je data.

Ook moet je op de verdeling van je data letten. Voor normaal verdeelde data kun je alle drie de centrummaten gebruiken, maar bij scheve verdelingen is de mediaan de beste keuze.

Wat vind jij van dit artikel?
Julia Merkus

Julia heeft onder andere een bachelor in Nederlandse Taal en Cultuur en twee masters in Linguistics en Taal- en Spraakpathologie, waardoor ze heel wat scripties heeft geschreven. Na enkele jaren als editor schrijft ze nu artikelen over alles wat bij een scriptie komt kijken om zo studenten met succes te laten afstuderen.
1