Hoe bepaal je het bereik (range) van een dataset? | Voorbeeld

Het bereik (ook wel spreidingsbreedte of range genoemd) is het interval tussen de laagste en de hoogste waarde in de dataset. Het is een veelgebruikte maat voor de spreiding (variability).

Je gebruikt spreidingsmaten en centrummaten om je data samen te vatten met behulp van descriptieve of beschrijvende statistieken.

Het bereik wordt berekend door de laagste waarde van de hoogste waarde af te trekken. Als het bereik groot is, is er sprake van een hoge variabiliteit, terwijl een laag bereik gepaard gaat met een lage variabiliteit.

Het bereik berekenen

Je gebruikt de volgende formule om het bereik te berekenen:

Formula to find the range

  • R = range (bereik)
  • H = hoogste waarde
  • L = laagste waarde

Het bereik is de makkelijkst te berekenen spreidingsmaat. Om het bereik te bepalen, volg je de volgende stappen:

  1. Rangschik alle waarden in je dataset van laag naar hoog.
  2. Trek de laagste waarde van de hoogste waarde af.

Het stappenplan is hetzelfde voor positieve en negatieve waarden, en ook voor hele getallen of getallen met decimalen.

Voorbeeld: Bereik
Je dataset bevat de leeftijden van 8 participanten.

Participant 1 2 3 4 5 6 7 8
Leeftijd 37 19 31 29 21 26 33 36

Eerst rangschik je de waarden van laag naar hoog om de laagste waarde (L) en de hoogste waarde (H) te bepalen.

Leeftijd 19 21 26 29 31 33 36 37

Vervolgens bepaal je het bereik door de laagste waarde van de hoogste waarde af te trekken.

R = HL

R = 37 19 = 18

Het bereik van de dataset is 18 jaar.

Hoe informatief is het bereik?

Het bereik is over het algemeen een goede indicator voor de spreiding als je een verdeling hebt zonder extreme waarden (uitbijters of outliers). Als je het bereik combineert met centrummaten (measures of central tendency), kan het bereik bijdragen aan het begrip van je dataset.

Het bereik kan misleidend zijn als je uitschieters in je dataset hebt. Slechts één extreme waarde in de dataset levert al een heel ander bereik op.

Voorbeeld: Bereik met uitschieter
We vervangen een waarde in de dataset door een uitschieter.

Leeftijd 19 21 26 29 31 33 36 61

Hoewel we dezelfde formule gebruiken, krijgen we dit keer een heel ander resultaat:

R = HL

R = 61 – 19 = 42

Door de uitschieter is ons bereik nu 42 jaar.

In het bovenstaande voorbeeld suggereert het bereik veel meer spreiding dan in werkelijkheid het geval is. Hoewel we een groot bereik hebben, zijn de meeste waarden eigenlijk geclusterd rond een duidelijk midden.

Omdat er slechts twee getallen worden gebruikt om het bereik te berekenen, wordt deze maat al snel beïnvloed door uitbijters. Ook zegt het bereik niets over de vorm van de verdeling (normaal verdeeld of scheef verdeeld).

Om een duidelijk beeld te krijgen van de spreiding, kun je het bereik het beste gebruiken in combinatie met andere spreidingsmaten, zoals de interkwartielafstand en de standaarddeviatie.

Wie helpt jou met nakijken?

Betrouwbare hulptroepen vinden is niet makkelijk...

  • Familie
  • Vrienden
  • Studiegenoten
  • Scribbr

We staan altijd voor je klaar

Veelgestelde vragen

Wat is de het bereik (de range)?

Het bereik (ook wel spreidingsbreedte of range genoemd) is het interval tussen de laagste en de hoogste waarde in de dataset. Het is een veelgebruikte maat voor de spreiding (variability).

Kan het bereik (de range) een negatief getal zijn?

Nee, het bereik kan alleen 0 of een positieve waarde zijn, omdat je deze spreidingsmaat berekent door de laagste waarde van de hoogste waarde af te trekken.

Wat zijn de vier meest gebruikte spreidingsmaten?

De spreiding (variability) wordt meestal bepaald met de volgende descriptieve statistieken:

  • Bereik (range): het verschil tussen de hoogste en laagste waarde uit de dataset.
  • Interkwartielafstand (interquartile range): het bereik van het middelste deel van de dataset.
  • Standaarddeviatie (standard deviation): de gemiddelde afstand tussen iedere waarde in de dataset en het gemiddelde.
  • Variantie (variance): de standaarddeviatie in het kwadraat.
Wat is het verschil tussen centrummaten en spreidingsmaten?

Centrummaten zeggen iets over het punt waar de meeste waarden geclusterd zijn (het midden of het centrum van je dataset). Spreidingsmaten geven informatie over de afstand tussen datapunten (hoe verspreid zijn de data).

Datasets kunnen dezelfde centrale tendens hebben en een verschillende mate van spreiding (of andersom). Door beide soorten maten te combineren, krijg je een compleet beeld van je data.

Wat vind jij van dit artikel?
Pritha Bhandari

Pritha heeft een academische achtergrond in Engels, psychologie en cognitieve neurowetenschappen. Als interdisciplinaire onderzoekster vindt ze het leuk om begrijpelijke artikelen te schrijven, zodat ze moeilijke concepten kan uitleggen aan studenten en academici.