Hoe verzamel en analyseer je intervaldata?

Intervaldata wordt gemeten op een numerieke schaal met gelijke afstanden tussen de aangrenzende waarden. Deze afstanden worden “intervallen” genoemd. Doordat de afstanden tussen de verschillende datapunten gelijk zijn, kun je bepaalde berekeningen uitvoeren.

Het verschil tussen interval- en ratiodata is dat een intervalschaal geen natuurlijk nulpunt kent. Bij een schaal op intervalniveau is het nulpunt willekeurig gekozen, en betekent het niet dat de variabele compleet afwezig is.

Zo is temperatuur (in graden Celsius) een intervalvariabele. Het nulpunt is willekeurig gekozen en 0 graden betekent het niet dat er helemaal geen temperatuur aanwezig is (of dat dit de koudst mogelijke temperatuur is). Tijd is daarentegen een ratiovariabele, omdat 0 minuten daadwerkelijk een betekenisvol nulpunt is (en het laagst mogelijke aantal).

De vier meetniveaus

Het intervalniveau is een van de vier meetniveaus. Deze niveaus geven aan hoe precies de data zijn verzameld. Hoe hoger het niveau, hoe complexer en preciezer de meting is.

De vier meetniveaus: nominaal, ordinaal, interval en ratio

Nominale en ordinale variabelen zijn categorisch, terwijl interval- en ratiovariabelen kwantitatief van aard zijn. Je kunt veel meer statistische toetsen gebruiken voor kwantitatieve data dan voor categorische data.

Interval versus ratio

Interval- en ratioschalen worden allebei gekenmerkt door gelijke intervallen tussen opeenvolgende waarden. Echter, ratioschalen hebben een betekenisvol, natuurlijk nulpunt, terwijl intervalschalen dit niet hebben.

Celsius en Fahrenheit zijn voorbeelden van intervalschalen. Ieder punt op deze schalen verschilt precies 1 graad van het vorige of volgende punt. Het verschil tussen 20 en 21 graden is exact hetzelfde als het verschil tussen 34 en 35 graden. Daarnaast zijn de nulpunten op deze schalen arbitrair: 0 graden Celsius of Fahrenheit is niet de laagst mogelijke temperatuur.

Aangezien er geen natuurlijk nulpunt is, kun je de scores niet vermenigvuldigen of door elkaar delen. Zo is 30°C niet twee keer zo warm als 15°C.

De temperatuurschaal voor Kelvin is wel een ratioschaal, omdat 0 het absolute nulpunt is. Niets is kouder dan 0 K. Daarom kun je deze waarden wel vermenigvuldigen of door elkaar delen: 20 K is twee keer zo heet als 10 K.

Ontvang feedback op taal, structuur, lay-out en bronvermelding

Professionele Scribbr-editors kijken je scriptie na op:

  • Academisch taalgebruik
  • Onduidelijke zinnen
  • Grammaticale fouten
  • Interpunctie
  • Verboden woorden

Bekijk het voorbeeld

Voorbeelden van intervaldata

Psychologische concepten, zoals intelligentie, worden vaak gekwantificeerd tijdens het operationaliseren. De meeste testen die worden gebruikt hebben gelijke intervallen tussen scores, maar er zijn geen betekenisvolle nulpunten, omdat ze niet “nul intelligentie” of “nul persoonlijkheid” kunnen meten.

Soort Voorbeelden
Gestandaardiseerde test IQ

CITO

MMSE

Psychologische testen Beck’s Depression Inventory

Raven’s Progressive Matrices

Big Five personality trait test

Om te bepalen of een schaal van ordinaal of intervalniveau is, kun je controleren of er gestandaardiseerde meeteenheden worden gebruikt, waarbij het verschil tussen twee waarden bekend is. Bijvoorbeeld:

  • Interval: Een schaal om pijn te beoordelen van 0 (geen pijn) tot 10 (ergst mogelijke pijn).
  • Ratio: Een schaal om pijn te beoordelen met de scores geen pijn, milde pijn, ernstige pijn, maximale pijn.

Data-analyse van intervaldata

Om een beeld te krijgen van je data, kun je eerst de volgende descriptieve statistieken verzamelen:

  • De frequentieverdeling (absolute cijfers of percentages);
  • De modus, mediaan of het gemiddelde om een beeld te krijgen van de centrale tendens;
  • Het bereik, de standaarddeviatie en de variantie om de spreiding aan te geven.
Voorbeeld: Intervaldata
In Amerika wordt de SAT gebruikt als een toelatingstoets voor universiteiten. De hoogte van de SAT-score bepaalt of een universiteit je toelaat tot de studie die je wilt volgen.

Voor dit onderzoek verzamel je de SAT-scores van een groep van 59 scholieren uit Atlanta. De SAT-score kan variëren van 400 tot 1600.

Verdeling

Tabellen en grafieken kunnen worden gebruikt om je data te organiseren en de verdeling van je data te visualiseren.

Je kunt een frequentietabel gebruiken om je data te organiseren.

SAT-score Frequentie
401 – 600 0
601 – 800 4
801 – 1000 15
1001 – 1200 19
1201 – 1400 16
1401 – 1600 5
Vervolgens kun je een lijngrafiek gebruiken om je data te visualiseren. Zet de score-intervallen op de x-as en de frequenties op de y-as. Gebruik een lijn om de punten te verbinden.Tabellen en grafieken kunnen worden gebruikt om je data te organiseren en de verdeling van je data te visualiseren.

Centrale tendens

De grafiek laat zien dat je data redelijk normaal verdeeld zijn. Er is geen sprake van een scheve verdeling, dus je kunt de drie meest gebruikte maten voor de centrale tendens gebruiken: de modus, de mediaan en het gemiddelde.

De modus is de waarde die het vaakst voorkomt in je dataset (de hoogste frequentie). In dit geval is er geen modus, omdat iedere waarde slechts één keer voorkomt. De meeste waarden vallen in de categorie 1001-1200.
De mediaan is de waarde in het midden van je dataset (nadat je de waarden van klein naar groot hebt gerangschikt). Om de middelste positie te vinden, kies je de waarde op positie (n+1)/2, waarbij n overeenkomt met het totale aantal waarden.

(n+1)/2 = (59+1)/2 = 30

De mediaan is de waarde op de 30e positie, en in dit geval is dat de waarde 1120.

Om het gemiddelde te berekenen, gebruik je de formule ⅀x/n. Je telt alle waarden bij elkaar op (⅀x) en deelt de som van alle waarden door het aantal waarden (n).

⅀x = 65850
n = 59
⅀x/n = 65850/59 = 1116,1

 

Het gemiddelde wordt meestal beschouwd als de beste maat voor de centrale tendens, mits je data normaal zijn verdeeld. Dat komt doordat je voor de berekening van deze maat alle waarden in je dataset gebruikt, in tegenstelling tot bij de modus of de mediaan.

Spreiding

Het bereik (range), de standaarddeviatie en de variantie geven informatie over de spreiding van je data rond het gemiddelde. Het bereik is het makkelijkst te berekenen, maar de standaarddeviatie en variantie geven je betere informatie over de spreiding.

Om het bereik te bepalen, bereken je het verschil tussen de hoogste en de laatste waarde in je dataset. Ons maximum is 1500 en ons minimum is 620.

Bereik = 1500 – 620 = 880

De standaarddeviatie (s of SD) is de gemiddelde hoeveelheid variantie in je dataset. Deze maat geeft aan hoe ver iedere score gemiddeld verwijderd is van het gemiddelde. De standaarddeviatie kan eenvoudig worden berekend met een programma als SPSS of Excel of met een online tool. Als je de standaarddeviatie met de hand wilt berekenen, kun je deze stappen gebruiken.

s = 210,42

De variantie (s2) is de standaarddeviatie in het kwadraat.


s
2 = 44279,36

Statistische toetsen

Nu je een beeld hebt van je data, kun je de juiste statistische toets kiezen om je data te analyseren. Als je data normaal verdeeld zijn, kun je zowel voor parametrische als non-parametrische toetsen kiezen.

Parametrische toetsen hebben meer power dan non-parametrische toetsen en je kunt sterkere conclusies trekken op basis van je data. Je data moeten echter wel aan enkele eisen voldoen om parametrische toetsen te kunnen uitvoeren.

De volgende parametrische toetsen worden vaak gebruikt om hypothesen over intervaldata te toetsen.

Doel Steekproef of variabelen Toets Voorbeeld
Vergelijking van gemiddelden 2 steekproeven T-toets Wat is het verschil in CITO-scores van studenten van twee verschillende basisscholen?
Vergelijking van gemiddelden 3 of meer steekproeven ANOVA Wat is het verschil in CITO-scores van scholieren uit drie CITO-trainingsgroepen?
Correlatie 2 variabelen Pearson’s r Hoe correleren CITO-scores met Entreetoets-scores?
Regressieanalyse 2 variabelen Enkelvoudige lineaire regressie Wat is de invloed van het huishoudinkomen op CITO-scores van kinderen?

Veelgestelde vragen

Wat zijn de vier meetniveaus?

Meetniveaus laten zien hoe precies variabelen worden gemeten. Er zijn vier meetniveaus (of meetschalen) die van laag naar hoog kunnen worden gerangschikt.

  • Nominaal: De data kunnen alleen worden gecategoriseerd (geen rangorde).
  • Ordinaal: De data kunnen worden gecategoriseerd en gerangschikt.
  • Interval: De data kunnen worden gecategoriseerd en gerangschikt en er zijn gelijke intervallen tussen de categorieën.
  • Ratio: De data kunnen worden gecategoriseerd en gerangschikt, de intervallen zijn gelijk, en er is een absoluut of betekenisvol nulpunt.
Hebben Likertschalen een ordinaal of intervalmeetniveau?

Je data kunnen twee meetniveaus hebben: ordinaal of interval. De data-analysemethode is afhankelijk van het meetniveau van de data.

  • data van de individuele Likertvragen zijn ordinaal.
  • data van de totale Likertschaal worden beschouwd als intervaldata.

Bij ordinale schalen zijn de verschillen tussen de antwoordopties niet gelijk verdeeld of onbekend. Zo weet je bijvoorbeeld niet zeker of het verschil tussen “Helemaal mee oneens” en “oneens” even groot is als het verschil tussen “oneens” en “neutraal”.

Bij intervalschalen zijn deze verschillen tussen antwoordopties wel gelijk. Zo is het verschil tussen “1” en “2” bijvoorbeeld net zo groot als het verschil tussen “2” en “3”.

De data van de totale Likertschaal worden vaak gezien als intervaldata, omdat het een totaalscore is waarbij scores van vier of meer vragen bij elkaar zijn opgeteld.

Wat vind jij van dit artikel?
Pritha Bhandari

Pritha heeft een academische achtergrond in Engels, psychologie en cognitieve neurowetenschappen. Als interdisciplinaire onderzoekster vindt ze het leuk om begrijpelijke artikelen te schrijven, zodat ze moeilijke concepten kan uitleggen aan studenten en academici.