Hoe verzamel en analyseer je nominale data?

Je kunt de data voor variabelen met een nominaal meetniveau verdelen over verschillende categorieën, waarbij iedere waarde maar tot één categorie kan behoren. Bovendien kunnen de categorieën niet worden gerangschikt.

Een voorbeeld van een nominale variabele is “vervoersmiddelen”. Hierbij zou je de data kunnen verdelen over de categorieën auto, bus, trein, tram, fiets en metro. Iedere waarde kan maar in één categorie vallen (want iets kan bijvoorbeeld niet zowel een auto als een metro zijn). Je kunt de genoemde categorieën niet rangschikken op een betekenisvolle manier. Het maakt immers niet uit of je de rangschikking begint of eindigt met de auto.

Meetniveaus

Het meetniveau geeft aan hoe precies de data zijn verzameld. Er zijn vier meetniveaus: nominaal, ordinaal, interval en ratio. Een hoger meetniveau is altijd complexer en preciezer.

de vier meetniveaus

Het nominale meetniveau is het minst precieze en het minst complexe niveau. De data kunnen wel worden gelabeld, maar niet worden gerangschikt. Ook zijn de afstanden tussen de categorieën niet gelijk (het is niet vast te stellen of de afstand tussen een auto en metro even groot is als de afstand tussen een metro en trein) en er is geen betekenisvol nulpunt.

Voorbeelden van nominale data

In het geval van een nominaal meetniveau past iedere respons of observatie maar in één categorie. Nominale data kunnen worden uitgedrukt in woorden of getallen, maar zelfs als je numerieke labels gebruikt om je data in te voeren, kun je geen berekeningen uitvoeren met de data.

Voorbeelden van nominale variabelen
Variabele Categorieën
Postcode
  • 6641
  • 1816
  • 1007
Boomsoorten
  • Eik
  • Berk
  • Beuk
Muziekstijlen
  • Latin
  • Rock
  • Hiphop
  • Pop
Genres
  • Politieke roman
  • Liefdesroman
  • Toekomstroman
  • Spionageroman
  • Psychologische roman

Variabelen die je maar op twee manieren kunt coderen (bijvoorbeeld ja/nee, waar/onwaar) worden binair of dichotoom genoemd. Aangezien ook hier de volgorde van de labels niet uitmaakt, vallen binaire variabelen onder nominale variabelen.

Kijk jij ook zo uit naar afstuderen?

We helpen je graag een handje!

  • Minder stress
  • Hulp binnen handbereik
  • 100% tevredenheidsgarantie

Ontdek hoe we jou kunnen helpen

Hoe verzamel je nominale data?

Je kunt bijvoorbeeld nominale data verzamelen door open of gesloten enquêtevragen te stellen. Als de variabele waarin je geïnteresseerd bent maar uit enkele categorieën bestaat, kun je het beste gesloten vragen gebruiken (zoals meerkeuzevragen).

Voorbeelden van gesloten vragen
Wat is je gender? Man
Vrouw
Anders
Ik beantwoord deze vraag liever niet
Ben je in het bezit van een smartphone? Ja
Nee
Wat je favoriete filmgenre? Romantiek
Actie
Detective
Animatie
Musical
Komedie
Thriller

Als de variabele waarin je geïnteresseerd bent heel veel mogelijke categorieën heeft of als je niet alle categorieën weet, kun je het beste open vragen gebruiken.

Voorbeelden van open vragen
  1. Wat is je studentnummer?
  2. Wat is je postcode?
  3. Wat is je moedertaal?

Hoe analyseer je nominale data?

Je kunt je nominale data organiseren en visualiseren met behulp van tabellen en diagrammen. Vervolgens kun je de lezer descriptieve statistieken over je data presenteren. Deze statistieken zeggen iets over de frequentieverdeling en de centrale tendens. Let hierbij wel op het type statistiek dat je gebruikt, want niet alle centrum- en spreidingsmaten zijn toepasbaar op nominale data.

Voorbeeld: Nominal dataset
Je geeft je respondenten een enquête met onder andere een vraag over hun moedertaal. Je dataset bestaat uit een lijst met responsen.

Dataset
Nederlands
Nederlands
Engels
Nederlands
Nederlands
Nederlands
Engels
Engels
Duits
Duits
Nederlands
Nederlands
Nederlands
Nederlands
Engels
Engels
Duits
Nederlands
Duits
Nederlands
Nederlands
Engels
Engels
Nederlands
Duits
Nederlands
Nederlands

Verdeling of spreiding

Om inzicht te krijgen in de data, kun je een automatische frequentietabel opvragen, zodat je het aantal responses per categorie (Nederlands, Engels, Duits) ziet.

Meestal kun je een automatische frequentietabel genereren, maar als je er zelf een wilt maken, plaats je alle mogelijke categorieën van de variabele in de linkerkolom en het aantal responsen voor iedere categorie in de andere kolom.

Moedertaal Frequentie
Nederlands 15
Engels 7
Duits 5
Je kunt de absolute frequenties ook omzetten in percentages (relatieve frequenties). Hiertoe deel je iedere frequentie door het totale aantal waarden (in dit geval 27). Vervolgens vermenigvuldig je dit getal met 100.

Moedertaal Percentage
Nederlands 55,6%
Engels 25,9%
Duits 18,5%

 

Vervolgens kun je deze tabellen eventueel visualiseren door diagrammen te gebruiken, zoals een cirkeldiagram (relatief) of een staafdiagram. Doe dit echter alleen als de visualisering iets toevoegt aan de tekst.

Centrummaten

De centrummaten geven een indicatie van het zwaartepunt van je data. De modus, het gemiddelde en de mediaan zijn de drie meest gebruikte centrummaten. In het geval van nominale data kun je alleen de modus gebruiken.

Om de mediaan vast te stellen, moet je de data namelijk kunnen rangschikken van laag naar hoog. Voor het gemiddelde moet je berekeningen kunnen uitvoeren, zoals optellen en delen. Je kunt nominale data over categorieën verdelen, maar het is niet mogelijk om de data te rangschikken of op te tellen.

Daarom kun je alleen de centrummaat “modus” gebruiken om de centrale tendens van nominale data te beschrijven. De modus is de vaakst voorkomende waarde.

Modus
Om de modus in je nominale dataset te vinden, zoek je de meest frequent voorkomende waarde in je frequentietabel.

In dit geval gaven de meeste participanten aan Nederlands als moedertaal te hebben, dus Nederlands is de modus.

Statistische toetsen voor nominale data

Inferentiële of toetsende statistiek kan worden gebruikt om wetenschappelijke hypothesen over je data te toetsen. In het geval van nominale data gebruik je non-parametrische statistische toetsen, omdat parametrische toetsen gepaard gaan met statistische aannames (zoals normaal verdeelde data). Deze aannames zijn niet toepasbaar op nominale data, omdat de categorieën niet betekenisvol kunnen worden gerangschikt.

De chi-kwadraattoets (chi-squared test) is een non-parametrische toets die wordt gebruikt voor categorische variabelen. Er zijn drie varianten:

  • De aanpassingstoets (om te onderzoeken of de gevonden verdeling correspondeert met de verwachte verdeling).
  • De onafhankelijkheidstoets (om te onderzoeken of twee variabelen gerelateerd zijn).
  • De homogeniteitstoets (om te onderzoeken of meerdere steekproeven uit dezelfde verdeling afkomstig zijn).

De aanpassingstoets (goodness of fit) wordt gebruikt voor datasets met één variabele, en de onafhankelijkheidstoets (chi-square test of independence) wordt gebruikt voor datasets met twee variabelen.

Je gebruikt de aanpassingstoets als je data hebt verzameld uit één populatie door middel van een aselecte steekproef. Om te toetsen hoe representatief je steekproef is, vergelijk je de frequentieverdeling van je steekproef met de verwachte verdeling van de bredere populatie om te bepalen of de werkelijkheid overeenkomt met de verwachting.

Chi-kwadraattoets: Aanpassingstoets
Op basis van de huidige data over je populatie verwacht je dat 30% Nederlands als moedertaal heeft, 30% Engels en 40% Duits. Uit je steekproef blijkt echter dat circa 55% Nederlands als moedertaal heeft, 25% Engels en 20% Duits.

Met de chi-kwadraattoets kun je onderzoeken of hetgeen je hebt gevonden statistisch gezien afwijkt van hetgeen al bekend was.

Met de onafhankelijkheidstoets kun je onderzoeken of een relatie tussen twee categorische vairabelen significant is.

Chikwadraattoets: Onafhankelijkheidstoets
Je verzamelt data over moedertalen en over voorkeuren voor muziekstijlen. Met de onafhankelijkheidstoets kun je bepalen of er sprake is van een relatie tussen die twee nominale variabelen in je steekproef.

Veelgestelde vragen

Waarom zijn meetniveaus van belang?

Het niveau waarop je een variabele meet, bepaalt hoe je je data kunt analyseren.

Afhankelijk van het meetniveau kun je diverse descriptieve statistieken gebruiken om je data samen te vatten. Ook kun je inferentiële statistiek (ook wel toetsende of verklarende statistiek genoemd) gebruiken om te bepalen of je resultaten de hypothese ondersteunen of weerleggen.

Hoe bepaal ik welk meetniveau ik moet gebruiken?

Sommige variabelen gaan gepaard met een vaststaand meetniveau. Zo worden gender of etniciteit altijd op nominaal niveau gemeten, omdat je de categorieën niet kunt rangschikken.

Bij andere variabelen kun je het meetniveau wel kiezen. De variabele “studenteninkomen” kan bijvoorbeeld op ordinaal of rationiveau worden gemeten.

  • Op ordinaal niveau zou je vijf groepen kunnen creëren met een bepaald bereik (bijvoorbeeld 0 – 499, 500 – 799, 800 – 1099, 1100 – 1999 en 2000 – 2299). Participanten kruisen dan het juiste bereik aan.
  • Op rationiveau zou je naar het exacte inkomen vragen.

Als je kunt kiezen, is het beter om op rationiveau te meten, zodat je de data op meer manieren kunt analyseren. Hoe hoger je meetniveau, hoe preciezer de data.

Wat zijn de vier meetniveaus?

Meetniveaus laten zien hoe precies variabelen worden gemeten. Er zijn vier meetniveaus (of meetschalen) die van laag naar hoog kunnen worden gerangschikt.

  • Nominaal: De data kunnen alleen worden gecategoriseerd (geen rangorde).
  • Ordinaal: De data kunnen worden gecategoriseerd en gerangschikt.
  • Interval: De data kunnen worden gecategoriseerd en gerangschikt en er zijn gelijke intervallen tussen de categorieën.
  • Ratio: De data kunnen worden gecategoriseerd en gerangschikt, de intervallen zijn gelijk, en er is een absoluut of betekenisvol nulpunt.
Wat zijn nominale data?

Nominale data kunnen worden verdeeld over categorieën (waarbij ieder datapunt maar in één categorie hoort) en de categorieën kunnen niet worden gerangschikt op een logische of natuurlijke manier.

Een voorbeeld van een nominale variabele is “vervoersmiddel”. Deze zou bijvoorbeeld uit de categorieën fiets, auto, bus, trein, metro en tram kunnen bestaan. Die vervoersmiddelen kunnen niet op een logische manier worden geordend, want het maakt bijvoorbeeld niet uit of je start met de fiets of de auto.

In het geval van een ordinale variabele, zoals “opleidingsniveau” zou je de opleidingsniveaus vmbo, havo, vwo wel op een logische manier kunnen rangschikken.

Het nominale meetniveau is het minst complexe en minst precieze meetniveau.

Wat zijn de verschillen tussen nominale en ordinale data?

Het nominale meetniveau verschilt van het ordinale meetniveau, omdat nominale data alleen gecategoriseerd kunnen worden, maar ordinale data ook gerangschikt kunnen worden.

Een voorbeeld van een nominale variabele is “Kledingwinkels”. Je kunt de data bijvoorbeeld verdelen over Zara, H&M, Only en Primark, maar je kunt die kledingwinkels niet op een natuurlijke, logische manier rangschikken.

Een voorbeeld van een ordinale variabele is “Leeftijd”. Je kunt de data bijvoorbeeld verdelen over 0-18, 19-34, 35-49 en 50+, en deze categorieën kun je in een logische volgorde zetten.

Wat vind jij van dit artikel?
Pritha Bhandari

Pritha heeft een academische achtergrond in Engels, psychologie en cognitieve neurowetenschappen. Als interdisciplinaire onderzoekster vindt ze het leuk om begrijpelijke artikelen te schrijven, zodat ze moeilijke concepten kan uitleggen aan studenten en academici.