Een introductie tot getrapte steekproeven (multistage sampling)

Bij getrapte steekproeven (ook wel multistage sampling of een meertrapssteekproef genoemd) trek je een steekproef uit een populatie, waarna je nog één of meerdere steekproeven trekt (met steeds kleinere eenheden in iedere fase).

Voorbeeld: Getrapte steekproef
Je doet onderzoek naar de tevredenheid over gemeentebeleid. Je kunt niet alle inwoners van alle gemeenten een enquête aanbieden. Daarom trek je eerst een aselecte steekproef om enkele provincies te kiezen. Vervolgens trek je nog een steekproef om gemeenten te selecteren. Ten slotte trek je nog een laatste aselecte steekproef om 200 huishoudens uit die gemeenten te selecteren voor de enquête.

Steekproef met één versus meerdere fasen

Bij steekproeven met één fase verdeel je een populatie in eenheden (bijvoorbeeld huishoudens of individuen) en trek je direct een steekproef, waarna je data verzamelt voor alle geselecteerde participanten.

Bij een getrapte steekproef verdeel je de populatie over steeds kleinere groepen in meerdere stappen. Vaak volg je hierbij een vaststaande hiërarchie (bijvoorbeeld: provincies, gemeenten, buurten, huishoudens) om vervolgens op een relatief snelle en goedkope manier gegevens te verzamelen.

Je kunt zowel selecte als aselecte steekproefmethoden gebruiken voor beide soorten steekproeven (één of meerdere fasen), maar het is beter om een aselecte methode te kiezen. Zo kun je een hogere externe validiteit waarborgen en zijn je statistische claims sterker.

Bij een steekproef met één fase begin je met een lijst van ieder lid van de populatie (steekproefkader of sampling frame). Deze lijst moet zo compleet mogelijk zijn, zodat je steekproef een representatieve weergave van de populatie vormt.

Lijst van de populatie (steekproefkader)
Je wilt een enquête verspreiden onder studenten in je provincie. Je doelgroep bestaat uit studenten tussen de 18 en 21 jaar, en je wilt graag een steekproef van 7500 studenten vormen.

De lijst voor je onderzoek bestaat uit alle studenten tussen de 18 en 21 jaar die zijn ingeschreven bij onderwijsinstellingen in jouw provincie. Om deze lijst te verzamelen, benader je iedere onderwijsinstelling voor een lijst met studenten.

Je kunt een enkelvoudige aselecte steekproef, systematische steekproef of clustersteekproef gebruiken om een aselecte steekproef te trekken.

Clustersteekproef vs gestratificeerde steekproef

Bij clustersteekproeven en gestratificeerde steekproeven deel je de populatie op in groepen die elkaar uitsluiten en de gehele populatie dekken. Zo past ieder lid van de populatie precies in één cluster of stratum.

Bij clustersteekproeven wordt de populatie verdeeld in clusters, die meestal gebaseerd zijn op geografie (bijvoorbeeld steden of staten) of organisatie (bijvoorbeeld scholen of universiteiten). Bij clustersteekproeven met één fase selecteer je willekeurig enkele clusters voor de steekproef en verzamel je in één fase gegevens van iedereen binnen die clusters.

Clustersteekproef met één fase
Je verdeelt de participanten over clusters op basis van geografie, waardoor je 98 clusters met studenten creëert. Je selecteert 15 clusters met behulp van een aselecte steekproef en neemt alle leden van die clusters op in de steekproef.

Bij gestratificeerde steekproeven wordt de populatie opgedeeld in strata, die vaak gebaseerd zijn op demografische kenmerken, zoals etniciteit, gender of sociaaleconomische status. Elke eenheid of elk lid van de populatie wordt in één stratum geplaatst. Je selecteert willekeurig enkele leden uit elk stratum zodat alle groepen vertegenwoordigd zijn in de uiteindelijke steekproef.

Gestratificeerde steekproef met één fase
Je verdeelt de participanten van de lijst over drie strata op basis van de sociaaleconomische status. Vervolgens gebruik je een aselecte steekproef om deelnemers uit ieder stratum te selecteren, zodat je voldoende deelnemers van elk sociaal-economisch niveau in je steekproef hebt.

Een getrapte steekproef gaat vaak om een combinatie van clustersteekproeven en gestratificeerde steekproeven.

Hoe voer je een getrapte steekproef uit?

Getrapte steekproeven worden vaak beschouwd als een uitgebreide versie van clustersteekproeven.

Bij getrapte steekproeven verdeel je de populatie over clusters en selecteer je in de eerste fase enkele clusters. In elke volgende fase deel je die geselecteerde clusters op in kleinere clusters en herhaal je het proces totdat je bij de laatste stap bent. Bij de laatste stap selecteer je slechts enkele leden van ieder cluster voor je steekproef.

Net als bij steekproeven met één fase, begin je met het definiëren van je doelgroep. Echter, bij getrapte steekproeven heb je geen steekproefkader nodig met elk lid van de populatie. Daarom is dit een handige methode om gegevens van grote, geografisch verspreide populaties te verzamelen.

Onderzoeksvoorbeeld
Je populatie bestaat uit alle studenten tussen de 18 en 21 die staan ingeschreven bij een onderwijsinstelling in jouw provincie.

Als je geen toegang hebt tot een lijst met alle studenten, kun je geen enkelvoudige aselecte steekproef trekken. Bovendien zou het heel veel tijd en geld kosten om data te verzamelen van mensen die zo verspreid leven.

Daarom kies je voor een getrapte steekproefmethode om een representatieve steekproef te kunnen trekken.

Bij steekproeven met meerdere fasen beweeg je altijd van clusters op een hoger niveau naar clusters op een lager niveau. Die clusters worden vaak steekproefeenheden genoemd.

  • In de eerste fase deel je de populatie in op clusters en selecteer je er enkele. Dit zijn je primaire steekproefeenheden of primary sampling units (PSUs).
  • In de tweede fase deel je de PSUs op in kleinere clusters en selecteer je weer enkele clusters. Dit zijn je secundaire steekproefeenheden of secondary sampling units (SSUs).
  • Je kunt eindigen bij de tweede fase, maar je kunt ook doorgaan met dit proces en zoveel fasen doorlopen als je nodig hebt. In de laatste fase eindig je met ultieme steekproefeenheden of ultimate sampling units (USUs).
Getrapte steekproef
Tijdens de eerste fase maak je een lijst van gemeenten in je provincie. Je selecteert 15 gemeenten als primaire onderzoekseenheden.

In de tweede fase noteer je alle scholen in die gemeenten. Je selecteert 6 scholen van iedere gemeente als secundaire steekproefeenheden.

In de derde fase maak je een lijst van alle studenten die naar die scholen gaan. Je selecteert 50 studenten van iedere school als ultieme steekproefeenheden en verzamelt data voor die studenten.

In het meest ideale geval gebruik je een aselecte steekproef voor iedere fase. Als dit niet mogelijk is, kun je de methode combineren met andere steekproefmethoden (afhankelijk van je onderzoek en de haalbaarheid).

Hoeveel fouten bevat jouw scriptie?

De taalexperts van Scribbr verbeteren gemiddeld 150 fouten per 1000 woorden. Benieuwd wat er precies wordt verbeterd? Verschuif de cursor van links naar rechts!

Scriptie nakijken op taal

Eerste fase: primaire steekproefeenheden

In de eerste fase deel je de populatie op in clusters die de gehele populatie dekken en uitputtend zijn, net als bij geclusterde steekproeven.

Vervolgens selecteer je enkele clusters als primaire steekproefeenheden, waarbij je indien mogelijk een aselecte steekproefmethode gebruikt (maar je mag ook andere steekproefmethoden met één fase gebruiken).

Bij grootschalige enquêtes wordt in de eerste fase vaak een combinatie van een clustersteekproef en een gestratificeerde steekproef gebruikt om ervoor te zorgen dat de eenheden representatief zijn voor de gehele populatie. Dit wordt een gestratificeerde getrapte steekproef genoemd.

Je begint met het stratificeren van de clusters in de eerste fase. Na stratificatie selecteer je clusters met behulp van een aselecte steekproefmethode.

Voorbeeld: Eerste fase
In de eerste fase besluit je een combinatie van een clustersteekproef en een gestratificeerde steekproef te gebruiken.

Je maakt een lijst van alle gemeenten binnen de provincie. Iedere gemeente is een eenheid of cluster. Je kunt eenvoudig een lijst met alle gemeenten maken, omdat deze informatie openbaar is (in tegenstelling tot een lijst van alle studenten in een provincie).

Je deelt de gemeenten op in strata op basis van het type gemeente: stedelijk, voorstedelijk en landelijk. Je wilt ervoor zorgen dat alle drie de gebiedstypen in je steekproef worden vertegenwoordigd.

Voor ieder stratum vermeld je de gemeenten die in die categorie vallen. Vervolgens gebruik je een enkelvoudige aselecte steekproef om uit ieder stratum 5 gemeenten te selecteren. Deze (3 * 5) 15 gemeenten zijn de primaire steekproefeenheden.

Een clustersteekproef met één fase zou op dit punt eindigen, omdat je dan gegevens verzamelt van iedereen binnen de geselecteerde gemeenten (de PSUs). Dit is in de praktijk vaak niet haalbaar, dus getrapte steekproeven gaan nog enkele stappen verder.

Tweede fase: secundaire steekproefeenheden

In de tweede fase verdeel je de primaire steekproefeenheden verder op. Je selecteert slechts enkele kleinere eenheden binnen iedere geselecteerde PSU: dit zijn de secundaire steekproefeenheden (SSUs).

Voorbeeld: Tweede fase
In de tweede fase noteer je alle scholen binnen de geselecteerde gemeenten. Het is veel werk om gegevens van alle scholen te verzamelen, dus je trekt een aselecte steekproef om 6 scholen uit iedere gemeente te selecteren.

Je gebruikt een eenvoudige aselecte steekproefmethode om 6 scholen uit iedere gemeente te selecteren. Dit zijn de secundaire steekproefeenheden.

Als je op dit punt eindigt, is er sprake van een tweetraps steekproef (two-stage of double-stage sampling). In dit geval zou je data verzamelen van iedereen in de secundaire steekproefeenheden (dus van alle leerlingen van de geselecteerde scholen).

Je hoeft niet per se meer fasen te doorlopen, maar vaak kun je het onderzoeksproces hiermee nog wel versimpelen.

Laatste fase: ultieme steekproefeenheden

Je kunt het proces van steeds kleinere eenheden creëren blijven herhalen. In de laatste fase eindig je met de ultieme steekproefeenheden. Voor die participanten ga je de data verzamelen.

Voorbeeld: Laatste fase
In de laatste fase neem je contact op met de geselecteerde scholen om lijsten van ingeschreven studenten te verzamelen. Vervolgens gebruik je een systematische steekproef voor iedere lijst, zodat je 50 participanten per school overhoudt.

Deze studenten zijn je ultieme steekproefeenheden: ze vormen de definitieve steekproef waarvoor je data gaat verzamelen.

Voordelen en nadelen

Getrapte steekproeven zijn handig en flexibel bij grote populaties, maar het kan moeilijk zijn om ervoor te zorgen dat de steekproef representatief is voor de populatie.

Voordelen

  • Je hoeft niet te beginnen met een lijst van alle leden van de populatie.
  • De methode is relatief goedkoop en effectief in vergelijking met een enkelvoudige, aselecte steekproef, zeker als het gaat om een sterk verspreide populatie.
  • De methode is flexibel: je kunt diverse steekproefmethoden gebruiken tijdens de verschillende fasen.

Nadelen

  • Je hebt een grotere steekproef nodig (in vergelijking met een enkelvoudige aselecte steekproef) om dezelfde statische power te bereiken.
  • De beste keuze voor een steekproefmethode (tijdens iedere fase) is vrij subjectief, dus je moet je keuzes goed beargumenteren.
  • De methode kan tot niet-representatieve steekproeven leiden, omdat grote delen van de populatie niet worden opgenomen in de steekproef.

Veelgestelde vragen

Wat is een getrapte steekproef (meerstapssteekproef)?

Bij een getrapte steekproef of meertrapssteekproef (multistage sampling) trek je een steekproef uit een populatie met in elke fase kleinere groepen (steekproefeenheden).

Deze methode wordt vaak gebruikt om gegevens te verzamelen voor een grote, geografisch verspreide groep mensen. Meestal volg je hierbij een vaststaande hiërarchie (bijvoorbeeld: provincies, gemeenten, buurten, huishoudens) om vervolgens op een relatief snelle en goedkope manier gegevens te verzamelen.

Wat is een gestratificeerde steekproef (stratified sample)?

Bij gestratificeerde steekproeven verdelen onderzoekers participanten over subgroepen (strata) op basis van een of meerdere gemeenschappelijke kenmerken (zoals etniciteit, gender, opleidingsniveau, et cetera).

Eenmaal verdeeld, wordt een aselecte steekproef getrokken voor iedere subgroep.

 

Wat is een geclusterde steekproef (cluster sampling)?

Geclusterde steekproeven vallen onder de aselecte steekproefmethoden. Je deelt een populatie op in clusters, zoals districten of scholen, en kiest dan willekeurig (aselect) enkele clusters om je steekproef te vormen.

In het ideale geval is ieder cluster een mini-versie van de populatie als geheel.

Wat vind jij van dit artikel?
Pritha Bhandari

Pritha heeft een academische achtergrond in Engels, psychologie en cognitieve neurowetenschappen. Als interdisciplinaire onderzoekster vindt ze het leuk om begrijpelijke artikelen te schrijven, zodat ze moeilijke concepten kan uitleggen aan studenten en academici.

1 reactie

Pritha Bhandari
Pritha Bhandari (Scribbr Team)
20 september 2021 om 15:57

Bedankt voor het lezen! Ik hoop dat je er iets aan hebt gehad. Is er nog iets onduidelijk of ontbreekt er iets aan het artikel? Laat een opmerking achter, dan zal ik proberen je te antwoorden.

Is er iets nog niet helemaal duidelijk of ontbreekt er wat? Laat een opmerking achter.

Please click the checkbox on the left to verify that you are a not a bot.