Geclusterde steekproeven (cluster sampling) | Met voorbeelden

Bij een geclusterde steekproef (cluster sampling) delen onderzoekers een populatie op in kleinere groepjes. Deze worden clusters genoemd. Vervolgens selecteren ze willekeurig clusters om een steekproef te vormen.

Een geclusterde steekproef valt onder aselecte steekproeven. Dit type wordt vaak gebruikt om grote populaties te onderzoeken, en in het bijzonder populaties met een grote geografische spreiding. Onderzoekers gebruiken bestaande groepen (zoals scholen of steden) als hun clusters.

Een geclusterde steekproef valt onder aselecte steekproeven

Hoe trek je een geclusterde steekproef?

De meest eenvoudige vorm is een single-stage geclusterde steekproef. Deze bestaat uit vier stappen.

Voorbeeld: Onderzoek
Je bent geïnteresseerd in het gemiddelde leesniveau van alle leerlingen uit groep 7 uit Nijmegen.

Het zou erg moeilijk worden om een lijst te verkrijgen van alle leerlingen uit groep 7 en daaruit een steekproef te trekken. In plaats daarvan kun je wel eenvoudig een lijst van alle scholen verzamelen, een aselecte steekproef trekken, en vervolgens data verzamelen van de groep 7-leerlingen van de willekeurig geselecteerde scholen. Je kiest dus voor een geclusterde steekproef.

Stap 1: Bepaal de populatie

Net als bij andere steekproefmethoden, begin je eerst met het definiëren van de populatie waarin je geïnteresseerd bent.

Begin eerst met het definiëren van de populatie waarin je geïnteresseerd bent.

Voorbeeld: Populatie
In het onderzoek naar leesniveaus, bestaat je populatie uit alle groep 7-leerlingen in Nijmegen.

Stap 2: Deel je populatie op in clusters

Dit is het meest belangrijke onderdeel van het proces. De kwaliteit van je clusters en de mate waarin ze representatief zijn voor de grotere populatie, bepaalt de validiteit van je resultaten. In het ideale geval voldoen je clusters aan de volgende criteria:

  • Ieder cluster moet zo divers mogelijk zijn. Je wilt dat iedere potentiële eigenschap van de populatie in ieder cluster voorkomt.
  • In ieder cluster moet de verdeling van eigenschappen ongeveer gelijk zijn en deze verdeling moet dan ook weer overeenkomen met die van de populatie als geheel.
  • De clusters moeten gezamenlijk de hele populatie vormen.
  • Er mag geen overlap zijn tussen clusters, dus participanten (of andere onderzoekseenheden) mogen niet in meerdere clusters voorkomen.

In het ideale geval vormt ieder cluster dus een mini-versie van de populatie. In de praktijk is het vaak niet mogelijk om ervoor te zorgen dat de eigenschappen van de populatie perfect verdeeld zijn over de clusters. Daarom kun je met deze methode minder sterke statistische claims maken dan bij andere aselecte steekproefmethoden.

Aangezien clusters vaak op natuurlijke wijze gevormd worden (scholen, steden, huishoudens), zijn ze meestal meer homogeen van aard dan de populatie zelf. Zo kan het bijvoorbeeld voorkomen dat je een christelijke school onderzoekt, terwijl niet je hele populatie christelijk is. Dan vormt dat ene cluster geen representatieve, heterogene steekproef. Hiermee moet je rekening houden bij je onderzoek, omdat de (externe) validiteit dus kan worden geschaad door deze steekproefmethode.

Deel je populatie op in clusters

Voorbeeld: Clusters
Je clustert de groep 7-leerlingen op basis van hun school. Om de hele populatie bij het onderzoek te betrekken, moet je iedere school in de stad Nijmegen als cluster nemen en dan aselect clusters selecteren. Er is geen overlap tussen de clusters, omdat iedere leerling maar op één school zit.

Stap 3: Voer een aselecte steekproef uit om clusters te selecteren

Als ieder cluster een mini-versie van de populatie vormt, zorgt een aselecte steekproef van die clusters ervoor dat je in feite een enkelvoudige aselecte steekproef nabootst. Dit verhoogt de validiteit van je resultaten.

Als de clusters niet representatief zijn, zorgt een aselecte steekproef er nog steeds voor dat je data verzamelt van verschillende clusters, waardoor je alsnog een overzicht krijgt van de populatie als geheel.

Stap 3: Voer een aselecte steekproef uit om clusters te selecteren

Voorbeeld: Steekproef
Je kent iedere school (cluster) een nummer toe en gebruikt een random number generator om een aselecte steekproef te trekken.

Je bepaalt het aantal clusters op basis van de benodigde steekproefgrootte. Die baseer je dan weer op de grootte van de populatie (in dit geval de leerlingen uit groep 7 die in Nijmegen naar school gaan), het betrouwbaarheidsniveau, het betrouwbaarheidsinterval, en een schatting van de standaarddeviatie. Door deze gegevens in te voeren in een gratis steekproefcalculator kun je de vereiste steekproefgrootte berekenen.

Stap 4: Verzamel data van je steekproef

Vervolgens voer je je onderzoek uit en verzamel je data van de geselecteerde clusters.

Vervolgens voer je je onderzoek uit en verzamel je data van de geselecteerde clusters.

Voorbeeld: Dataverzameling
Je bepaalt het leesniveau van iedere groep 7-leerling van de scholen die zijn geselecteerd voor je steekproef door een leestest af te nemen.

Hoeveel fouten bevat jouw scriptie?

De taalexperts van Scribbr verbeteren gemiddeld 150 fouten per 1000 woorden. Benieuwd wat er precies wordt verbeterd? Verschuif de cursor van links naar rechts!

Scriptie nakijken op taal

Multi-stage geclusterde steekproef

Bij een multi-stage geclusterde steekproef (of meerfasen geclusterde steekproef) verzamel je geen data van alle individuen uit je geselecteerde clusters. In plaats daarvan voer je nog een aselecte steekproef uit nadat je de clusters hebt geselecteerd, waardoor er slechts enkele individuen uit ieder cluster in je steekproef belanden.

Vervolgens verzamel je data van al deze individuen. Dit heet een tweefasen-steekproef (double-stage sampling).

Vervolgens verzamel je data van al deze individuen. Dit heet een tweefasen-steekproef

Je kunt deze procedure ook meerdere keren herhalen (dus weer een aselecte steekproef trekken), waardoor je steeds kleinere steekproeven overhoudt. Dit heet een meerfasen-steekproef (multi-stage sampling).

Je kunt deze methode gebruiken als het niet haalbaar of te duur is om de gehele clusters te onderzoeken.

Voorbeeld: Meerfasen-steekproef
Je kiest ervoor om niet iedere groep 7-leerling van de geselecteerde scholen te onderzoeken. In plaats daarvan doorloop je nog twee fasen om je steekproef te verkleinen.
  1. Je trekt een aselecte steekproef voor iedere school, zodat je een steekproef van een aantal groep 7-klassen per school overhoudt.
  2. Binnen die klassen trek je een aselecte steekproef om een aantal leerlingen te selecteren.

Je uiteindelijke steekproef is veel kleiner, en daarom is het makkelijker om data te verzamelen.

Voordelen en nadelen

Geclusterde steekproeven worden meestal gebruikt omdat ze erg praktisch zijn, maar er zijn ook enkele nadelen (die vooral betrekking hebben op de statistische validiteit).

Voordelen

  • Geclusterde steekproeven zijn goedkoop en efficiënt, zeker als je populatie een groot geografisch gebied beslaat en het moeilijk zou zijn om een ander soort steekproef te trekken.
  • Aangezien geclusterde steekproeven tot de aselecte steekproefmethoden behoren, kun je een hoge externe validiteit waarborgen, omdat je steekproef representatief is voor de grotere populatie. Hierbij is het wel essentieel dat je de populatie op de juiste manier hebt geclusterd.

Nadelen

  • De interne validiteit is lager dan bij een enkelvoudige aselecte steekproef, zeker als je geclusterde steekproef uit meerdere fasen bestaat.
  • Als je clusters geen goede representatie van de gehele populatie vormen, is het moeilijker om (extern) valide resultaten te verkrijgen op basis van je steekproef.
  • Een geclusterde steekproef is vaak complexer dan andere steekproefmethoden, waardoor deze variant een goede voorbereiding vereist.

Veelgestelde vragen

Wat is een geclusterde steekproef (cluster sampling)?

Geclusterde steekproeven vallen onder de aselecte steekproefmethoden. Je deelt een populatie op in clusters, zoals districten of scholen, en kiest dan willekeurig (aselect) enkele clusters om je steekproef te vormen.

In het ideale geval is ieder cluster een mini-versie van de populatie als geheel.

Wat zijn voordelen en nadelen van geclusterde steekproeven?

Geclusterde steekproeven zijn goedkoper en efficiënter dan andere aselecte steekproefmethoden, zeker als het gaat om een populatie die een groot geografisch gebied beslaat.

Helaas biedt deze methode ook minder statistische zekerheid dan andere methoden, zoals een enkelvoudige aselecte steekproef, omdat het moeilijk is om te bepalen of de clusters representatief zijn voor de gehele populatie.

Waarom gebruik je een steekproef?

Om de volgende redenen kun je een steekproef gebruiken:

  • als de omvang van de populatie te groot is om alle elementen te meten
  • als snelheid gewenst is, waardoor niet de hele populatie onderzocht kan worden
  • als het te kostbaar is om een groot aantal metingen uit te voeren

Deze drie redenen gelden eigenlijk altijd voor een scriptie, tenzij de onderzoekspopulatie heel klein is. Je steekproef dient ertoe geldende uitspraken te doen over de gehele onderzoeksgroep (aselecte steekproef) of de selectie die je hebt gemaakt (selecte steekproef).

Citeer dit Scribbr-artikel

Als je naar deze bron wilt verwijzen, kun je de bronvermelding kopiëren of op “Citeer dit Scribbr-artikel” klikken om de bronvermelding automatisch toe te voegen aan onze gratis Bronnengenerator.

Thomas, L. (2023, 13 februari). Geclusterde steekproeven (cluster sampling) | Met voorbeelden. Scribbr. Geraadpleegd op 9 december 2024, van https://www.scribbr.nl/onderzoeksmethoden/geclusterde-steekproeven/

Wat vind jij van dit artikel?
Lauren Thomas

Lauren heeft een bachelor in Economie en Politicologie en is momenteel bezig met de afronding van haar master Economie. Ze is altijd onderweg en heeft in vijf steden in de VS en Frankrijk gewoond. Ze is blij met een baan die haar overal volgt.