Populatie versus steekproef: Het verschil

populatie vs steekproef

Een populatie is de gehele groep waarover je uitspraken wilt doen, bijvoorbeeld “verpleegkundigen tussen de 25 en 34 jaar oud”.

Een steekproef is de specifieke subgroep die je daadwerkelijk onderzoekt en waarvoor je data verzamelt. De steekproef is altijd kleiner dan de populatie zelf, omdat je maar een deel van de populatie onderzoekt.

Bij wetenschappelijk onderzoek bestaat een populatie niet altijd uit mensen. Een populatie kan namelijk ook bestaan uit objecten, gebeurtenissen, organisaties, landen, diersoorten, organismen, et cetera.

Populatie vs steekproef
Populatie Steekproef
Vacatures voor banen in de IT in Nederland Top 50 zoekresultaten voor vacatures voor IT-banen in Nederlands op 1 mei 2021
Liedjes van het Eurovisie Songfestival Winnende, Engelstalige liedjes van het Eurovisie Songfestival
Bachelorstudenten psychologie in Nederland 300 bachelorstudenten Psychologie van drie Nederlandse universiteiten
Alle landen ter wereld Landen die data hebben gepubliceerd over hun geboortecijfers en sterftecijfers sinds 2000

Data verzamelen voor een gehele populatie

Populaties worden gebruikt als het nodig is voor je onderzoeksvraag of als je toegang hebt tot data voor ieder lid van de populatie. In de meeste gevallen is het niet haalbaar om data te verzamelen voor een gehele populatie, tenzij deze klein en toegankelijk is.

Voorbeeld: Data verzamelen voor een gehele populatie
Een decaan op een middelbare school wil de eindexamenresultaten van alle eindexamenleerlingen analyseren om te zien of er patronen zijn. Aangezien de decaan alleen uitspraken wil kunnen doen over eindexamenleerlingen op die specifieke middelbare school, wordt de gehele populatie onderzocht.

In het geval van grotere en minder toegankelijke populaties is het vaak moeilijk om data te verzamelen voor ieder individu. Zo proberen onderzoekers in de Verenigde Staten iedere 10 jaar iedere inwoner te tellen, zodat een correcte begroting kan worden gemaakt en middelen eerlijk kunnen worden verdeeld over het land.

Toch is gebleken dat gemarginaliseerde groepen moeilijk te bereiken zijn en dat leden van deze groepen minder vaak bereid zijn deel te nemen aan de tellingen. Aangezien veel mensen niet deelnemen, wordt nooit de gehele populatie geteld. Ook zijn de data vertekend, omdat gemarginaliseerde groepen minder vaak deelnemen dan niet-gemarginaliseerde groepen. Hierdoor worden de middelen niet eerlijk verdeeld.

In deze gevallen is het beter om een representatieve steekproef te trekken om uitspraken te kunnen doen over de populatie.

Data verzamelen voor een steekproef

Als je populatie groot, geografisch verspreid of moeilijk te bereiken is, is het noodzakelijk om een steekproef te gebruiken. Door statistische analyses uit te voeren, kun je steekproefdata gebruiken om hypothesen over een gehele populatie te toetsen.

Voorbeeld: Data verzamelen voor een steekproef
Je wilt onderzoek doen naar politieke voorkeuren van jongvolwassenen op hogescholen. Je populatie bestaat uit de 445.000 hbo-studenten in Nederland. Aangezien het niet haalbaar is om data te verzamelen voor ieder lid van de populatie, gebruik je een steekproef van 300 studenten (verdeeld over drie hogescholen). Deze groep vult je online enquête in. Op basis van de enquêteresultaten van je steekproef doe je uitspraken over de gehele populatie.

In de ideale situatie trek je een aselecte, representatieve steekproef. Aselecte steekproefmethoden (zoals een enkelvoudige aselecte steekproef) verkleinen het risico op sampling bias en dragen bij aan een hogere interne en externe validiteit.

Vaak is het praktischer om een selecte steekproefmethode te kiezen voor een (scriptie)onderzoek. Deze methoden zijn vaak goedkoper, minder tijdrovend en minder strict. Helaas gaan selecte steekproeven ook gepaard met minder sterke statistische claims en een verlaagde validiteit.

Redenen voor een steekproef

  • Noodzaak: Soms is het niet mogelijk om de gehele populatie te onderzoeken vanwege de grootte of ontoegankelijkheid.
  • Praktisch: Het is makkelijker en efficiënter om data te verzamelen voor een subset van de populatie (steekproef).
  • Kosteneffectiviteit: Er zijn minder participanten en de kosten voor materialen, apparatuur en onderzoekers zijn lager.
  • Beheersbaarheid: Het is makkelijker om statistische analyses uit te voeren met kleine datasets.

Wie helpt jou met nakijken?

Betrouwbare hulptroepen vinden is niet makkelijk...

  • Familie
  • Vrienden
  • Studiegenoten
  • Scribbr

We staan altijd voor je klaar

Populatieparameter vs steekproefstatistiek

Als je data verzamelt voor een populatie of steekproef, kun je diverse berekeningen uitvoeren op basis van de data. Een parameter is een maat die de gehele populatie beschrijft. Een statistiek is een maat die de steekproef beschrijft.

Op basis van de steekproefstatistiek kun je gefundeerde voorspellingen doen over de populatieparameter.

Voorbeeld: Parameters en statistieken
Tijdens je onderzoek naar politieke voorkeuren van hbo-studenten vraag je je respondenten om op een 7-punts Likertschaal aan te geven hoe links (1) of rechts (7) ze zijn. Je ontdekt dat het grootste deel van je steekproef zichzelf links vindt. De gemiddelde score voor deze vraag is 2,2.

Je kunt deze statistiek, het steekproefgemiddelde van 2,2, gebruiken om een wetenschappelijk gefundeerde uitspraak te doen over de populatieparameter (de gemiddelde voorkeur van alle hbo-studenten in Nederland).

Sampling error

De sampling error is het verschil tussen een populatieparameter en een steekproefstatistiek. In het geval van je onderzoek naar politieke voorkeuren is de sampling error gelijk aan het verschil tussen de gemiddelde voorkeur van de hbo-studenten uit je steekproef en de gemiddelde voorkeur van alle hbo-studenten in Nederland.

Sampling errors komen ook voor als je een aselecte steekproefmethode gebruikt. Dit komt doordat ook aselecte steekproeven van de populatie verschillen met betrekking tot het gemiddelde en de standaarddeviatie.

Het doel van wetenschappelijk onderzoek is om de resultaten van de steekproef te kunnen generaliseren naar een grotere populatie. Daarom wil je ervoor zorgen dat de sampling error zo laag mogelijk is. Je kunt de sampling error verkleinen door een grotere steekproef te onderzoeken.

Veelgestelde vragen

Waarom gebruik je een steekproef?

Om de volgende redenen kun je een steekproef gebruiken:

  • als de omvang van de populatie te groot is om alle elementen te meten
  • als snelheid gewenst is, waardoor niet de hele populatie onderzocht kan worden
  • als het te kostbaar is om een groot aantal metingen uit te voeren

Deze drie redenen gelden eigenlijk altijd voor een scriptie, tenzij de onderzoekspopulatie heel klein is. Je steekproef dient ertoe geldende uitspraken te doen over de gehele onderzoeksgroep (aselect) of de selectie die je hebt gemaakt (select).

Wanneer gebruik je een steekproef?

Je gebruikt een steekproef uitsluitend wanneer je kwantitatief onderzoek verricht. Je kunt met een steekproef onderzoek doen naar allerlei onderwerpen, zowel personen, groepen, fenomenen als bestaande gegevens.

Wanneer gebruik je geen steekproef?

Doorgaans gebruik je geen steekproef als je kwalitatief onderzoek verricht. Ook gebruik je nooit een steekproef als je onderzoekspopulatie zo klein is dat je simpelweg alle personen die hiertoe behoren kunt ondervragen. Dit is mede afhankelijk van je onderzoeksmethode.

Wat is een enkelvoudige aselecte steekproef (simple random sampling)?

Een enkelvoudige aselecte steekproef (simple random sampling) is de eenvoudigste versie van een aselecte steekproef. De onderzoeker kiest willekeurig participanten uit een populatie om een steekproef te vormen. Ieder lid van de populatie heeft een even grote kans om in de steekproef te belanden. Vervolgens vindt de dataverzameling plaats.

Je kunt bijvoorbeeld willekeurig participanten kiezen door een random number generator te gebruiken.

Wat is een geclusterde steekproef (cluster sampling)?

Geclusterde steekproeven vallen onder de aselecte steekproefmethoden. Je deelt een populatie op in clusters, zoals districten of scholen, en kiest dan willekeurig (aselect) enkele clusters om je steekproef te vormen.

In het ideale geval is ieder cluster een mini-versie van de populatie als geheel.

Wat vind jij van dit artikel?
Pritha Bhandari

Pritha heeft een academische achtergrond in Engels, psychologie en cognitieve neurowetenschappen. Als interdisciplinaire onderzoekster vindt ze het leuk om begrijpelijke artikelen te schrijven, zodat ze moeilijke concepten kan uitleggen aan studenten en academici.

1 reactie

Pritha Bhandari
Pritha Bhandari (Scribbr Team)
23 augustus 2021 om 18:11

Bedankt voor het lezen! Ik hoop dat je er iets aan hebt gehad. Is er nog iets onduidelijk of ontbreekt er iets aan het artikel? Laat een opmerking achter, dan zal ik proberen je te antwoorden.

Is er iets nog niet helemaal duidelijk of ontbreekt er wat? Laat een opmerking achter.

Please click the checkbox on the left to verify that you are a not a bot.