Populatie vs steekproef: het verschil | Met voorbeelden
Een populatie is de gehele groep waarover je uitspraken wilt doen, bijvoorbeeld “verpleegkundigen tussen de 25 en 34 jaar oud”.
Een steekproef is de specifieke subgroep die je daadwerkelijk onderzoekt en waarvoor je data verzamelt. De steekproef is altijd kleiner dan de populatie zelf, omdat je maar een deel van de populatie onderzoekt.
Bij wetenschappelijk onderzoek bestaat een populatie niet altijd uit mensen. Een populatie kan namelijk ook bestaan uit objecten, gebeurtenissen, organisaties, landen, diersoorten, organismen, et cetera.
Populatie | Steekproef |
---|---|
Vacatures voor banen in de IT in Nederland | Top 50 zoekresultaten voor vacatures voor IT-banen in Nederlands op 1 mei 2021 |
Liedjes van het Eurovisie Songfestival | Winnende, Engelstalige liedjes van het Eurovisie Songfestival |
Bachelorstudenten psychologie in Nederland | 300 bachelorstudenten Psychologie van drie Nederlandse universiteiten |
Alle landen ter wereld | Landen die data hebben gepubliceerd over hun geboortecijfers en sterftecijfers sinds 2000 |
Data verzamelen voor een gehele populatie
Populaties worden gebruikt als het nodig is voor je onderzoeksvraag of als je toegang hebt tot data voor ieder lid van de populatie. In de meeste gevallen is het niet haalbaar om data te verzamelen voor een gehele populatie, tenzij deze klein en toegankelijk is.
In het geval van grotere en minder toegankelijke populaties is het vaak moeilijk om data te verzamelen voor ieder individu. Zo proberen onderzoekers in de Verenigde Staten iedere 10 jaar iedere inwoner te tellen, zodat een correcte begroting kan worden gemaakt en middelen eerlijk kunnen worden verdeeld over het land.
Toch is gebleken dat gemarginaliseerde groepen moeilijk te bereiken zijn en dat leden van deze groepen minder vaak bereid zijn deel te nemen aan de tellingen. Aangezien veel mensen niet deelnemen, wordt nooit de gehele populatie geteld. Ook zijn de data vertekend, omdat gemarginaliseerde groepen minder vaak deelnemen dan niet-gemarginaliseerde groepen. Hierdoor worden de middelen niet eerlijk verdeeld.
In deze gevallen is het beter om een representatieve steekproef te trekken om uitspraken te kunnen doen over de populatie.
Data verzamelen voor een steekproef
Als je populatie groot, geografisch verspreid of moeilijk te bereiken is, is het noodzakelijk om een steekproef te gebruiken. Door statistische analyses uit te voeren, kun je steekproefdata gebruiken om hypothesen over een gehele populatie te toetsen.
In de ideale situatie trek je een aselecte, representatieve steekproef. Aselecte steekproefmethoden (zoals een enkelvoudige aselecte steekproef) verkleinen het risico op sampling bias en dragen bij aan een hogere interne en externe validiteit.
Vaak is het praktischer om een selecte steekproefmethode te kiezen voor een (scriptie)onderzoek. Deze methoden zijn vaak goedkoper, minder tijdrovend en minder strict. Helaas gaan selecte steekproeven ook gepaard met minder sterke statistische claims en een verlaagde validiteit.
Redenen voor een steekproef
- Noodzaak: Soms is het niet mogelijk om de gehele populatie te onderzoeken vanwege de grootte of ontoegankelijkheid.
- Praktisch: Het is makkelijker en efficiënter om data te verzamelen voor een subset van de populatie (steekproef).
- Kosteneffectiviteit: Er zijn minder participanten en de kosten voor materialen, apparatuur en onderzoekers zijn lager.
- Beheersbaarheid: Het is makkelijker om statistische analyses uit te voeren met kleine datasets.
Populatieparameter vs steekproefstatistiek
Als je data verzamelt voor een populatie of steekproef, kun je diverse berekeningen uitvoeren op basis van de data. Een parameter is een maat die de gehele populatie beschrijft. Een statistiek is een maat die de steekproef beschrijft.
Op basis van de steekproefstatistiek kun je gefundeerde voorspellingen doen over de populatieparameter.
Sampling error
De sampling error is het verschil tussen een populatieparameter en een steekproefstatistiek. In het geval van je onderzoek naar politieke voorkeuren is de sampling error gelijk aan het verschil tussen de gemiddelde voorkeur van de hbo-studenten uit je steekproef en de gemiddelde voorkeur van alle hbo-studenten in Nederland.
Sampling errors komen ook voor als je een aselecte steekproefmethode gebruikt. Dit komt doordat ook aselecte steekproeven van de populatie verschillen met betrekking tot het gemiddelde en de standaarddeviatie.
Het doel van wetenschappelijk onderzoek is om de resultaten van de steekproef te kunnen generaliseren naar een grotere populatie. Daarom wil je ervoor zorgen dat de sampling error zo laag mogelijk is. Je kunt de sampling error verkleinen door een grotere steekproef te onderzoeken.
Veelgestelde vragen
- Waarom gebruik je een steekproef?
-
Om de volgende redenen kun je een steekproef gebruiken:
- als de omvang van de populatie te groot is om alle elementen te meten
- als snelheid gewenst is, waardoor niet de hele populatie onderzocht kan worden
- als het te kostbaar is om een groot aantal metingen uit te voeren
Deze drie redenen gelden eigenlijk altijd voor een scriptie, tenzij de onderzoekspopulatie heel klein is. Je steekproef dient ertoe geldende uitspraken te doen over de gehele onderzoeksgroep (aselecte steekproef) of de selectie die je hebt gemaakt (selecte steekproef).
- Wanneer gebruik je een steekproef?
-
Je gebruikt een steekproef uitsluitend wanneer je kwantitatief onderzoek verricht. Je kunt met een steekproef onderzoek doen naar allerlei onderwerpen, zowel personen, groepen, fenomenen als bestaande gegevens.
- Wanneer gebruik je geen steekproef?
-
Doorgaans gebruik je geen steekproef als je kwalitatief onderzoek verricht. Ook gebruik je nooit een steekproef als je onderzoekspopulatie zo klein is dat je simpelweg alle personen die hiertoe behoren kunt ondervragen. Dit is mede afhankelijk van je onderzoeksmethode.
- Wat is een enkelvoudige aselecte steekproef (simple random sampling)?
-
Een enkelvoudige aselecte steekproef (simple random sampling) is de eenvoudigste versie van een aselecte steekproef. De onderzoeker kiest willekeurig participanten uit een populatie om een steekproef te vormen. Ieder lid van de populatie heeft een even grote kans om in de steekproef te belanden. Vervolgens vindt de dataverzameling plaats.
Je kunt bijvoorbeeld willekeurig participanten kiezen door een random number generator te gebruiken.
- Wat is een geclusterde steekproef (cluster sampling)?
-
Geclusterde steekproeven vallen onder de aselecte steekproefmethoden. Je deelt een populatie op in clusters, zoals districten of scholen, en kiest dan willekeurig (aselect) enkele clusters om je steekproef te vormen.
In het ideale geval is ieder cluster een mini-versie van de populatie als geheel.
Citeer dit Scribbr-artikel
Als je naar deze bron wilt verwijzen, kun je de bronvermelding kopiëren of op “Citeer dit Scribbr-artikel” klikken om de bronvermelding automatisch toe te voegen aan onze gratis Bronnengenerator.