Inhoudsvaliditeit (Content Validity) | Betekenis & Voorbeelden

Inhoudsvaliditeit (content validity) evalueert in welke mate een meetinstrument alle relevante aspecten van het te meten construct dekt. Dit type validiteit meet of een onderzoeksinstrument volledig representatief is voor het te meten construct.

Een construct is hier een theoretisch concept, begrip, thema of idee. Het is meestal een concept dat niet direct kan worden gemeten.

Voorbeeld: Inhoudsvaliditeit
Een schriftelijk examen toetst of de participanten over voldoende theoretische kennis beschikken om een rijbewijs te halen. Het examen heeft een hoge inhoudsvaliditeit als de gestelde vragen elk mogelijk onderwerp in de cursus met betrekking tot verkeersregels behandelen. Tegelijkertijd moet het examen ook alle andere vragen uitsluiten die niet relevant zijn om je rijbewijs te halen.
Soorten validiteit
Inhoudsvaliditeit is één van de vier soorten validiteit die van belang zijn voor meetinstrumenten. De overige drie zijn:

  • Constructvaliditeit (construct validity): Meet het onderzoeksinstrument daadwerkelijk het begrip dat het moet meten?
  • Indruksvaliditeit (face validity): Lijkt de inhoud van het meetinstrument geschikt (relevant) voor je onderzoeksdoel?
  • Criteriumvaliditeit (criterion validity): Komen de resultaten van jouw onderzoeksinstrument overeen met die van andere, gevalideerde instrumenten?

Constructvaliditeit en inhoudsvaliditeit vormen samen de betekenisvaliditeit.

Als je experimenteel onderzoek doet, moet je verder ook rekening houden met de interne validiteit (de mate van zekerheid dat er een causaal verband bestaat) en de externe validiteit (de generaliseerbaarheid van de resultaten).

Voorbeelden inhoudsvaliditeit

Sommige constructen zijn direct waarneembaar of tastbaar, en dus gemakkelijker te meten. Lengte wordt bijvoorbeeld gemeten in centimeters of meters. Andere constructen zijn moeilijker te meten. Depressie bestaat bijvoorbeeld uit verschillende dimensies en kan niet rechtstreeks worden gemeten.

Voorbeeld: Inhoudsvaliditeit in psychologie
Bij psychologisch onderzoek worden vaak screeningsinstrumenten ontwikkeld om meetwaarden voor klinische diagnoses vast te stellen.

Stel dat je een schaal wilt ontwikkelen om klinische gevallen van depressie te meten.

Bij de ontwikkeling van een depressieschaal moeten onderzoekers vaststellen of de schaal alle dimensies van het construct “depressie” omvat, of slechts delen ervan. Als een voorgestelde depressieschaal bijvoorbeeld alleen de gedragsaspecten van depressie omvat, en niet de affectieve, heeft de schaal geen hoge  inhoudsvaliditeit.

Om inhoudsvaliditeit te bereiken, moet er ook een bepaalde mate van algemene overeenstemming bestaan (bijvoorbeeld tussen experts) over wat een construct vertegenwoordigt.

Voorbeeld: Inhoudsvaliditeit in IQ-tests
Hoewel IQ-tests al tientallen jaren worden gebruikt om intelligentie te beoordelen, wordt er vaak kritiek geleverd omdat ze geen rekening houden met de complexe aard van het menselijke intellect.

Onderzoek heeft aangetoond dat er ten minste drie verschillende componenten zijn waaruit intelligentie bestaat: kortetermijngeheugen, redeneren en een verbale component.

Dit betekent dat de bestaande IQ-tests niet alle dimensies van de menselijke intelligentie omvatten. Om alle drie dimensies te toetsen, zijn er drie onafhankelijke tests nodig. Daarom wordt er van IQ-tests vaak gedacht dat ze een lage inhoudsvaliditeit hebben.

Constructvaliditeit vs inhoudsvaliditeit

Constructvaliditeit (ook wel begripsvaliditeit genoemd) en inhoudsvaliditeit worden vaak door elkaar gehaald, maar het zijn fundamenteel verschillende concepten.

Constructvaliditeit (construct validity) geeft aan in welke mate een onderzoeksinstrument het construct meet dat het moet meten (en niet per ongeluk een ander construct). De constructvaliditeit van een instrument kan in gevaar komen als:

  • Aspecten van het construct ontbreken die wel in verwante tests over hetzelfde construct worden meegenomen;
  • Irrelevante aspecten zijn toegevoegd die in tests voor ongerelateerde constructen worden gemeten.

Om constructvaliditeit vast te stellen moet je zowel convergente als discriminante validiteit kunnen aantonen.

  • Convergente validiteit laat zien of een test die ontworpen is om een bepaald construct te meten, correleert met andere tests die hetzelfde construct meten.
  • Discriminante validiteit laat zien of twee tests die niet sterk aan elkaar gerelateerd zouden moeten zijn, dat ook daadwerkelijk niet zijn. Er zou geen tot een zwakke correlatie moeten zijn tussen de scores van de twee tests die twee verschillende constructen meten.

Inhoudsvaliditeit is daarentegen van toepassing op iedere context waarin je een test of enquête maakt voor een construct en waarbij je er zeker van wilt zijn dat de vragen volledig representatief zijn voor het te meten construct.

Constructvaliditeit is dus een overkoepelende soort validiteit die betrekking heeft op het construct zelf in relatie tot andere constructen, terwijl inhoudsvaliditeit inzoomt op de te meten aspecten van het construct.

Voorbeeld: Constructvaliditeit vs inhoudsvaliditeit
Stel dat je de gezondheidsbehoeften van een gemeenschap onderzoekt met behulp van een enquête.

  • Hoge inhoudsvaliditeit: Als je enquêtevragen alle dimensies van gezondheidsbehoeften behandelen (i.e., fysiek, mentaal, sociaal en milieu), dan heeft je vragenlijst een hoge inhoudsvaliditeit.
  • Lage inhoudsvaliditeit: Als sommige dimensies van de gezondheidsbehoeften worden weggelaten, dan geven de resultaten mogelijk geen nauwkeurige indicatie van de gezondheidsbehoeften van de gemeenschap.
  • Hoge constructvaliditeit: Als de antwoorden op je enquêtevragen correleren met de antwoorden op bestaande enquêtes over gezondheidsbehoeften (i.e., hoge convergente validiteit), dan heeft je meting een hoge constructvaliditeit.
  • Lage constructvaliditeit: Als de meeste van je enquêtevragen sterk correleren met bestaande metingen over de houding van de studiepopulatie tegenover de gezondheidsdiensten die hen wordt aangeboden (i.e., lage discriminante validiteit), dan zijn de resultaten waarschijnlijk niet langer een geldige meting van de gezondheidsbehoeften van de gemeenschap.

Ontvang feedback op taal, structuur, lay-out en bronvermelding

Professionele Scribbr-editors kijken je scriptie na op:

  • Academisch taalgebruik
  • Onduidelijke zinnen
  • Grammaticale fouten
  • Interpunctie
  • Verboden woorden

Bekijk het voorbeeld

Hoe meet je de inhoudsvaliditeit: Stappenplan

Het correct meten van de inhoudsvaliditeit is belangrijk. Een hoge inhoudsvaliditeitsscore geeft aan dat het construct nauwkeurig is gemeten. Je kunt de inhoudsvaliditeit van je onderzoek meten aan de hand van onderstaand stappenplan:

  1. Stap 1: Verzamel data van experts
  2. Stap 2: Bereken de content validity ratio (CVR)
  3. Stap 3: Bereken de content validity index (CVI)

Stap 1: Verzamel data van experts

Voor het meten van de inhoudsvaliditeit heb je de input nodig van een beoordelingspanel bestaande uit experts. Deze deskundigen zijn mensen die in de beste positie verkeren om de inhoud van je toets te beoordelen.

Het panel van experts voor bijvoorbeeld een toets wiskunde op school zou bestaan uit gekwalificeerde wiskundedocenten die het vak doceren.

Voor elke afzonderlijke vraag van de toets dient het panel te beoordelen of de door de vraag gemeten dimensie “essentieel”, “nuttig, maar niet essentieel” of “niet noodzakelijk” is voor het meten van het construct.

Hoe groter de overeenstemming tussen de panelleden dat een vraag essentieel is, hoe hoger het niveau van inhoudsvaliditeit.

Let op
Als student heb je mogelijk geen toegang tot een panel van experts. Of misschien schrijf je je proefschrift en vindt je panelbeoordeling plaats tijdens je verdediging. In zulke gevallen kun je mogelijk een panel bestaande uit peers gebruiken. Zorg er wel voor dat je dit in je paper vermeldt.

Stap 2: Bereken de content validity ratio (CVR)

Daarna kun je de volgende formule gebruiken om de inhoudsvaliditeitsratio (content validity ratio, CVR) voor elke vraag te berekenen:

CVR = (ne – N/2) / (N/2)

Waarbij:

  • ne = aantal panelleden dat “essentieel” aangaf voor de desbetreffende vraag
  • N = totaal aantal panelleden
Voorbeeld: CVR berekenen
Stel dat je een panel van vijf experts vraagt een diagnostische test van zeven vragen te evalueren. De eerste vraag wordt door vier experts beoordeeld als “essentieel”.

De inhoudsvaliditeitsratio (CVR) voor de eerste vraag kun je als volgt berekenen:

CVR = (ne – N/2) / (N/2) = (4 – 5/2) / (5/2) = 0.6

InhoudsvaliditeitLet op: Een groen vinkje betekent dat de expert de vraag als “essentieel” heeft bestempeld.

Met dezelfde formule kun je zo ook de CVR voor de andere vragen berekenen.

De formule levert waarden op die variëren van +1 tot -1. Waarden boven de 0 geven aan dat ten minste de helft van de experts de vraag als essentieel beschouwt. Hoe dichter de waarde bij de +1  ligt, hoe hoger de inhoudsvaliditeit is.

Overeenstemming tussen de experts kan echter ook te wijten zijn aan toeval. Om dat uit te sluiten, kun je onderstaande tabel met kritieke waarden gebruiken. Afhankelijk van het aantal experts in je panel, mag de content validity ratio (CVR) voor een vraag niet onder een minimumwaarde komen. Dit wordt ook wel de kritieke waarde genoemd.

# Experts in panel Kritieke waarden
5 0.99
6 0.99
7 0.99
8 0.75
9 0.78
10 0.62
11 0.59
12 0.56
20 0.42
30 0.33
40 0.29

Stap 3: Bereken de content validity index (CVI)

Om vervolgens de inhoudsvaliditeit van de complete vragenlijst te kunnen meten, moet je de inhoudsvaliditeitsindex (content validity index, CVI) berekenen. De CVI is de gemiddelde CVR-score van alle vragen in de test. Vergeet niet dat waarden dichter bij de 1 aangeven dat er een hogere inhoudsvaliditeit is.

Om de content validity index (CVI) van de hele test te berekenen, neem je het gemiddelde van alle CVR-scores. In ons voorbeeld zou dat zijn:

CVI =  (0.6 + 0.2 − 0.2 + 0.2 − 0.2 + 0.6 + 1) / 7 = 0.31

Als je de CVI vergelijkt met de kritieke waarde voor een panel van vijf experts, merk je dat de CVI te laag is (0.31 < 0.99). Dit betekent dat de test niet volledig meet wat deze beoogt te meten. Je besluit de vragen met een lage CVR te verbeteren om een hogere CVI te krijgen.

Veelgestelde vragen over inhoudsvaliditeit

Wat is het verschil tussen inhoudsvaliditeit en constructvaliditeit?

Constructvaliditeit (ook wel begripsvaliditeit genoemd) geeft aan in welke mate je onderzoeksinstrument het concept meet dat het moet meten (en niet per ongeluk een ander concept).

Inhoudsvaliditeit (content validity) is de mate waarin de aspecten van het te meten begrip volledig worden gemeten met je onderzoeksinstrument. Hierbij gaat het erom in hoeverre alle aspecten van het begrip “gedekt” worden.

Constructvaliditeit is dus een overkoepelende soort validiteit die betrekking heeft op het construct zelf in relatie tot andere constructen, terwijl inhoudsvaliditeit inzoomt op de te meten aspecten van het construct.

Waarom is inhoudsvaliditeit belangrijk?

Inhoudsvaliditeit (content validity) laat zien hoe nauwkeurig een test de verschillende aspecten van het te meten construct meet.

Met andere woorden, dit type validiteit draagt bij aan de beantwoording van de volgende vraag:  “Meet de test alle aspecten van het construct dat ik wil meten?” Zo ja, dan heeft de test een hoge inhoudsvaliditeit.

Hoe hoger de inhoudsvaliditeit, hoe nauwkeuriger de meting van het construct.

Als de test de aspecten van het construct niet volledig meet, of irrelevante delen meet, wordt de validiteit van het meetinstrument bedreigd, waardoor je resultaten in twijfel kunnen worden getrokken.

In welke opzichten zijn inhoudsvaliditeit en indruksvaliditeit vergelijkbaar?

Indruksvaliditeit (face validity) en inhoudsvaliditeit (content validity) lijken in zoverre op elkaar dat ze beide beoordelen hoe geschikt de inhoud van een meetinstrument is. Het verschil is dat de indruksvaliditeit (“validiteit op het eerste gezicht”) subjectief is, en de inhoud aan de oppervlakte beoordeelt, terwijl de inhoudsvaliditeit systematischer is.

Als een toets een sterke indruksvaliditeit heeft, zal iedereen het ermee eens zijn dat de vragen van de toets aan de oppervlakte lijken te meten wat ze beogen te meten.

Als je bijvoorbeeld onderzoek doet naar een wiskundetoets voor groep 8 die bestaat uit problemen waarbij leerlingen moeten optellen en vermenigvuldigen, zullen de meeste mensen het ermee eens zijn dat de toets een sterke indruksvaliditeit heeft (i.e., op het eerste gezicht komt de toets over als een valide toets).

Inhoudsvaliditeit, daarentegen, beoordeelt in welke mate een toets alle aspecten van een te meten construct meet. Het beoordelen van de inhoudsvaliditeit is systematischer en berust op evaluatie van elke vraag door experts, waarbij geanalyseerd wordt of elke vraag de aspecten dekt waarvoor de toets is ontworpen.

Een wiskundetoets voor groep 8 zou een hoge inhoudsvaliditeit hebben als de toets alle vaardigheden behandelt die in de klas zijn onderwezen. Experts (in dit geval wiskundeleraren) moeten de inhoudsvaliditeit beoordelen door de toets te vergelijken met de vooropgezette leerdoelen.

Citeer dit Scribbr-artikel

Als je naar deze bron wilt verwijzen, kun je de bronvermelding kopiëren of op “Citeer dit Scribbr-artikel” klikken om de bronvermelding automatisch toe te voegen aan onze gratis Bronnengenerator.

Scharwächter, V. (2022, 06 oktober). Inhoudsvaliditeit (Content Validity) | Betekenis & Voorbeelden. Scribbr. Geraadpleegd op 31 januari 2023, van https://www.scribbr.nl/onderzoeksmethoden/inhoudsvaliditeit/

Wat vind jij van dit artikel?
Veronique Scharwächter

Veronique heeft twee bachelors: één in Taal- en Cultuurstudies en één in Philosophy, Politics and Economics. Daarnaast heeft zij een boek geschreven over hoe filosofie je kan helpen in je studentenleven. Ze hoopt haar brede, interdisciplinaire kennis in te kunnen zetten om zo veel mogelijk studenten te helpen met het schrijven van hun scriptie.