De p-waarde correct gebruiken

De p-waarde is een getal tussen 0 en 1, waarmee je bepaalt of  een steekproefuitkomst extreem is. Wanneer de p-waarde kleiner is dan het gekozen significantieniveau kun je stellen dat dat de gevonden uitkomst extreem genoeg is om je nulhypothese te verwerpen.

Hypothesen toetsen met de p-waarde

Voordat je de p-waarde kunt bepalen, moet je bepalen welke aanname je wilt verwerpen. Deze aanname heet de nulhypothese. De nulhypothese kan bijvoorbeeld zijn dat de gemiddelde lengte van Nederlandse mannen 181 cm is, of dat een coëfficiënt in een regressie 0 is. Bovendien kies je een significantieniveau ?, meestal is dat 0.05.

Tegenover de nulhypothese staat de alternatieve hypothese. Wanneer je de nulhypothese kunt verwerpen, is de alternatieve hypothese de conclusie die je trekt. De p-waarde is gedefinieerd als de kans dat in de verdeling die volgt uit de nulhypothese, de waarde van de steekproefuitkomst wordt behaald of overschreden. Als deze kans klein genoeg is (kleiner dan het significantieniveau), is de uitkomst extreem en kun je de nulhypothese verwerpen.

Voorbeeld hypothese toetsen
Een melkfabrikant produceert pakken melk met een inhoud van 1000 ml en wil verifiëren of een machine de pakken daadwerkelijk met 1000 ml vult. Hij besluit daarom een steekproef te nemen. Als het steekproefgemiddelde te ver afwijkt van 1000ml zal hij concluderen dat de machine anders afgesteld moet worden. Dit is het geval als de p-waarde kleiner is dan het significantieniveau.

Eenzijdig of tweezijdig toetsen en het verwerpingsgebied

Wanneer je eenzijdig toetst, ga je uit van een bestaand verschil, bijvoorbeeld dat Nederlandse mannen gemiddeld langer dan 181 cm zijn. Omdat je uitgaat van een positief verschil toets je rechtszijdig. Je verwerpt de nulhypothese als de steekproefuitkomst extreem hoog is. Als je wil testen of Nederlandse mannen gemiddeld korter dan 181cm zijn, toets je linkszijdig.

Toets je tweezijdig, dan verwerp je de nulhypothese als de steekproefuitkomst erg hoog of erg laag is. Het verwerpingsgebied bestaat dan uit twee delen en is dus twee keer zo hoog als wanneer je eenzijdig toetst.

Hoeveel fouten bevat jouw scriptie?

De taalexperts van Scribbr verbeteren gemiddeld 150 fouten per 1000 woorden. Benieuwd wat er precies wordt verbeterd? Verschuif de cursor van links naar rechts!

Scriptie nakijken op taal

Wanneer gebruik je de p-waarde?

De p-waarde komt van pas bij iedere statistische toets, zoals bijvoorbeeld de t-toets. De p-waarde wordt daarnaast veel gebruikt bij het doen van regressieanalyses. De p-waarde komt ook goed van pas bij het beantwoorden van kleine, praktische onderzoeksvragen.

P-waarde interpreteren in SPSS en Excel

Omdat de p-waarde in veel verschillende situaties gebruikt kan worden, is er geen standaard stappenplan voor het bepalen van de p-waarde. Het interpreteren ervan is echter wel in iedere situatie hetzelfde. Hieronder bespreken we twee voorbeelden, aan de hand van output in SPSS en Excel.

In SPSS kun je eenvoudig toetsen of het waarschijnlijk is dat het gemiddelde van een set gegevens gelijk is aan een bepaalde waarde. In de tabellen hieronder zie je de output van een t-toets. Er wordt onderzocht of de lengte van Nederlandse mannen 181 cm is. De eerste tabel geeft de beschrijvende statistieken. Zo zie je dat er 1000 waarnemingen zijn en dat de gemiddelde lengte 180,47 cm is. In de tweede tabel volgt het resultaat van de toets. In de kolom “Sig. (2-tailed)” zien we de p-waarde die hoort bij een tweezijdige toets. Als we uitgaan van een significantieniveau van 0.05 is er geen aanleiding om de nulhypothese te verwerpen, want 0.147 > 0.05. Op basis van deze toets is het dus waarschijnlijk dat de gemiddelde lengte van Nederlandse mannen 181 cm is.spss p-waardeIn SPSS moet je altijd opletten wanneer je eenzijdig wilt toetsen. In dat geval moet je de waarde in de kolom “Sig. (2-tailed)” halveren voordat je gaat vergelijken met je significantieniveau. Wanneer de t-waarde positief is, toets je rechtszijdig. Is de t-waarde negatief? Dan toets je linkszijdig.
Ook in Excel kun je veel verschillende toetsen doen. In de tabel hieronder zie je de output van een t-toets, waarin getoetst wordt of het verschil in lengte tussen Nederlandse mannen en vrouwen gelijk is aan 11,5 centimeter.In tegenstelling tot SPSS, geeft Excel zoals je kunt zien wel de p-waarde voor zowel eenzijdige als tweezijdige toetsen. We kiezen wederom een significantieniveau van 0.05 kiezen.Bij een tweezijdige toets (het verschil is ongelijk aan 11,5 cm) kunnen we de nulhypothese niet verwerpen, want 0.076 > 0.05.Bij een eenzijdige toets (het verschil is groter dan 11,5 cm) kunnen we de nulhypothese wel verwerpen (want 0.038 < 0.05). Omdat de t-waarde positief is, toetsen we rechtszijdig.p-waarde excel

.

Foute interpretaties van de p-waarde

P-waarden worden vaak verkeerd gebruikt of geïnterpreteerd. Hieronder vind je een aantal veel voorkomende misvattingen.

Als de p-waarde kleiner is dan het significantieniveau (bijvoorbeeld 0.02 bij een significantieniveau van 0.05):

  • Er is bewijs gevonden dat de nulhypothese verworpen kan worden.
    Bewijs is er niet gevonden, wel is er voldoende aanleiding gevonden om de nulhypothese in twijfel te trekken.
  • De kans dat de nulhypothese klopt is 0.02.
    0.02 is de kans op de steekproefuitkomst gegeven de nulhypothese, niet andersom.
  • De p-waarde van de kans dat de nulhypothese onterecht verworpen wordt, is 0.02 (= 1 – 0.98).
    De nulhypothese is simpelweg waar of niet waar, je berekent geen kans die betrekking heeft op de nulhypothese (zie het voorbeeld hierboven).

Als de p-waarde groter is dan het significantieniveau:

  • Er is voldoende aanleiding om aan te nemen dat de nulhypothese klopt.
    Je kunt alleen laten zien dat de steekproefuitkomst wel/niet extreem is gegeven de nulhypothese. Is de uitkomst te extreem, dan concludeer je dat de alternatieve hypothese logischer is. Je vindt echter nooit aanleiding om de nulhypothese te concluderen.
Wat vind jij van dit artikel?
FBSB

FBSB verzorgt studiebegeleiding van het allerhoogste niveau in wiskunde, statistiek, econometrie en finance.

1 reactie

FBSB
FBSB (Scribbr Team)
17 december 2020 om 16:39

Ik hoop dat dit artikel je heeft geholpen. Is er nog iets onduidelijk? Ik doe mijn best om vragen en opmerkingen te beantwoorden. :)

Is er iets nog niet helemaal duidelijk of ontbreekt er wat? Laat een opmerking achter.

Please click the checkbox on the left to verify that you are a not a bot.