Regressieanalyse uitvoeren en interpreteren

Regressieanalyse wordt gebruikt om het effect te bepalen van een (of meerdere) verklarende variabele(n), zoals lengte of leeftijd, op een afhankelijke variabele zoals gewicht.

Je kunt regressieanalyse gebruiken om:

 1. Samenhang tussen twee variabelen bepalen (leeftijd en waarde van een auto)
 2. Verandering van de afhankelijke variabele voorspellen (waarde van een auto naarmate deze ouder wordt)
 3. Toekomstige waarde voorspellen (waarde van een zes jaar oude auto)

Soorten regressieanalyse

Er bestaan meerdere soorten regressieanalyses, namelijk:

Welke soort je gebruikt hangt af van het aantal variabelen dat je wilt testen en het meetniveau (nominaal, ordinaal, interval of ratio) waarop deze variabelen gemeten zijn. In dit artikel behandelen we alleen lineaire enkelvoudige en meervoudige regressie.

Deze soorten regressie kun je gebruiken voor één of meerdere verklarende variabelen en een afhankelijke variabele op interval of rationiveau.

Enkelvoudige regressie

Wanneer je slechts het effect van één verklarende (of onafhankelijke) variabele op een afhankelijke variabele wilt testen dan gebruik je enkelvoudige regressie.

Voorbeeld: Je wilt aan de hand van lengte (verklarende variabele X) iemands gewicht (afhankelijke variabele Y) voorspellen of verklaren.

Een enkelvoudige regressie kan worden uitgedrukt met de volgende vergelijking:

Y = α + βX + u

Deze vergelijking bestaat uit drie elementen:

 1. Intercept (α) is het startpunt van de regressielijn; de zogenaamde ‘constante’. Dit betekent dat zelfs als de lengte 0 cm is, er nog wel een bepaald basisgewicht is.
 2. Regressiecoëfficiënt (β) geeft de gemiddelde toename in Y (gewicht) aan wanneer de verklarende variabele X (lengte) met 1 (centimeter) toeneemt.
 3. Foutterm (u) ofwel de storingsterm. Dit is het deel van de afhankelijke variabele dat niet verklaard kan worden door de verklarende variabele.

Lees waarom zo veel studenten Scribbr inschakelen

Ontdek nakijken op taal

Meervoudige regressie

Meervoudige of multipele regressie is een uitbreiding van de enkelvoudige regressie waarbij twee of meer verklarende variabelen worden gebruikt om de afhankelijke variabele (Y) te voorspellen of verklaren.

Voorbeeld: Je wilt naast lengte ook geslacht gebruiken om iemands gewicht te voorspellen. In dit geval voeg je geslacht als tweede variabele X2 toe.

De regressievergelijking ziet er nu als volgt uit:

Υ = α + β1X+ β2X+ u

Het enige verschil in deze vergelijking ten opzichte van de enkelvoudige regressie is dat er een tweede regressiecoëfficiënt (β) is toegevoegd voor de verklarende variabele ‘geslacht’.

Assumpties regressieanalyse

Om door middel van lineaire regressie tot een goede schatting van de regressiecoëfficiënten te komen, moet de data aan enkele voorwaarden voldoen.

 • De relatie tussen de verklarende en afhankelijke variabelen is lineair
 • De data zijn verkregen uit een willekeurige steekproef van de populatie
 • De verklarende variabelen die je opneemt in de regressie hebben geen lineair verband
 • Exogeniteit: de verwachte foutterm is nul
 • Homoscedasticiteit: de variantie van de foutterm is gelijk voor alle waarden van de verklarende variabele.

Regressieanalyse uitvoeren met SPSS of Excel

Om een regressieanalyse uit te voeren kun je gebruikmaken van programma’s zoals SPSS en Excel. Met uitleg en een GIF lopen we door de stappen heen. Gebruik de tabs om te navigeren tussen de uitleg voor SPSS en Excel.

Regressieanalyse met SPSS

Download het SPSS-bestand om met de data uit het voorbeeld te oefenen.

Klik je in de menubalk van SPSS op:

 • Analyze
 • Regression
 • Linear

Er verschijnt een scherm waarin je onder Dependent: de afhankelijke variabele ‘gewicht’ selecteert. Bij Independent(s) selecteer je de verklarende variabele ‘lengte’ en eventuele controlevariabelen. Klik vervolgens op OK om de analyse uit te voeren.

Regressieanalyse SPSS

Regressieanalyse met Excel

Download het Excel-bestand om met de data uit het voorbeeld te oefenen.

Voordat je een regressieanalyse kunt uitvoeren met Excel, moet je eerst het “Analysis ToolPak” toevoegen in Excel. Je kunt dit vinden bij ‘add-ins’.

Door op de knop ‘Data Analysis’ te klikken, verschijnt een nieuw scherm met ‘Analysis Tools’, waarin je Regression selecteert en op OK klikt.

Selecteer bij ‘Input Y Range’ de gegevens van afhankelijke variabele (gewicht), inclusief de naam van de kolom. Bij ‘Input X Range’ selecteer je de data in de kolom van lengte. Klik ‘Labels’ aan om aan te geven dat de bovenste cel de naam van de variabele is.

Voor meervoudige regressie selecteer je bij ‘Input X Range’ de data in kolommen lengte en leeftijd.

Regressieanalyse Excel

Regressieanalyse interpreteren

De output van een regressieanalyse bestaat uit drie onderdelen, namelijk de ‘model summary’, ‘ANOVA’ en ‘Coefficients’. Voor dit voorbeeld hebben we de SPSS-output genomen, maar deze lijkt erg op die van Excel.

Model summary

Het eerste blok, model summary, vermeldt de correlatiecoëfficiënt R en de determinatiecoëfficiënt R2 . De correlatiecoëfficiënt is in dit voorbeeld zeer hoog, namelijk ,909.

De ‘R Squared’ geeft aan hoeveel van de variantie in de afhankelijke variabele (gewicht) verklaard wordt door de verklarende variabelen.

De R Squared heeft altijd een waarde tussen 0 en 1 waarbij 1 het best mogelijke model aangeeft waarbij alle variantie in de afhankelijke variabele verklaard wordt. In dit voorbeeld verklaart de variabele ‘lengte’ voor 82,6% iemands gewicht.

Als je een meervoudige regressie uitvoert kijk je naar de ‘Adjusted R Square’ in plaats van ‘R Square’ omdat meer verklarende variabelen altijd meer van de variantie kunnen verklaren. De adjusted R2 corrigeert hiervoor.

Anova regressieanalyse

Het tweede blok, ANOVA, toetst de significantie van het regressiemodel. Dat laat zien hoe groot de kans is dat alle regressiecoëfficiënten in werkelijkheid nul zijn en de uitkomsten van deze analyse dus op toeval berusten.

Hiervoor wordt een F-toets uitgevoerd met vrijheidsgraden 1 (het aantal verklarende variabelen) en 28 (het aantal observaties minus het aantal verklarende variabelen minus één).

De kans om een waarde van 132,863 of groter te observeren met deze vrijheidsgraden is kleiner dan .001, zoals af te lezen in de ‘Sig.’-kolom. Daarom kunnen we concluderen dat dit regressiemodel significante verklarende variabelen bevat.

Regressiecoefficient

De ‘coefficients’-tabel geeft informatie over de grootte, de aard (plus of minus) en de significantie van het effect van de verklarende variabelen op de afhankelijke variabele.

De regressielijn volgt de vergelijking Gewicht  =  -103,007 + 0,996 * Lengte. Het geschatte gemiddelde effect van een toename van één centimeter in lengte is dus 996 gram.

Om te testen of dit effect significant is, wordt er een t-toets uitgevoerd. De kans om een waarde van 11,527 of groter te observeren is kleiner dan .0001, zoals af te lezen in de ‘Sig.’-kolom. Daarom is dit effect significant.

Voorbeeld: Een man van 180 cm lang wordt geschat op 76,27 kg.: -103,007 + 0,996 * 180 = 76,27 kg.

Bij meervoudige regressie is de regressiecoëfficiënt de gemiddelde toename van de afhankelijke variabele, terwijl de andere verklarende variabelen gelijk blijven.

Regressie rapporteren

De uitkomsten van de regressieanalyse rapporteer je in het resultatenhoofdstuk van je scriptie. Je rapporteert in ieder geval:

 • De verklaarde variantie van je regressiemodel (R2 of R Squared)
 • De F-waarde en de significantie van je regressiemodel
 • De regressiecoëfficiënt en zijn significantie

Je kunt een van de volgende zinnen gebruiken:

Een enkelvoudige regressie met gewicht als afhankelijke variabele en lengte als verklarende variabele is significant, (1.28) = 132.86, p  < .001.

82,6% van de variantie in gewicht kon worden verklaard met lengte. De regressiecoëfficiënt van lengte was 0.996 en significant ((28) = 11.53; p < .001).

Lengte is een significante voorspeller van gewicht. De voorspelde toename in gewicht is 996 gram per centimeter (β = 0.996; (28) = 11.53; < .001). Lengte verklaart ook een significant deel van de variantie in gewicht (R= .826; (1.28) = 132.86; p < .001).

Voor het rapporteren van statistische resultaten heeft de APA-stijl verschillende richtlijnen opgesteld. Zo weet je precies wanneer je symbolen of variabelen cursief, vet of romein schrijft en met hoeveel decimalen je de significantie rapporteert.

Wat vind jij van dit artikel?
Lars van Heijst

Lars schrijft artikelen over statistiek. Hij heeft psychologie en economie gestudeerd en is dus goed op de hoogte van de vele statistiek die binnen deze disciplines wordt gebruikt.

12 reacties

Lenneke
29 september 2020 om 13:31

Hoi!

Ondanks dat het hierboven niet behandeld wordt (of mede daardoor), heb ik 2 vraagjes over logistische regressie. Kan je bij multipele logistische regressie ook de kans op een gebeurtenis berekenen als een van de of meerdere onafhankelijke variabelen van toepassing zijn? Of is een logistische regressie altijd een optelsom van de variabelen in het model? In mijn geval: kan ik in 1 model de kans berekenen op een fatale afloop van geweld (afhankelijke variabele) als het motief jaloezie (onafhankelijke variabele 1) en/of scheiding (onafhankelijke variabele 1) en/of ruzie (onafhankelijke variabele 3) is? Of moet ik alle mogelijke rijtjes los berekenen en bij elkaar optellen?

En de tweede vraag: als een van de variabelen uit je model niet significant is, neem je die dan wel mee in de berekening van de logit en de kans, of moet je die eruit laten? In 'basishandboek voor spss' wordt een niet-significante variabele gewoon meegenomen, maar dan is de hele kans toch niet significant uiteindelijk?

Hopelijk kunnen jullie me verder helpen want de rest van het internet stelt helaas teleur!

Groet,
Lenneke

Beantwoorden

Leon Smits
Leon Smits (Scribbr Team)
30 september 2020 om 17:41

Hoi Lenneke,

Ik moet je helaas teleurstellen, ook ik weet het antwoord op je vragen niet, maar misschien kan een andere bezoeker van deze pagina je verder helpen.
Ik hoop dat je anders bij je begeleider terecht kan!

Groetjes,
Leon

Beantwoorden

Jamie
10 juni 2020 om 15:11

Hoi! Ik heb een vraagje omtrent mijn analyse.
Ik probeer de relatie te bekijken tussen Sense of belonging (SOB) en Attachment.
Sense of belonging bestaat uit 2 variabelen: SOBI-A en SOBI-P.
Attachment bestaat uit 6 variabelen: PASQ_Secure, PASQ_Secure/Ambivalent, PASQ_Secure/Avoidant, PASQ_Ambivalent, PASQ_Avoidant, PASQ_Disorganized.

Ik heb zojuist van alle 6 en 2 variabelen de MEAN ratings berekend. Nu wilde ik de relatie bekijken tussen SOB en Attachment voor alle subschalen, alleen ik ben nu in de war hoe ik dit nu precies moet uitvoeren. Ik heb namelijk al wat dingen geprobeerd, maar dan klopt mijn output niet meer :( Zou jij mij misschien kunnen helpen/begeleiden hierin?

Ik heb eigenlijk verschillende vragen en weet niet of het mogelijk is om eventueel begeleiding te krijgen uberhaubt bij mijn analyse (betaald of zo via de opmerkingen)? Ik hoor graag van je! ( mijn begeleider is op vakantie gegaan :( ).

Beantwoorden

Leon Smits
Leon Smits (Scribbr Team)
10 juni 2020 om 15:19

Hoi Jamie,

Dat is wel een erg specifieke vraag! Ik durf het antwoord hierop niet te geven.
Helaas bieden we bij Scribbr ook geen begeleiding aan. Misschien zou onze partner FBSB je hiermee kunnen helpen, zij zijn gespecialiseerd in statistiek!

Succes!

Groetjes,
Leon

Beantwoorden

Jamie
24 juni 2020 om 00:33

Beste Leon, bedankt voor je reactie, ik heb jullie partner benaderd :)

Beantwoorden

Kim
3 juni 2020 om 16:28

Goedendag,

Graag wil ik in mijn scriptie ook de R squared change en F change vermelden. Hoe doe ik dat volgens de APA notatie? Ik kan het nergens in de handleiding vinden...

Alvast bedankt en met vriendelijke groet,
Kim

Beantwoorden

Piek
21 mei 2020 om 13:41

Hi,

Ik heb een vraag over de assumpties voor een regressieanalyse. Ik heb 3 hypotheses. Bij de ene gebruik ik de totale sample en bij de andere een gedeelte daarvan. Moet ik dan voor iedere hypothese kijken of er aan de regressievoorwaarden zijn voldaan of doe je dat alleen bij de totale sample?

Bedankt!

Beantwoorden

Leon Smits
Leon Smits (Scribbr Team)
22 mei 2020 om 17:34

Hoi Piek,

Ja, als je voor een bepaalde hypothese slechts een deel van je sample gebruikt (dat is dus eigenlijk gewoon een andere sample), moet deze ook aan alle voorwaarden voldoen.
Dit geldt natuurlijk wel alleen als je voor de betreffende hypothese ook een regressieanalyse wilt doen.

Groetjes,
Leon

Beantwoorden

Teun
16 mei 2020 om 16:40

Hoi Scribbr,

Duidelijk artikel, wellicht nog interessant om op de methode in te gaan. Vandaar mijn vragen.

Hoe kies je de juiste methode "enter, stepwise, forward en backward"? Of gewoon allemaal draaien en kijken bij welke methode het model het meest verklaard? Maar hoe beargumenteer je dan waarom je voor die methode hebt gekozen?

Groet Teun

Beantwoorden

Leon Smits
Leon Smits (Scribbr Team)
18 mei 2020 om 16:02

Hoi Teun,

Dank voor je vraag! Om eerlijk te zijn wist ik hier niet direct een antwoord op.
Echter, de "enter" methode lijkt het meest gangbaar (en valide) te zijn voor een regressieanalyse, mijn advies is dus om hiervoor te kiezen.
Je kunt deze uitleg van IBM nog even bekijken voor wat meer toelichting over de methodes.

Succes!

Groetjes,
Leon

Beantwoorden

Lotte
6 mei 2020 om 13:31

Ik heb een vraag over de mediatie analyse (en of regressie) waarbij gebruik wordt gemaakt van bootstrap. In de statistieken die je krijgt, worden geen gestandaardiseerde waarden weergeven. Ik rapporteer daarom de B de SE en de significantie. Nu heb ik als feedback teruggekregen dat ik de statistiek van het hele model ook moet rapporteren... normaal logisch ware het niet dat:

- Bij de F/t geen rekening wordt gehouden met bootstrap terwijl ik dit heel bewust heb gekozen

- deze statistieken uitgaan van normaalverdeling

- in heel veel wetenschappelijke artikelen wordt de t/f bij bootstrap dan ook niet gerapporteerd

- hoe pak ik dit het beste aan!?

Ik hoop dat mijn vraag duidelijk is. op internet is er bizar weinig te vinden over dit specifieke dilemma, want ik wil niet onrelevante statstieken rapporteren maar mij wel netjes houden aan de regels...

Beantwoorden

Leon Smits
Leon Smits (Scribbr Team)
6 mei 2020 om 16:16

Hoi Lotte,

Goede vraag! Helaas kan ik je hier geen eenduidig antwoord op geven. Slechts wat advies:
- Als je op basis van die andere artikelen kan aanduiden dat jouw methode vaker gebruikt wordt helpt dat
- Overleg heel goed met je begeleider en leg uit waarom je hebt gekozen om het op jouw manier te doen. Als je het onderwerp al hebt besproken loop je niet het risico dat het achteraf toch wordt afgekeurd.
- Mocht er uit het overleg komen dat je toch uitgebreider moet rapporteren, doe dat dan gewoon, je schrijft dan weliswaar irrelevante statistieken op, maar dan is het voor je beoordeling in ieder geval in orde.

Succes!

Groetjes,
Leon

Beantwoorden

Is er iets nog niet helemaal duidelijk of ontbreekt er wat? Laat een opmerking achter.

Please click the checkbox on the left to verify that you are a not a bot.