Covariantie | Formule, Interpretatie & Berekening

Covariantie (covariance) is een maat voor spreiding van twee variabelen die weergeeft in welke mate twee variabelen met elkaar samenhangen. Covariantie geeft aan of en in welke richting de variabelen elkaar beïnvloeden.

Waarde Uitleg Voorbeeld
Positief
(> 0)
  • Er is een positieve relatie tussen de twee variabelen.
  • Als de ene variabele toeneemt, neemt de andere variabele ook toe (en vice versa).
  • Als de lengte van een baby toeneemt, neemt het gewicht ook toe.
  • Als het aantal trainingsuren van een voetballer afneemt, neemt het aantal doelpunten ook af.
Neutraal (0)
  • Er is geen relatie tussen de twee variabelen.
  • Als de prijs van een bed stijgt, betekent dit niets voor het aantal verkochte stoelen.
Negatief (< 0)
  • Er is een negatieve relatie tussen de twee variabelen.
  • Als de ene variabele toeneemt, neemt de andere af (en vice versa).
  • Als de prijs van een bed stijgt, neemt het aantal verkochte bedden af.
  • Als de prijs van een bed daalt, neemt het aantal verkochte bedden toe.

Wanneer gebruik je covariantie in je onderzoek?

Covariantie bepaalt de mate van samenhang tussen twee variabelen. Je berekent de covariantie als je de relatie tussen twee variabelen wilt onderzoeken. De covariantie is de makkelijkste manier om te bepalen of twee variabelen samenhangen.

Voorbeeld: Covariantie
Je doet onderzoek naar de invloed van studeren op het behalen van hoge cijfers.

Je verzamelt data van studenten over het aantal uren dat ze  hebben gestudeerd voor een tentamen (onafhankelijke variabele) en het uiteindelijke cijfer dat ze voor dat tentamen hebben behaald (afhankelijke variabele).

Aan het begin van het onderzoek wil je eerst weten of studenten die langer studeren ook daadwerkelijk hogere cijfers halen. Op basis van je data bereken je de covariantie voor de twee variabelen.

De covariantie is een positieve waarde, wat betekent dat er een positieve relatie is tussen de twee variabelen: als het aantal studie-uren toeneemt, neemt het cijfer ook toe.

Hoeveel fouten bevat jouw scriptie?

De taalexperts van Scribbr verbeteren gemiddeld 150 fouten per 1000 woorden. Benieuwd wat er precies wordt verbeterd? Verschuif de cursor van links naar rechts!

Scriptie nakijken op taal

Covariantie vs variantie

Covariantie en variantie zijn beide een spreidingsmaat. De variantie zegt iets over de spreiding in een dataset (i.e., hoe ver de waarden voor een variabele van het gemiddelde verwijderd zijn).

  • De variantie heeft betrekking op de spreiding van één variabele.
  • De covariantie wordt afgeleid uit de variantie om de samenhang tussen twee variabelen te meten (ook wel de gemeenschappelijke variantie van variabele x en y).

Covariantie vs correlatie

De correlatie (zoals de Pearson correlatiecoëfficiënt) geeft net als de covariantie de mate van samenhang tussen twee variabelen weer.

Het verschil tussen de correlatie en de covariantie is dat de correlatie een gestandaardiseerde maat is voor de samenhang tussen twee variabelen. Dit betekent dat de correlatie corrigeert voor de meetschaal van de variabelen. De correlatie heeft dezelfde formule als de covariantie, alleen wordt het getal nog gedeeld door de standaarddeviaties van de variabelen. Een correlatie is daarom altijd een getal tussen de -1 en 1, ongeacht de eenheid van de variabelen (e.g., kilogrammen, ponden, percentages, etc.).

De covariantie kan daarentegen elk getal aannemen en is wel afhankelijk van de eenheden van de variabelen. Een covariantie uitgedrukt in seconden is bijvoorbeeld groter dan die covariantie uitgedrukt in minuten.

De correlatie is afgeleid uit de covariantie om de sterkte van de relatie tussen twee variabelen te kunnen weergeven. Ook is het makkelijker om meerdere verbanden tussen twee variabelen met elkaar te vergelijken, omdat de getallen niet langer afhankelijk zijn van de eenheden van de variabelen (i.e., alle correlatiewaarden liggen tussen de -1 en 1).

Omdat een correlatie een eenduidiger beeld geeft van de samenhang tussen twee variabelen, is het gebruikelijker om de correlatiecoëfficiënt te berekenen in je onderzoek. De meest gebruikelijke maat voor de correlatie is Pearsons correlatiecoëfficiënt.

Covariantie handmatig of automatisch berekenen (formule)

De formule voor de covariantie ziet er als volgt uit:

Cov(x,y) = {\dfrac{\sum{((x_i - \bar{x})(y_i - \bar{y}))}}{n - 1}}

Waarbij:

Cov(x,y) = de covariantie tussen variabelen x en y

\sum= de som van alle waarden die tussen haakjes volgen

x_i = elke waarde  van variabele x

x = gemiddelde van variabele x

y_i = elke waarde van variabele y

y = gemiddelde van variabele y

n = de steekproefgrootte

Je kunt de covariantie handmatig berekenen met deze formule of laten berekenen door een softwareprogramma zoals SPSS of Excel.

Covariantie handmatig berekenen

Om de covariantie handmatig te berekenen, kun je onderstaand stappenplan volgen.

Voorbeeld: Covariantie handmatig berekenen
Voor je onderzoek naar de invloed van studeren op het behalen van hoge cijfers heb je data verzameld van 10 studenten en deze data in een tabel gezet:

  • Studietijd voor tentamen (in uren)
  • Tentamencijfer (0 – 10)
Studietijd (in uren) Tentamencijfer
9.5 6.8
8.75 6.6
16.25 8.4
15 7.5
12.75 7.1
21.5 8.9
14.25 7.6
3.75 6.1
12.5 7.1
13.75 7.3

Stap 1: Bereken het gemiddelde van x en y

Voor het eerste gedeelte van de formule bereken je het gemiddelde van x en y.

Voorbeeld: Bereken het gemiddelde van x en
Je kent variabele x aan je variabele “studietijd in uren” toe en variabele y aan je variabele “tentamencijfer”. Vervolgens bereken je het gemiddelde van x door alle losse waarden van x bij elkaar op te tellen en dit getal te delen door het aantal waarnemingen (de steekproefgrootte (n = 10)). Voor variabele y doe je hetzelfde.

Studietijd (in uren) Tentamencijfer
9.5 6.8
8.75 6.6
16.25 8.4
15 7.5
12.75 7.1
21.5 8.9
14.25 7.6
3.75 6.1
12.5 7.1
13.75 7.3

\sum x = 9.5 + 8.75 + 16.25 + 15 + 12.75 + 21.5 + 14.25 + 3.75 + 12.5 + 13.75 = 128

\dfrac{\sum x}{n} = 128 / 10 = 12.8

\sum y = 6.8 + 6.6 + 8.4 + 7.5 + 7.1 + 8.9 + 7.6 + 6.1 + 7.1 + 7.3 = 73.4

\dfrac{\sum y}{n}  = 73.4 / 10 = 7.34

Stap 2: Bereken voor elke x– en y-waarde de afstand tot het gemiddelde

Vervolgens trek je elke waarde van x en y van het gemiddelde af.

Voorbeeld: Bereken voor elkex en y de afstand tot het gemiddelde
x x_i - x y_i - y
9.5 6.8 9.5 – 12.8 = -3.3 6.8 – 7.34 = -0.54
8.75 6.6 -4.05 -0.74
16.25 8.4 3.45 1.36
15 7.5 2.2 0.16
12.75 7.1 -0.05 -0.24
21.5 8.9 8.7 1.56
14.25 7.6 1.45 0.26
3.75 6.1 -9.05 -1.24
12.5 7.1 -0.3 -0.24
13.75 7.3 0.95 -0.04

Stap 3: Bereken het product van de gevonden afstanden

Bereken het product van de gevonden afstanden voor x en y.

Voorbeeld: Bereken het product
x x_i - x y_i - y (x_i - x)(y_i - y)
9.5 6.8 9.5 – 12.8 = -3.30 6.8 – 7.34 = -0.54 -3.30 * -0.54 = 1.782
8.75 6.6 -4.05 -0.74 2.997
16.25 8.4 3.45 1.36 3.657
15 7.5 2.20 0.16 0.352
12.75 7.1 -0.05 -0.24 0.012
21.5 8.9 8.70 1.56 13.572
14.25 7.6 1.45 0.26 0.377
3.75 6.1 -9.05 -1.24 11.222
12.5 7.1 -0.30 -0.24 0.072
13.75 7.3 0.95 -0.04 -0.038

Stap 4: Tel de gevonden waarden bij elkaar op en deel door de steekproefgrootte – 1

Tel de waarden van de laatste kolom bij elkaar op en deel deze waarde door de steekproefgrootte min 1 (n – 1). Dit is je covariantie.

Voorbeeld: Tel de gevonden waarden bij elkaar op en deel door de steekproefgrootte min 1 
x x_i - x y_i - y (x_i - x)(y_i - y)
9.5 6.8 9.5 – 12.8 = -3.30 6.8 – 7.34 = -0.54 -3.30 * -0.54 = 1.782
8.75 6.6 -4.05 -0.74 2.997
16.25 8.4 3.45 1.36 3.657
15 7.5 2.20 0.16 0.352
12.75 7.1 -0.05 -0.24 0.012
21.5 8.9 8.70 1.56 13.572
14.25 7.6 1.45 0.26 0.377
3.75 6.1 -9.05 -1.24 11.222
12.5 7.1 -0.30 -0.24 0.072
13.75 7.3 0.95 -0.04 -0.038

\sum(x_i - x)(y_i - y)=1.782 + 2.997 + 3.657 + 0.352 + 0.012 + 13.572 + 0.377 + 11.222 + 0.072 – 0.038 = 34.005

{\dfrac{\sum{((x_i - \bar{x})(y_i - \bar{y}))}}{n - 1}} = 34.005 / (10 – 1) = 3.778

Cov(x,y) = 3.778

Covariantie berekenen met SPSS of Excel

Voor het berekenen van de covariantie kun je ook gebruikmaken van SPSS of Excel. 

Download het SPSS-bestand om met dezelfde data te oefenen.

Om de covariantie in SPSS te berekenen klik je in de menubalk op:

  1. Analyze
  2. Correlate
  3. Bivariate

Er verschijnt een scherm waarin je de variabelen selecteert die je wilt analyseren (gewicht en lengte). Klik vervolgens op ‘Options’ rechtsboven in het pop-upscherm. Er verschijnt een nieuw scherm. Vink ‘Means and standard deviations’ en ‘Cross-product deviations and covariances’ aan. Klik op ‘Continue’ en vervolgens op ‘OK’ om de analyse uit te voeren.

 

Download het Excel-bestand om met dezelfde data te oefenen.

Ga in een lege cel staan en vul de formule =covariantie.s() in voor de covariantie van een steekproef en =covariantie.p() voor de covariantie van een populatie. Tussen de haakjes selecteer je de data van de kolommen, gescheiden door een puntkomma. Druk op enter en de covariantie komt in de lege cel te staan. 

 

Hoeveel fouten bevat jouw scriptie?

De taalexperts van Scribbr verbeteren gemiddeld 150 fouten per 1000 woorden. Benieuwd wat er precies wordt verbeterd? Verschuif de cursor van links naar rechts!

Scriptie nakijken op taal

Covariantie interpreteren

Je kunt de covariantie interpreteren als de mate van samenhang tussen twee variabelen. Deze wordt berekend op basis van de spreiding van de data.

  • Een positieve covariantie geeft aan dat er een positieve relatie is tussen de twee variabelen.
  • Een nul, of getal dichtbij de nul, geeft aan dat er geen verband is tussen de twee variabelen.
  • Een negatieve covariantie geeft aan dat er een negatieve relatie is tussen de twee variabelen.
Voorbeeld: Studeren en tentamencijfers
In je onderzoek naar studietijd en tentamencijfers vind je een covariantie van 3.97.

Dit is een positief getal, dus kun je stellen dat er een positieve relatie is tussen het aantal uur dat studenten studeren voor een tentamen en het tentamencijfer dat ze behalen.

Let op
Covariantie impliceert geen oorzaak-gevolgrelatie (causaliteit) tussen twee variabelen. De covariantie weergeeft de samenhang van twee variabelen, maar duidt niet op een oorzakelijk verband. Je kunt op basis van de covariantie dus niet zeggen of de ene variabele de andere veroorzaakt.

Valkuil bij de interpretatie van de covariantie

Als je de covariantie berekent in je onderzoek, wees dan voorzichtig met uitspraken doen over de sterkte van de samenhang.

Omdat een correlatie altijd tussen de -1 en 1 ligt, kun je hiermee makkelijker uitspraken doen over de sterkte van een verband in relatie tot andere correlaties (i.e., groter dan 0.5 is sterk positief en groter dan -0.5 is sterk negatief).

Een covariantie is echter onbegrensd en hierdoor kan het getal alle waarden aannemen, afhankelijk van de eenheid van de variabelen. Een grote covariantie betekent dus niet automatisch dat er een sterke relatie tussen de variabelen is.

Veelgestelde vragen

Wat is het verschil tussen correlatie en covariantie?

Een correlatie en covariantie zijn beide statistische indicatoren voor een verband (samenhang) tussen variabelen.

Het verschil tussen de correlatie en de covariantie is dat de correlatie een gestandaardiseerde maat is voor de samenhang tussen twee variabelen, en de covariantie niet. Dit betekent dat de correlatie is gecorrigeerd voor de meetschaal van de variabelen.

De correlatie is afgeleid uit de covariantie. Een correlatie bereken je aan de hand van dezelfde formule als de formule voor covariantie, alleen deel je het getal nog door de standaarddeviaties van de variabelen.

Hierdoor kan de correlatie enkel een getal tussen de -1 en 1 zijn, terwijl de covariantie een onbegrensd getal is (i.e., de covariantie kan elke waarde aannemen). Het is gebruikelijker om in je onderzoek de correlatie te berekenen, omdat de correlatie ook iets zegt over de sterkte van de relatie.

Wat is het verschil tussen variantie en covariantie?

De variantie weergeeft de spreiding in een dataset (i.e., hoe ver de waarden van een variabele van het gemiddelde verwijderd zijn).

De covariantie toont de mate van samenhang tussen twee variabelen.

De covariantie is afgeleid uit de variantie en wordt ook wel de gemeenschappelijke variantie van x en y genoemd.

Hoe bereken je de covariantie in SPSS?

Om de covariantie in SPSS te berekenen klik je in de menubalk op:

  1. Analyze
  2. Correlate
  3. Bivariate

Er verschijnt een scherm waarin je de variabelen selecteert die je wilt analyseren. Klik vervolgens op ‘Options’ rechtsboven in het pop-upscherm. Er verschijnt een nieuw scherm. Vink ‘Means and standard deviations’ en ‘Cross-product deviations and covariances’ aan. Klik op ‘Continue’ en vervolgens op ‘OK’ om de analyse uit te voeren.

In de SPSS-uitvoer die verschijnt zie je vervolgens de covarianties in een tabel staan.

Hoe bereken je de covariantie in Excel?

Je kunt de =covariantie.s() functie gebruiken om de covariantie van een steekproef te berekenen in Excel.

Als de waarden van je variabelen x en y in kolommen A en B staan, klik je op een lege cel en typ je: “=COVARIANTIE.S(A:A;B:B)”.

Als je de covariantie van een populatie wilt berekenen in Excel, gebruik je de functie =covariantie.p().

Citeer dit Scribbr-artikel

Als je naar deze bron wilt verwijzen, kun je de bronvermelding kopiëren of op “Citeer dit Scribbr-artikel” klikken om de bronvermelding automatisch toe te voegen aan onze gratis Bronnengenerator.

Scharwächter, V. (2024, 09 februari). Covariantie | Formule, Interpretatie & Berekening. Scribbr. Geraadpleegd op 9 december 2024, van https://www.scribbr.nl/statistiek/covariantie/

Wat vind jij van dit artikel?
Veronique Scharwächter

Veronique heeft twee bachelors: één in Taal- en Cultuurstudies en één in Philosophy, Politics and Economics. Daarnaast heeft zij een boek geschreven over hoe filosofie je kan helpen in je studentenleven. Ze hoopt haar brede, interdisciplinaire kennis in te kunnen zetten om zo veel mogelijk studenten te helpen met het schrijven van hun scriptie.