Assumpties

Lineariteit

Veel statistische analyses die we gebruiken zijn gebaseerd op de assumptie van lineariteit; Er is een lineair verband tussen de afhankelijke en onafhankelijke variabele(n). De reden hiervoor is eigenlijk heel eenvoudig; als er een lineair verband bestaat kunnen we met één parameter het verband weergeven, want de helling van de (regressie) lijn is overal even groot. Als er geen lineair verband bestaat tussen de variabelen, dan zouden we meerdere parameters nodig hebben om het verband tussen twee variabelen weer te geven. 

Om een idee te krijgen of er sprake is van een lineair verband kunnen we het scatterplot tussen de variabelen inspecteren. In Figuur 1 zie je dat er een rechte lijn te trekken is door de scatterplot en dat deze lijn een goed idee geeft van het verband tussen beide variabelen. We kunnen hier dan ook zeggen dat er sprake is van een lineair

Homoscedasticiteit

De assumptie homoscedasticiteit

Homoscedasticiteit is een assumptie voor verschillende statistische analyses, zoals multiple regressie. Het is een moeilijk woord om uit te spreken en eigenlijk ook een van de moeilijkste assumpties om te controleren. Homoscedasticiteit heeft te maken met residuals, ook wel error terms genoemd. Om een beter begrip te krijgen begin ik dan  ook met een uitleg over residuals.

Als je een verband berekent tussen een variabele Y en een of meer variabelen X dan ga je op zoek naar de best passende, lineaire, lijn tussen alle cases. In een scatterplot tussen kun je zien welke combinatie van de y-variabele en x-variabele elke case in jouw dataset heeft.  Stel dat variabele y het percentage goede antwoorden op een toets is en variabele x het aantal uren dat de student geslapen heeft. In een fictieve Figuur 1 kun je zien

2021-08-31T08:17:58+02:00januari 11th, 2021|Assumpties, Statistiek|0 Reacties
Ga naar de bovenkant