Statistiek

Tolerance = ,000 limit reached

Foutmelding bij multiple regressies in spss

Regelmatig krijg ik vragen in verband met een foutmelding bij het uitvoeren van multiple regressieanalyse in spss: Tolerance = ,000 limit reached. In deze post leg ik uit wat deze melding betekent, wat de gevolgen zijn voor de uitkomsten van de analyse en hoe je het probleem kunt ondervangen.


Voorbeeld foutmelding Tolerance

Oorzaak foutmelding tolerance limit reached

De foutmelding tolerance limit reached heeft te maken met het feit dat een dusdanige hoge mate van multicollineariteit is gevonden dat de regressieanalyse niet uitgevoerd kan worden.

Een belangrijke assumptie van een multiple regressie is dat er geen sprake is van multicollineariteit; de predictors in het regressiemodel mogen onderling niet te sterk samenhangen. Wanneer je bovengenoemde melding krijgt is er zelfs sprake van een (bijna) perfect verband tussen twee of meer predictoren, ook

Centreren rondom het gemiddelde (mean centering)

Bij het uitvoeren van statistische analyses kom je soms een situatie tegen waarbij variabelen beter gecentreerd kunnen worden rondom hun gemiddelde. Bijvoorbeeld bij een regressie-analyse waarin een moderatie-effect getoetst wordt, maar ook bij multilevel analyses wordt vaak mean centering toegepast.  

Wat is mean centering?

Mean centering is een zogenaamde ‘lineaire transformatie’ van een variabele. Als we de histogram van een variabele bekijken (Figuur 1), dan zien we in de x-as dat deze variabele loopt van 50 tot 92.

Figuur 1
Histogram van een niet-gecentreerde variabele

Niet-gecentreerde variabele

Wat we nu willen bereiken door te centreren rondom het gemiddelde is dat de waarde 0 in het midden van deze range komt te liggen. Dit zonder dat verder de verdeling van de variabele verandert. Dat kunnen we bereiken door het gemiddelde van de gehele sample af te trekken van de waarde van elke respondent. Als we van

2021-10-04T09:25:20+02:00september 20th, 2021|Statistiek, Studenten|0 Reacties

Lineariteit

Veel statistische analyses die we gebruiken zijn gebaseerd op de assumptie van lineariteit; Er is een lineair verband tussen de afhankelijke en onafhankelijke variabele(n). De reden hiervoor is eigenlijk heel eenvoudig; als er een lineair verband bestaat kunnen we met één parameter het verband weergeven, want de helling van de (regressie) lijn is overal even groot. Als er geen lineair verband bestaat tussen de variabelen, dan zouden we meerdere parameters nodig hebben om het verband tussen twee variabelen weer te geven. 

Om een idee te krijgen of er sprake is van een lineair verband kunnen we het scatterplot tussen de variabelen inspecteren. In Figuur 1 zie je dat er een rechte lijn te trekken is door de scatterplot en dat deze lijn een goed idee geeft van het verband tussen beide variabelen. We kunnen hier dan ook zeggen dat er sprake is van een lineair

Homoscedasticiteit

De assumptie homoscedasticiteit

Homoscedasticiteit is een assumptie voor verschillende statistische analyses, zoals multiple regressie. Het is een moeilijk woord om uit te spreken en eigenlijk ook een van de moeilijkste assumpties om te controleren. Homoscedasticiteit heeft te maken met residuals, ook wel error terms genoemd. Om een beter begrip te krijgen begin ik dan  ook met een uitleg over residuals.

Als je een verband berekent tussen een variabele Y en een of meer variabelen X dan ga je op zoek naar de best passende, lineaire, lijn tussen alle cases. In een scatterplot tussen kun je zien welke combinatie van de y-variabele en x-variabele elke case in jouw dataset heeft.  Stel dat variabele y het percentage goede antwoorden op een toets is en variabele x het aantal uren dat de student geslapen heeft. In een fictieve Figuur 1 kun je zien

2021-08-31T08:17:58+02:00januari 11th, 2021|Assumpties, Statistiek|0 Reacties

Correlaties

Om de sterkte van een verband tussen bepaalde kenmerken te bepalen worden vaak correlaties gebruikt. In deze uitleg wordt ingegaan op de Pearson r correlatie. Er wordt uitgelegd wanneer een correlatie een geschikte test is, aan welke voorwaarden de variabelen in de dataset moeten voldoen en hoe je de resultaten kunt interpreteren en rapporteren.

2021-06-10T08:30:03+02:00oktober 20th, 2020|Statistiek, Wetenschappelijk onderzoek|0 Reacties

Multilevel analyse

Multilevel analyse is een statistische analyse die je gebruikt wanneer cases (level 1) genest zijn in groepen (level 2). Een veelgebruikt voorbeeld is leerlingen die genest zijn in scholen. Maar het kunnen ook werknemers genest in firma’s, inwoners in landen of bomen in bossen et cetera betreffen. Andere namen voor multilevel analyse zijn onder andere mixed models en hierarchical linear models.

Het idee hierachter is dat verschillen tussen individuen niet alleen te maken hoeven te hebben met individuele kenmerken. Ook kenmerken van de groep waar de individu toe behoort kunnen van invloed zijn. Als je bijvoorbeeld ziekteverzuim van medewerkers in supermarkten wil verklaren, meet je medewerker-kenmerken zoals mentale en fysieke gezondheid. Je vermoedt echter ook dat het verzuimbeleid van de organisatie, bedrijfsgrootte en de locatie een rol kunnen spelen bij de mate van ziekteverzuim van een medewerker. Dus je verzamelt niet alleen medewerker-specifieke gegevens, maar ook organisatie-gegevens

2021-08-30T12:28:52+02:00december 10th, 2019|Statistiek, Studenten, Wetenschappelijk onderzoek|0 Reacties

Korte statistiekvraag?

Snel een antwoord op een korte statistiekvraag.

Bij het uitvoeren van statistische analyses voor het afstudeeronderzoek kun je gebruik maken van diverse bronnen, zoals video’s op youtube. En daarmee kun je een heel eind komen. Maar soms heb je een korte statistiekvraag: Mag ik concluderen dat de assumpties niet geschonden zijn? Heb ik de analyses gekozen die het beste passen bij mijn dataset? Hoe schrijf ik de resultaten duidelijk op? Welke conclusies kan ik uit mijn resultaten trekken?

Voor die vragen is het vaak niet nodig om een afspraak met een statistisch begeleider te plannen. Je wil gewoon snel even sparren of een kort advies en het liefst op korte termijn zodat je weer zelfstandig verder kunt werken. Ook daarvoor kun je bij ons terecht.

Meer informatie vind je op deze pagina.

2022-11-05T14:49:27+01:00november 12th, 2019|Statistiek, Studenten, Wetenschappelijk onderzoek|0 Reacties
Ga naar de bovenkant