Studenten

Tolerance = ,000 limit reached

Error message when performing multple regression in spss

Every now and then I get questions related to an error message that can occur when performing multiple regression analysis in spss: Tolerance = ,000 limit reached. In this post, I explain what this notification means, how it affects the results of the analysis, and how to overcome the problem.


Voorbeeld foutmelding Tolerance

Cause error message tolerance limit reached

The error message tolerance limit reached has to do with the fact that such a high degree of multicollinearity has been found that the regression analysis cannot be performed.

Een belangrijke assumptie van een multiple regressie is dat er geen sprake is van multicollineariteit; de predictors in het regressiemodel mogen onderling niet te sterk samenhangen. Wanneer je bovengenoemde melding krijgt is er zelfs sprake van een (bijna) perfect verband tussen twee of meer predictoren, ook

Centreren rondom het gemiddelde (mean centering)

Bij het uitvoeren van statistische analyses kom je soms een situatie tegen waarbij variabelen beter gecentreerd kunnen worden rondom hun gemiddelde. Bijvoorbeeld bij een regressie-analyse waarin een moderatie-effect getoetst wordt, maar ook bij multilevel analyses wordt vaak mean centering toegepast.  

Wat is mean centering?

Mean centering is een zogenaamde ‘lineaire transformatie’ van een variabele. Als we de histogram van een variabele bekijken (Figuur 1), dan zien we in de x-as dat deze variabele loopt van 50 tot 92.

Figuur 1
Histogram van een niet-gecentreerde variabele

Niet-gecentreerde variabele

Wat we nu willen bereiken door te centreren rondom het gemiddelde is dat de waarde 0 in het midden van deze range komt te liggen. Dit zonder dat verder de verdeling van de variabele verandert. Dat kunnen we bereiken door het gemiddelde van de gehele sample af te trekken van de waarde van elke respondent. Als we van

2021-10-04T09:25:20+02:00September 20th, 2021|Statistiek, Studenten|0 Comments

Linearity (video will be translated to English soon)

Veel statistische analyses die we gebruiken zijn gebaseerd op de assumptie van lineariteit; Er is een lineair verband tussen de afhankelijke en onafhankelijke variabele(n). De reden hiervoor is eigenlijk heel eenvoudig; als er een lineair verband bestaat kunnen we met één parameter het verband weergeven, want de helling van de (regressie) lijn is overal even groot. Als er geen lineair verband bestaat tussen de variabelen, dan zouden we meerdere parameters nodig hebben om het verband tussen twee variabelen weer te geven. 

Om een idee te krijgen of er sprake is van een lineair verband kunnen we het scatterplot tussen de variabelen inspecteren. In Figuur 1 zie je dat er een rechte lijn te trekken is door de scatterplot en dat deze lijn een goed idee geeft van het verband tussen beide variabelen. We kunnen hier dan ook zeggen dat er sprake is van een lineair

Multilevel analyse

Multilevel analyse is een statistische analyse die je gebruikt wanneer cases (level 1) genest zijn in groepen (level 2). Een veelgebruikt voorbeeld is leerlingen die genest zijn in scholen. Maar het kunnen ook werknemers genest in firma’s, inwoners in landen of bomen in bossen et cetera betreffen. Andere namen voor multilevel analyse zijn onder andere mixed models en hierarchical linear models.

Het idee hierachter is dat verschillen tussen individuen niet alleen te maken hoeven te hebben met individuele kenmerken. Ook kenmerken van de groep waar de individu toe behoort kunnen van invloed zijn. Als je bijvoorbeeld ziekteverzuim van medewerkers in supermarkten wil verklaren, meet je medewerker-kenmerken zoals mentale en fysieke gezondheid. Je vermoedt echter ook dat het verzuimbeleid van de organisatie, bedrijfsgrootte en de locatie een rol kunnen spelen bij de mate van ziekteverzuim van een medewerker. Dus je verzamelt niet alleen medewerker-specifieke gegevens, maar ook organisatie-gegevens

2021-08-30T12:28:52+02:00December 10th, 2019|Statistiek, Studenten, Wetenschappelijk onderzoek|0 Comments

Korte statistiekvraag?

Snel een antwoord op een korte statistiekvraag.

Bij het uitvoeren van statistische analyses voor het afstudeeronderzoek kun je gebruik maken van diverse bronnen, zoals video’s op youtube. En daarmee kun je een heel eind komen. Maar soms heb je een korte statistiekvraag: Mag ik concluderen dat de assumpties niet geschonden zijn? Heb ik de analyses gekozen die het beste passen bij mijn dataset? Hoe schrijf ik de resultaten duidelijk op? Welke conclusies kan ik uit mijn resultaten trekken?

Voor die vragen is het vaak niet nodig om een afspraak met een statistisch begeleider te plannen. Je wil gewoon snel even sparren of een kort advies en het liefst op korte termijn zodat je weer zelfstandig verder kunt werken. Ook daarvoor kun je bij ons terecht.

Meer informatie vind je op deze pagina.

2022-11-05T14:49:27+01:00November 12th, 2019|Statistiek, Studenten, Wetenschappelijk onderzoek|0 Comments
Go to Top