Statistics

Tolerance = ,000 limit reached

Error message when performing multple regression in spss

Every now and then I get questions related to an error message that can occur when performing multiple regression analysis in spss: Tolerance = ,000 limit reached. In this post, I explain what this notification means, how it affects the results of the analysis, and how to overcome the problem.


Voorbeeld foutmelding Tolerance

Cause error message tolerance limit reached

The error message tolerance limit reached has to do with the fact that such a high degree of multicollinearity has been found that the regression analysis cannot be performed.

An important assumption of a multiple regression is that there is no multicollinearity; the predictors in the regression model should not be too strongly related to each other. When you get the above message, there is an (almost) perfect relationship between two or more predictors, also called

Centreren rondom het gemiddelde (mean centering)

Bij het uitvoeren van statistische analyses kom je soms een situatie tegen waarbij variabelen beter gecentreerd kunnen worden rondom hun gemiddelde. Bijvoorbeeld bij een regressie-analyse waarin een moderatie-effect getoetst wordt, maar ook bij multilevel analyses wordt vaak mean centering toegepast.  

Wat is mean centering?

Mean centering is een zogenaamde ‘lineaire transformatie’ van een variabele. Als we de histogram van een variabele bekijken (Figuur 1), dan zien we in de x-as dat deze variabele loopt van 50 tot 92.

Figuur 1
Histogram van een niet-gecentreerde variabele

Niet-gecentreerde variabele

Wat we nu willen bereiken door te centreren rondom het gemiddelde is dat de waarde 0 in het midden van deze range komt te liggen. Dit zonder dat verder de verdeling van de variabele verandert. Dat kunnen we bereiken door het gemiddelde van de gehele sample af te trekken van de waarde van elke respondent. Als we van

2021-10-04T09:25:20+02:00September 20th, 2021|Statistics, Students|0 Comments

Linearity (video will be translated to English soon)

Veel statistische analyses die we gebruiken zijn gebaseerd op de assumptie van lineariteit; Er is een lineair verband tussen de afhankelijke en onafhankelijke variabele(n). De reden hiervoor is eigenlijk heel eenvoudig; als er een lineair verband bestaat kunnen we met één parameter het verband weergeven, want de helling van de (regressie) lijn is overal even groot. Als er geen lineair verband bestaat tussen de variabelen, dan zouden we meerdere parameters nodig hebben om het verband tussen twee variabelen weer te geven. 

Om een idee te krijgen of er sprake is van een lineair verband kunnen we het scatterplot tussen de variabelen inspecteren. In Figuur 1 zie je dat er een rechte lijn te trekken is door de scatterplot en dat deze lijn een goed idee geeft van het verband tussen beide variabelen. We kunnen hier dan ook zeggen dat er sprake is van een lineair

2021-09-07T14:42:30+02:00August 30th, 2021|Assumpties, Statistics, Students, Scientific Research|0 Comments

Homoscedasticity (video will be translated to English soon)

De assumptie homoscedasticiteit

Homoscedasticiteit is een assumptie voor verschillende statistische analyses, zoals multiple regressie. Het is een moeilijk woord om uit te spreken en eigenlijk ook een van de moeilijkste assumpties om te controleren. Homoscedasticiteit heeft te maken met residuals, ook wel error terms genoemd. Om een beter begrip te krijgen begin ik dan  ook met een uitleg over residuals.

Als je een verband berekent tussen een variabele Y en een of meer variabelen X dan ga je op zoek naar de best passende, lineaire, lijn tussen alle cases. In een scatterplot tussen kun je zien welke combinatie van de y-variabele en x-variabele elke case in jouw dataset heeft.  Stel dat variabele y het percentage goede antwoorden op een toets is en variabele x het aantal uren dat de student geslapen heeft. In een fictieve Figuur 1 kun je zien

2021-08-31T08:17:58+02:00January 11th, 2021|Assumpties, Statistics|0 Comments

Correlaties

Om de sterkte van een verband tussen bepaalde kenmerken te bepalen worden vaak correlaties gebruikt. In deze uitleg wordt ingegaan op de Pearson r correlatie. Er wordt uitgelegd wanneer een correlatie een geschikte test is, aan welke voorwaarden de variabelen in de dataset moeten voldoen en hoe je de resultaten kunt interpreteren en rapporteren.

2021-06-10T08:30:03+02:00October 20th, 2020|Statistics, Scientific Research|0 Comments

Multilevel analyse

Multilevel analyse is een statistische analyse die je gebruikt wanneer cases (level 1) genest zijn in groepen (level 2). Een veelgebruikt voorbeeld is leerlingen die genest zijn in scholen. Maar het kunnen ook werknemers genest in firma’s, inwoners in landen of bomen in bossen et cetera betreffen. Andere namen voor multilevel analyse zijn onder andere mixed models en hierarchical linear models.

Het idee hierachter is dat verschillen tussen individuen niet alleen te maken hoeven te hebben met individuele kenmerken. Ook kenmerken van de groep waar de individu toe behoort kunnen van invloed zijn. Als je bijvoorbeeld ziekteverzuim van medewerkers in supermarkten wil verklaren, meet je medewerker-kenmerken zoals mentale en fysieke gezondheid. Je vermoedt echter ook dat het verzuimbeleid van de organisatie, bedrijfsgrootte en de locatie een rol kunnen spelen bij de mate van ziekteverzuim van een medewerker. Dus je verzamelt niet alleen medewerker-specifieke gegevens, maar ook organisatie-gegevens

2021-08-30T12:28:52+02:00December 10th, 2019|Statistics, Students, Scientific Research|0 Comments

Korte statistiekvraag?

Snel een antwoord op een korte statistiekvraag.

Bij het uitvoeren van statistische analyses voor het afstudeeronderzoek kun je gebruik maken van diverse bronnen, zoals video’s op youtube. En daarmee kun je een heel eind komen. Maar soms heb je een korte statistiekvraag: Mag ik concluderen dat de assumpties niet geschonden zijn? Heb ik de analyses gekozen die het beste passen bij mijn dataset? Hoe schrijf ik de resultaten duidelijk op? Welke conclusies kan ik uit mijn resultaten trekken?

Voor die vragen is het vaak niet nodig om een afspraak met een statistisch begeleider te plannen. Je wil gewoon snel even sparren of een kort advies en het liefst op korte termijn zodat je weer zelfstandig verder kunt werken. Ook daarvoor kun je bij ons terecht.

Meer informatie vind je op deze pagina.

2022-11-05T14:49:27+01:00November 12th, 2019|Statistics, Students, Scientific Research|0 Comments
Go to Top