Wat betekent correlatie?
De correlatie “test” onderzoekt of twee variabelen die gemeten zijn op interval (bijvoorbeeld IQ) of ratio niveau (bijvoorbeeld kg, beiden zijn schalen) met elkaar correleren en dus samenhang hebben.
Wanneer gebruik je correlatie?
Je gebruikt de correlatie als je wilt weten of twee variabelen met elkaar samenhangen, zonder dat je zegt dat er sprake is van een causaal verband (dat de ene variabele invloed heeft op de andere). Daarnaast gebruik je correlaties ook vaak om je data te beschrijven en te checken op assumpties.
Correlatie: Kracht van een verband
De onderstaande tabel geeft weer wat de kracht van een verband is. Een correlatie van 0 wilt zeggen geen verband, hoe groter de correlatie wordt (dichter bij 1), hoe sterker het verband.

Voorbeeld: drie type Correlaties
De richting van een verband kan verschillen, de coëfficient kan zowel negatief als positief zijn en is tussen -1 (perfecte negatieve correlatie) en +1 (perfecte positieve correlatie). Een coëfficient van 0 betekent dat er geen correlatie is.
1. Perfecte positieve correlatie (coëfficient +1)
Jij doet een stap naar links ik doe een stap naar links, jij doet een stap naar rechts ik doe een stap naar rechts, enzovoort… wat jij doet, doe ik ook dus wij correleren perfect positief met elkaar.
Zie het voorbeeld van hoe de scatterplot eruit ziet. In het scatterplot zie je dat naar mate mensen ouder worden ze meer verdienen. Er is dus sprake van een positief (correlationeel) verband tussen leeftijd en inkomen.

2. Perfecte negatieve correlatie (coëfficient -1)
Jij doet een stap naar links ik doe een stap naar recht, jij doet een stap naar rechts ik doe een stap naar links, enzovoort… wat jij doet, doe ik het TEGENOVERGESTELDE dus wij correleren perfect negatief met elkaar.
Zie onderstaande het scatterplot van een negatieve verband. In het scatterplot zie je dat naar mate mensen ouder worden ze minder verdienen. Er is dus sprake van een negatief (correlationeel) verband tussen leeftijd en inkomen.

3. Geen correlatie (coëfficient 0)
Jij doet een stap naar links ik blijf staan, jij doet een stap naar rechts ik blijf staan, enzovoort… wat jij doet, maakt niks uit voor wat ik doe (je kan hoog of laag springen, ik blijf staan) dus wij correleren niet met elkaar.
In de scatterplot zie je dat naar mate mensen ouder worden ze evenveel verdienen. Er is dus GEEN sprake van een (correlationeel) verband tussen leeftijd en inkomen.

Pas op! Twee opmerkingen bij Correlatie
1. Correlatie geeft een simpele weergave van de realiteit
De correlatie is een veel gebruikte en nuttige test. De test is echter alleen vrij “simpel”. Daarmee bedoel ik te zeggen dat het een rechttoe rechtaan toets is. Dat er correlatie is tussen twee variabelen is vaak niet de hele waarheid. Het kan zijn dat een andere variabelen de samenhang verklaart. Denk aan het voorbeeld “ijs eten” en “naar het strand gaan” Deze correleren met elkaar maar dat komt omdat mensen als het warm is vaker ijs eten en vaker naar het strand gaan. Het is niet zo dat je als je in de winter naar het strand gaat een ijsje gaat eten.
2. Causaal vs Correlationeel
Het is heel belangrijk om te beseffen dat je geen causaliteit (oorzakelijk verband) kan aantonen met een correlatie. Dit kan ook niet met een regressie, daar kan je wel mee voorspellen op basis van een verband. Bijvoorbeeld, als je weet dat er een sterk verband is tussen ‘IQ’ en ‘inkomen’ (op basis van een hoge positieve correlatie), en je hebt een persoon die een hoog IQ heeft, dan kan je voorspellen dat deze persoon waarschijnlijk een hoog inkomen heeft.
Voor causaliteit moet je onderzoeksmodel voldoen aan een aantal voorwaarden; (1) correlationeel verband, (2) tijdsvolgorde, eerst oorzaak dan gevolg, en (3) afwezigheid vs aanwezigheid oorzaak.
Pas dus ook op om, op basis van enkel correlaties, een conclusie te trekken. Een scriptie die enkel bestaat uit correlaties is dus statistisch niet bijzonder sterk.