Een correlatiecoëfficiënt r is een lineaire maat voor de sterkte tussen twee continue variabelen. De correlatiecoëfficiënt r die we hier bedoelen (de ‘standaard’) is ontwikkeld door Karl Pearson (1897). Het is een maat die tussen de -1 en +1 ligt.
De correlatie r wordt als volgt berekent:
Correlaties bereken je vaak met statistische software. We classificeren correlaties als volgt:
In het Engels: Correlation, Correlation Coefficient of Correlation Analysis.
Alternatief is Spearman’s correlatie (1904) of Fitted Line Plot (Minitab).
Een correlatie zelf berekenen is digitaal (met software) in wat minuten te realiseren.
De determinatiecoëfficiënt R2 is een maat voor het deel van de variatie, dat wordt verklaard door het statistisch model. Zoals: voor hoeveel % verklaart je regressielijn de processituatie?
Bepalen van de mate waarin een model Y=F(X) de werkelijkheid benadert
De R2 wordt binnen (Lean) Six Sigma ook vaak gebruikt als percentage voor hoeveel de variatie van ‘oorzaak’ X, de variatie van ‘gevolg’ Y verklaart. De R2 ligt tussen de 0 en 100 procent (%). In het geval van enkelvoudige lineaire regressie is R² gelijk aan het kwadraat van de correlatiecoëfficiënt. In het geval van meervoudige regressie (meerdere X’en) valt R² te definiëren als de fractie verklaarde variantie van het betreffende regressiemodel.
De R² kan je als volgt berekenen:
De R2 bereken je normaliter met statistische software. De R2 kun je als volgt interpreteren (indicatief):
De R2 wordt ook wel Fractie Verklaarde Variantie (FVV) genoemd. In het Engels: coefficient of determination. Alternatief bij enkelvoudige regressie is de correlatie. Bij relatief weinig data adviseren wij een aangepaste (Engels: adjusted) R2: de R2Adj. Ook kun je kijken naar de Standaardafwijking S van het residu van het model (een absolute maat voor modelafwijking).
Ook wordt voor de hypothesetoets ANOVA bijvoorbeeld de η2 als sterktemaat aangegeven. De η2 (eta-kwadraat) is identiek aan de interpretatie van R2.
Een R2 berekenen is, met behulp van statistische software, in seconden/ minuten voor elkaar.
Onderstaande voorbeelden geven patronen weer, zoals “geen relatie”, een “positieve lineaire relatie” en een “negatieve lineaire relatie”. Bij deze Matrixplot zijn ook de bijbehorende correlatie r en determinatiecoëfficiënt R2 weergegeven.