Hypothesetoetsen: regressieanalyse

op

Regressieanalyse is een statistische methode, waarmee een relatie tussen twee continue variabelen wordt getoetst op wel/ geen significantie. Deze relatie kan afwezig, deels aanwezig (lineair of niet-lineair) of (heel) sterk zijn.

Doelen van een regressieanalyse

  • Een relatie tussen twee continue variabelen toetsen op significantie & sterkte
  • Berekent een (lineaire) regressielijn tussen Y en X, inclusief toetsing op significantie

Toelichting

Een regressieanalyse helpt om aannames (hypothesen) te bevestigen of te weerleggen. De term regressie is misschien wat bijzonder (betekent letterlijk ‘teruggang’). Deze term is door Francis Galton bedacht bij onderzoek naar erfelijke eigenschappen. Hij introduceerde de rekenmethode ‘kleinste kwadratenmethode’ om tussen puntenparen de optimale regressielijn te krijgen (begin 19e eeuw). Regressieanalyse is nog verfijnd door Karl Pearson.

De formule, die berekent (geschat) wordt door software, is: Y = a0 + a1*X + e, waarbij

  • Y de onafhankelijke of te verbeteren continue variabele is
  • X de afhankelijke, mogelijke (grond)oorzaak is
  • e de error of residuwaarde ofwel verschil tussen regressielijn en werkelijke waarde is
  • a1 de zogenaamde richtingscoëfficiënt of ‘helling’ is van de regressielijn, en
  • a0 het intercept ofwel snijpunt is op de Y-as (de bias bij een MSA inzake accuraatheid)

Regressieanalyse aanpak

  • Definieer probleem en doel. Stel de hierbij relevante hypothesen op (H0: de regressielijn is grofweg ‘horizontaal’, ofwel a1 = 0 versus Haa1 ≠ 0)
  • Visualiseer de Y-X relatie met behulp van een spreidingsdiagram
  • Zorg voor de executie van regressieanalyse tussen de Y en de X. Interpreteer de p-waarden en (lineair) patroon in de grafiek. Is het verband statistisch significant?
  • Indien significant: wat is de relevantie van de relatie? Interpreteer de sterkte door middel van de correlatie r of R2

Binnen Minitab adviseren we om te werken met Fitted Line Plot. Hierin wordt zowel een spreidingsdiagram gemaakt, als de regressielijn met p-waarde en sterktes zoals een R2 samen berekent.

Synoniem en alternatief van de regressieanalyse

In het Engels: Simple Linear Regression. Er bestaan diverse andere regressiemethoden, zoals meervoudige regressie (verklaar Y met meerdere X’en), niet-lineaire of robuuste regressie.

Duur van het maken van een regressieanalyse

Een regressieanalyse maken is, met behulp van software, in enkele minuten te doen.

Voorbeeld van een regressieanalyse

De wekelijkse Yield (% goed geleverd) is hier gerelateerd aan de hoeveelheid orders (drukte).

Voorbeeld regressieanalyse

Meer weten over een regressieanalyse?

Portretfoto Tom cirkelvorm

Tom Torpstra

Trainer/adviseur

LSSP boek: Samenzinnig verbeteren
De complete toolbox om aantoonbaar te verbeteren.

Portretfoto Tom cirkelvorm

Tom Torpstra

Black Belt

"Onderzoek naar een relatie tussen continue factoren."

Onze Lean Six Sigma Trainingen

Benieuwd naar wat wij doen?
 
In onze brochure vind je ons volledige trainings- en consultancyaanbod.
Download de brochure