Het verifiëren van verbanden of relaties met behulp van statistische methoden kan op twee manieren: 1) met grafieken en 2) met hypothesetoetsen. Er zijn heel veel soorten grafieken en hypothesetoetsen, welke afhangen van de vraag, aannamen en type data. Bij twijfel over grafische interpretaties, adviseren wij aanvullend geschikte hypothesetoetsen in te zetten.
Doelen van data tools
- Een relatie tussen variabelen verifiëren
- Mogelijke grondoorzaken vinden
Toelichting
Zie hieronder de toewijzing van welke grafieken en hypothesetoetsen aanbevelenswaardig zijn bij welke type data. Zowel Y-X grafieken als hypothesetoetsen worden hierna toegelicht.
We willen hier niet alle mogelijkheden weergeven. Wel noemen we hier de relatief bekende of aanbevolen methoden. Geavanceerde analyse opties, zoals General Linear Model (GLM) of Logistische Regressie, laten we buiten beschouwing.
Aanpak van XY relatie visualiseren
- Bedenk wat werkelijk van invloed is, op hetgeen je wilt verbeteren. Identificeer en verzamel data van mogelijke oorzaken (X’en) van een gevolg of probleem (Y). Bekijk dan welke mogelijke oorzaak of relatie je wilt visualiseren en/ of toetsen (bewijs)
- Bepaal of de Y en X continu of discreet zijn (zie ook hoofdstuk DMAIC: Measure)
- Kies op basis daarvan, welke grafiek en/ of toets aan te bevelen is om uit te voeren
- Teken de grafiek, of maak de grafiek met behulp van statistische software
- Toets, bij grote belangen, twist of twijfel, de hypothese(n) op basis van berekeningen met een geschikte hypothesetoets. Dit wordt bijna altijd gedaan met behulp van statistische software (bijvoorbeeld Minitab, SPSS, Matlab, of Sigma Excel)
- Bepaal de relevantie of sterkte van de relatie
- Ga door met dataverificatie (relatiebepaling met behulp van data-analyse), totdat je de grondoorza(a)k(en) gevonden hebt. Bedenk, de procesdeur is hierbij minimaal van even groot belang (d.w.z. input van inhoudelijke experts)
Synoniem en alternatief
Ter informatie hier de vele termen die overeenkomen met de in dit boek veelvuldig gebruikte ‘Y’ en ‘X’.
De Y wordt ook ‘afhankelijke variabele’ (Engels: dependend of response variable) genoemd. Denk ook aan begrippen als ‘gevolg’ (Engels: effect), een teller, KPI of (project-, output- of proces)indicator. Soms wordt de Y ook wel CTQ genoemd, maar bedenk dan dat het verwarren van de CTQ Requirement (klanteis) en CTQ (Y) snel kan gebeuren.
De X wordt ook ‘onafhankelijke variabele’ (Engels: independend variable of factor) genoemd. Denk ook aan begrippen als ‘oorzaak’ (Engels: cause), teller of (input- of proces-)indicator.
Duur van een Y-X relatie visualiseren
Een Y-X relatie visualiseren of toetsen kan, mits de data gereed is, in enkele seconden tot minuten worden uitgevoerd. Echter, in de praktijk kan het verkrijgen van de juiste data soms vele dagen tot maanden duren!