Datastratificatie is het opsplitsen van data in meer homogene groepen (strata). In de Meet- en Analysefase van DMAIC stratificeren we data om steekproeven en relaties te bepalen. Gegevens opsplitsen, waardoor relaties kunnen worden gevonden tussen oorzaak (bron “X”) en gevolg ((K)PI of “Y”), vereist enig (team)-denkwerk. Groepeer data, idealiter voorafgaand aan de dataverzameling zelf, in zinvolle categorieën.
Doelen van datastratificatie
- Opsplitsing om tot juiste groepen en bijbehorende steekproefgroottes te komen
- Mogelijke oorzaken van problemen of focusmogelijkheden kunnen vinden
Datastratificatie aanpak
Groepeer data in (gangbare) categorieën in tabelvorm:
- Wie (afdeling, dienst, leverancier, persoon)
- Wat (type dienst, machine of product)
- Waar (locatie, processtap, land, regio)
- Wanneer (per werkuur, type dag, seizoen of jaar)
Geef uiteindelijk relaties tussen data Y en X visueel weer met behulp van grafieken. Welke type grafiek hangt onder andere af van of data continu en/ of discreet is
Conclusie kan zijn dat er … (combi’s mogelijk)
- Geen, één of meerdere relatie(s) er toe doe(n)(t)
- Hypothesetoets(en) zijn nodig of niet
- Aanvullende metingen / data gewenst of niet
- De data op andere wijze gestratificeerd dient te worden
Synoniem en alternatief van datastratificatie
In ’t Engels: Data Stratification. Datastratificatie is zowel gerelateerd aan stratified sampling (vooraf per groep aantal metingen bepalen) en aan post-stratification (achteraf groeperen).
Duur van datastratificatie
Datastratificatie kan in een kwartier te doen zijn tot uren werk (na de dataverzameling zelf).