Datastratificatie

Data opsplitsen in homogene(re) groepen

foto_boek.jpg

Doel
• Data opsplitsen om tot juiste groepen en bijbehorende steekproefgroottes te komen
• Mogelijke oorzaken van problemen of focusmogelijkheden kunnen vinden

In het kort
Datastratificatie is het opsplitsen van data in meer homogene groepen (strata). In de Meet- en Analysefase van DMAIC stratificeren we data om steekproeven en relaties te bepalen.

Toelichting
Gegevens opsplitsen, waardoor relaties kunnen worden gevonden tussen oorzaak (bron ‘X’) en gevolg ((K)PI of ‘Y’), vereist enig (team)denkwerk. Groepeer data, idealiter voorafgaand aan de dataverzameling zelf, in zinvolle categorieën.

Aanpak
• Groepeer data in (gangbare) categorieën in tabelvorm:
·· Wie (afdeling, dienst, leverancier, persoon)
·· Wat (type dienst, machine of product)
·· Waar (locatie, processtap, land, regio)
·· Wanneer (per werkuur, type dag, seizoen of jaar)
• Geef uiteindelijk relaties tussen data Y en X visueel weer met behulp van grafieken. Welke type grafiek hangt onder andere af van of data continu en/of discreet zijn
• Conclusie kan zijn dat er… (combi’s mogelijk)
·· Geen, één of meerdere relatie(s) er toe doe(n)(t)
·· Hypothesetoets(en) nodig zijn of niet
·· Aanvullende metingen/data gewenst zijn of niet
·· De data op andere wijze gestratificeerd dienen te worden

Synoniem en/of alternatief
In ’t Engels: Data Stratification. Datastratificatie is zowel gerelateerd aan stratified sampling (vooraf per groep aantal metingen bepalen) en aan post-stratification (achteraf groeperen).

Duur
Datastratificatie kan in een kwartier te doen zijn, maar kan ook uren werk geven (na de dataverzameling zelf).

 

 

 

foto_boek.jpg