Centrummaten

Inzicht in de ordegrootte

foto_boek.jpg

Doel
Begrijpen dat je per type data tot een kengetal kan komen over de ligging ervan
• Weten dat er meerdere centrummaten bestaan - en nodig zijn - in de praktijk

In het kort
Centrummaten zijn statistische kengetallen. Ze zeggen iets over de middelste waarde(n) van een indicator (ofwel: teller Y of X). Anders gezegd: de ordegrootte van de indicator.

Toelichting
Met een centrummaat wordt vaak het gemiddelde bedoeld. In de praktijk echter is het gemiddelde niet altijd aan te bevelen, bijvoorbeeld omdat data discreet zijn. Of niet normaal verdeeld. Statistici hebben derhalve diverse centrummaten gedefinieerd. Denk naast het gemiddelde aan de mediaan, de modus of een proportie.

Aanpak
• Verzamel data van de relevante grootheid of indicator
• Bereken de centrummaat met (meestal) software zoals apps en statistische software

Synoniem en/of alternatief
Een centrummaat wordt ook wel locatie- of liggingparameter genoemd, of een maat voor de ordegrootte. Breder gezien vallen centrummaten onder kengetallen of ‘beschrijvende statistiek’ (Engels: descriptive statistics).
Afgeleide alternatieven kom je genoeg tegen. Denk bijvoorbeeld bij proporties aan afgeleide maten, zoals de DPMO (Defects Per Million Opportunities) en PPM (Parts Per Million).

Duur
Met computers bereken je deze maten in (fracties van) een seconde.

Maten ter bepaling van de ordegrootte

Voorbeeld
Statistici hebben diverse centrummaten gedefinieerd. In de tabel hierna zie je de meest voorkomende centrummaten.

Centrummaten tabel.png

Gemmidelde

Doel
• Bepalen van de ordegrootte van een indicator

In het kort
Het gemiddelde is gedefinieerd als de som van een aantal waarnemingen (x1, x2, …, xn), gedeeld door het aantal waarnemingen (n).

Toelichting
Formeel heet het gemiddelde het rekenkundig gemiddelde. Standaard wordt tevens het steekproefgemiddelde bedoeld (tenzij anders vermeld).
In formulevorm: waarbij x1 de 1e waarneming is.

Aanpak
• Verzamel continue data van de voor jou relevante ‘teller’ ofwel indicator
• Bereken het gemiddelde met (meestal) software of apps

Synoniem en/of alternatief
In het Engels: mean of average.
De mediaan en modus zijn bij continue, symmetrisch verdeelde populaties identiek.

Duur
Met de computer bereken je deze maat in een (fractie van een) seconde.

Voorbeeld
Acht mensen uit een groot bedrijf hebben de volgende gemeten lengtes L [in cm]:
181, 183, 169, 193, 201, 175, 178 en 181.
De gemiddelde lengte -𝐿 = (181+183+169+193+201+175+178+181)/8 = 1461/8 = 182,6 cm.

Gemmidelde

Doel
• Bepalen van de kwartielen van een indicator

In het kort
Het opsplitsen van data in vier gelijke delen doe je door middel van drie zogeheten kwartielen.

Toelichting
Een kansverdeling splits je door kwantielen op in gelijke, geordende subgroepen. Kwartielen zijn specifieke kwantielen. Kwarten heten kwartielen, honderdsten zijn zogeheten percentielen. De drie steekproefkwartielen (q1, q2 en q3) zijn maten die een geordende dataset dus in vieren opdelen. Het middelste kwartiel (q2), die een dataset in twee delen opsplitst, heet de mediaan.

Aanpak
• Verzamel continue of discrete data van de voor jou relevante ‘teller’
• Rangschik deze data van klein naar groot (in ‘rangnummers’ 1, …, n)
• Bereken de drie kwartielen (q1, q2 en q3) door de waarden van de rangnummers q1 = te gebruiken (over de mediaan q2 volgt een aparte paragraaf)

Synoniem en/of alternatief
In het Engels: quartiles. Kwartielen zijn – algemener gezien – ook kwantielen.

Duur
Met de computer bereken je de kwartielen in een (fractie van een) seconde.

Voorbeeld
Acht mensen uit een groot bedrijf hebben de volgende gemeten lengtes L [in cm]:
169, 175, 178, 181, 181, 183, 193 en 201.
De drie kwartielen zijn dan: q1 = 175,75 (berekende rangnummer (8+1)/4= 2,25 levert 0,25*(178-175)=0,75 boven op 175. Ofwel: 175,75); q2 = 181 (mediaan) en q3 = 190,5.

Mediaan

DoelCentrummaten mediaan tip1.png
•Bepalen van de ordegrootte van een indicator

In het kort
De mediaan is een centrummaat. De mediaan is de middelste waarde van een gesorteerde dataset (bij oneven aantal n), of het gemiddelde van de middelste twee (bij even aantal n).

Toelichting
Standaard bedoelen we de steekproefmediaan (in plaats van populatiewaarde). De mediaan is, in tegenstelling tot het gemiddelde, ongevoelig voor ‘uitbijters’ of uitschieters.

Aanpak
• Verzamel continue data van de voor jou relevante ‘teller’
• Rangschik deze data van klein naar groot
• Selecteer de middelste (2) waarde(n) uit de gesorteerde dataset

Synoniem en/of alternatief
De mediaan is ook een kwantiel, en heet ook wel tweede kwartiel (Q2), 5vijftigste percentiel, 50%-punt, 50% getrimd gemiddelde of ‘het meest getrimde gemiddelde’. In het Engels: median.
Als alternatief op de mediaan kun je ook zogeheten ‘minder extreem getrimde gemiddelden’ gebruiken.

Duur
Met de computer bereken je de mediaan in een (fractie van een) seconde.

Voorbeeld
Acht mensen uit een groot bedrijf hebben de volgende gemeten lengtes L [in cm]:
169, 175, 178, 181, 181, 183, 193 en 201.
De middelste waarden zijn 181 cm. De mediaan -𝐿 = 181 cm. Ook als er iemand van 234 cm bijkomt, blijft dat zo.

Proportie

DoelCentrummaten proportie tip1.png
• Inzicht krijgen in een procesprestatie, of in de ordegrootte van een proportie

In het kort
Een proportie is het aantal successen (of defecten), gedeeld door het totaal aantal waarden.

Toelichting
Een proportie is het aandeel successen (of defecten) uit een discrete datatset. Als formule: het (deel)aantal waarnemingen np met binaire uitkomst (p of q), gedeeld door het totale aantal ntotaal (=np+ nq).

Aanpak
• Rangschik discrete data in ‘situaties p’ en ‘situaties q’
• Bereken de verhouding tussen het aantal n met uitkomst ‘p’ en het totaal
n (p + q)

Synoniem en/of alternatief
De proportie wordt ook wel fractie, relatieve frequentie of verhouding(maat) genoemd. In het Engels: proportion ofwel fraction.
Naast een proportie worden vaak percentages (%) of percentielen ingezet, als ook de afgeleide DPMO (Defects Per Million Opportunities) of PPM (Parts Per Million).

Duur
Met de computer bereken je de proportie in een (fractie van een) seconde.

Voorbeeld
In augustus 2013 werkten in Nederland 6.576 duizend mensen, en bedroeg het aantal mogelijk werkenden 7.259 duizend. De proportie werkenden is dan
p = 6.576/7.259 = 0,91 (91%).

Modus

Doel
•Bepalen van de ordegrootte is van een indicator (discreet of continu)

In het kort
De modus is de meest voorkomende waarde in een dataset (grootste frequentie). Of, bij verschillende categorieën of klassen, de meest voorkomende categorie of klasse.

Toelichting
Je kunt de modus (mo) zowel voor continue als discrete (ordinale en nominale) data gebruiken. Standaard wordt de steekproefwaarde bedoeld. Meervoud is ‘modi’. De modus is ongevoelig voor uitschieters.

Aanpak
• Verzamel data van de voor jou relevante ‘teller’
• Rangschik data van klein naar groot (eventueel in verschillende klassen)
• De meest voorkomende waarde (of klasse) selecteren

Synoniem en/of alternatief
De modus wordt ook wel ‘grootste frequentiewaarde’ genoemd. In het Engels: mode.
De modus is bij continue, symmetrisch verdeelde data identiek aan het gemiddelde.

Duur
Deze maat is zelf in maximaal minuten te berekenen (bijvoorbeeld bij een turfstaat).

Voorbeeld
Acht mensen uit een groot bedrijf hebben de volgende gemeten lengtes L [in cm]:
169, 175, 178, 181, 181, 183, 193, en 201.
De modus mo = 181 cm. Als er 2 klassen zijn (onder/boven 180) is mo = ‘boven 180’ (5 x).
204 Samenzinnig

foto_boek.jpg