Een variantieanalyse ofwel ANOVA is een hypothesetoets. Hiermee wordt gekeken of populatiegemiddelden van minimaal twee groepen significant van elkaar verschillen of niet.
Denk bijvoorbeeld aan de duur van rally's van tennissers per sekse. Welke sekse heeft gemiddeld de langste rally? Een ANOVA helpt om uitsluitsel te krijgen.
ANOVA staat voor Analysis Of Variance, en is ontwikkeld door Sir Ronald Fischer (1925).
Idee is dat je niet alleen kijkt naar het letterlijke verschil in gemiddeldes tussen groepen (verschil meet je immers bijna altijd), maar dat je ook rekening houdt met de variatie binnen en tussen deze groepen. Vandaar de misschien wat verwarrende term ANOVA of variantieanalyse.
Toetsen op gemiddeldes gaat hier met behulp van de berekening van de F-toets.
In formulevorm:
, waarbij
- a staat voor het aantal groepen of categorieën van de X ofwel factor
- n staat voor het de steekproefgrootte
- SSFactor de ‘kwadraatsommen’ (Sum of Squares), ofwel berekende variantie welke wordt toegewezen aan het effect van de X, ofwel factor
- SSError de ‘kwadraatsommen’ (Sum of Squares), ofwel berekende variantie welke wordt toegewezen aan de restspreiding (error)
- Mean Square is de Sum of Squares, gedeeld door het aantal vrijheidsgraden (Degrees of Freedom (DF))
- Hoe groter de Mean Square van de X of factor is ten opzichte van de Mean Square van de restspreiding (error), hoe groter de F-toetsingsgrootheid. Hoe kleiner de kans dan, dat het verschil in gemiddeldes per groep aan toeval onderhevig is.
One-Way ANOVA aanpak
- Definieer probleem en doel. Stel bijbehorende hypothesen op. H0: geen verschil in populatiegemiddelden μi=1,..,a versus Ha: minimaal één populatiegemiddelde μi is anders
- Visualiseer de Y-X relatie met behulp van een Boxplot (bij ‘veel’ data) of een Individual Value Plot (‘weinig’ data, zeg minder dan 10 waarnemingen per categorie of groep)
- Zorg voor de executie van ANOVA met statistische software. Interpreteer de p-waarde
- Bij verwachte (grote) verschillen in variatie per groep, kun je een formele toets vooraf uitvoeren (toetsen van Bartlett of Levene).
- Onderzoek residuen (residu is verschil tussen groep-gemiddelde en individuele waarden). De te onderzoeken ANOVA-aannames met residuen: identieke spreiding en normaal verdeeld / groep.
- Gebruik als alternatief (zonder aannames) de Mood’s Median of eventueel de Kruskall-Wallis test
- Indien significant en conform aannames: wat is de relevantie van de relatie? Interpreteer de sterkte door middel van het verschil van de gemiddelden, of de R2. Betrek meerdere experts om de verschillen te verklaren (causaliteit)
- Meestal adviseren we om te werken met One-Way ANOVA. Het is overzichtelijk, omdat je slechts met één X of factor per keer werkt.
- Binnen de software Minitab kun je via One-Way ANOVA zowel grafieken maken, als de F-toets met p-waarde en sterktes zoals een R2 samen berekenen.
Synoniem en alternatief van One-Way ANOVA
One-Way ANOVA heet ook wel enkelvoudige variantieanalyse. In het Engels kom je ook nog One-Factorial ANOVA tegen. Er bestaan diverse andere ANOVA methoden, zoals Two-Way ANOVA (ANOVA met twee factoren of X’en berekenen).
Indien de achterliggende aannames niet genoeg kloppen, adviseren wij om medianen te toetsen, zoals met de Mood’s Median Test of eventueel de Kruskall-Wallis Test.
Duur van het maken van een ANOVA
Een ANOVA maken is, met behulp van software, in enkele minuten te doen.
Voorbeeld van een One-Way ANOVA
De wekelijkse On Time Delivery (% tijdig leveren van diensten) presteert per locatie anders. Voor het gemak zijn hier twee locaties gebruikt, maar meer had ook gekund.