In de wiskunde en statistiek is het gemiddelde een soort gemiddelde. Naast het gemiddelde zijn er nog andere soorten gemiddelden.

Het meest gebruikelijke gemiddelde is het rekenkundig gemiddelde, dat wordt berekend door alle waarden bij elkaar op te tellen en vervolgens te delen door het aantal waarden.

Als bijvoorbeeld 1, 2, 2, 100, 100 een reeks getallen of scores is. Als we alle getallen optellen, is het antwoord 205. Door dit getal te delen door het aantal getallen (5) vinden we dat het gemiddelde 41 is. Het probleem met deze specifieke reeks getallen is dat niemand in deze groep iets van 41 scoorde, en het zegt ons niet veel over wat voor soort scores deze getallen voorstellen.

Wat verstaan we onder gemiddeldes?

Het woord gemiddelde verwijst naar een getal dat op een of andere manier een centrale of typische waarde van een dataset samenvat. Er bestaan meerdere definities, elk met hun eigen sterke en zwakke punten. Welke je kiest hangt af van het soort data en van wat je wilt weergeven.

Belangrijkste soorten gemiddelden

  • Rekenkundig gemiddelde (aritmetisch gemiddelde): de som van de waarden gedeeld door het aantal waarden. Formule: sum(xi) / n. Het is gevoelig voor uitschieters (outliers).
  • Mediaan: de middelste waarde wanneer de getallen van klein naar groot zijn gerangschikt. Voor een even aantal waarden is het gemiddelde van de twee middelste. De mediaan is robuuster tegen uitschieters dan het rekenkundig gemiddelde.
  • Modus (modus of vaakst voorkomende waarde): de waarde die het vaakst voorkomt. Handig bij categorische data en bij bimodale of multimodale verdelingen.
  • Gewogen gemiddelde: elk getal krijgt een gewicht toegewezen. Formule: sum(wi * xi) / sum(wi). Wordt gebruikt wanneer sommige waarden belangrijker zijn dan andere (bijvoorbeeld cijfers met verschillende wegingsfactoren).
  • Geometrisch gemiddelde: de n-de machtswortel van het product van de waarden: (prod(xi))^(1/n). Geschikt voor groeipercentages en factorveranderingen (bijv. rendementen).
  • Harmonisch gemiddelde: n / sum(1/xi). Wordt vaak gebruikt bij snelheden of ratio’s waarbij het gemiddelde van verhoudingen nodig is.
  • Getrimd gemiddelde: het gemiddelde na het weglaten van een percentage van de hoogste en laagste waarden. Wordt gebruikt om de invloed van extreme waarden te beperken.

Terug naar het voorbeeld: 1, 2, 2, 100, 100

  • Rekenkundig gemiddelde: (1 + 2 + 2 + 100 + 100) / 5 = 205 / 5 = 41.
  • Mediaan: gesorteerde reeks is 1, 2, 2, 100, 100; middelste waarde is 2 → mediaan = 2.
  • Modus: 2 en 100 komen beide twee keer voor → bimodaal: modus = 2 en 100.
  • Getrimd gemiddelde (bijv. 20% trimmen = 1 waarde aan beide zijden verwijderen): verwijder laagste (1) en hoogste (100), dan gemiddelde van 2, 2, 100 = 104/3 ≈ 34,67. Dit is nog steeds beïnvloed door de hoge 100, maar minder extreem dan het ongetrimd rekenkundig gemiddelde.

Wanneer gebruik je welk gemiddelde?

  • Rekenkundig gemiddelde: goed bij symmetrische verdelingen zonder extreme uitschieters en wanneer elke observatie gelijk weegt.
  • Mediaan: aan te raden bij scheve verdelingen of wanneer uitschieters de centrale tendens niet moeten verstoren (bijv. inkomensgegevens).
  • Modus: nuttig bij categorische data of om de meest voorkomende categorie/waarde te bepalen.
  • Gewogen gemiddelde: gebruik wanneer observaties verschillende belangrijkheidsgraden hebben (bv. cijfers met verschillende wegingsfactoren).
  • Geometrisch gemiddelde: voordeelig voor groeipercentages en rendementen over meerdere perioden.
  • Harmonisch gemiddelde: kies voor gemiddelden van snelheden of ratio’s waarbij de noemers relevant zijn (bv. gemiddelde snelheid bij gelijke afgelegde afstanden).
  • Getrimd gemiddelde: geschikt als je uitschieters wilt verminderen maar toch een gemiddelde wilt blijven gebruiken.

Korte samenvatting

Een gemiddeld getal geeft een samenvatting van een dataset, maar er is niet één juiste keuze voor alle situaties. Het rekenkundig gemiddelde is het meest bekend, maar kan misleidend zijn bij uitschieters. De mediaan is robuuster; de modus is zinvol voor categorieën; gewogen, geometrisch en harmonisch gemiddelden hebben elk specifieke toepassingen. Kies het type gemiddelde dat het beste past bij de aard van je data en bij wat je wilt laten zien.