De standaardafwijking geeft aan hoe ver de individuele waarnemingen in een groep gemiddeld afwijken van het gemiddelde (ook wel de verwachte waarde). Een lage standaardafwijking betekent dat de meeste waarden dicht bij het gemiddelde liggen; een hoge standaardafwijking geeft aan dat de waarden sterk verspreid zijn.

Waarom is standaardafwijking nuttig?

  • Onderzoekers en wetenschappers gebruiken de standaardafwijking om de variatie in meetresultaten te kwantificeren en om te beoordelen of waargenomen verschillen betekenisvol zijn (vaak worden verschillen groter dan twee of drie keer de standaardafwijking als belangrijk beschouwd).
  • Bij statistische rapportage noemen we vaak een foutmarge. In veel contexten (bijvoorbeeld bij betrouwbaarheidsintervallen) wordt een marge rond een schatting berekend met behulp van de standaardfout; voor een 95%-interval gebruikt men vaak ongeveer 2 × (standaardfout). Dit verschilt dus van de standaardafwijking van individuele metingen.
  • In financiële toepassingen (geld) geeft de standaardafwijking van rendementen aan hoe sterk individuele rendementen kunnen afwijken van het gemiddelde rendement, wat belangrijk is voor risico-inschatting.

Notatie

Voor een volledige populatie gebruikt men meestal de Griekse letter σ. Voor een steekproef gebruikt men gewoonlijk de letter s. In sommige documenten worden deze symbolen als afbeeldingen of speciale tekens weergegeven: {\displaystyle \sigma } en die van de steekproef door {\displaystyle s}.

Formules en berekening

Populatie-standaardafwijking (σ)

Als je alle N waarden x1, x2, ..., xN kent en het populatiegemiddelde μ, dan is de populatie-variantie:

var(σ^2) = (1/N) × Σ (xi − μ)^2

en de standaardafwijking is de wortel daarvan:

σ = sqrt( (1/N) × Σ (xi − μ)^2 )

Steekproef-standaardafwijking (s)

Als je slechts een steekproef van n waarnemingen hebt en het steekproefgemiddelde x̄ gebruikt, corrigeert men meestal door te delen door (n − 1) in plaats van n (Bessel-correctie):

s = sqrt( (1/(n − 1)) × Σ (xi − x̄)^2 )

De variantie is het kwadraat van de standaardafwijking. Omdat variantie in gekwadrateerde eenheden uitgedrukt wordt, geeft de standaardafwijking weer in dezelfde eenheid als de oorspronkelijke data.

Voorbeeld

Beschouw de meetwaarden: 2, 4, 4, 4, 5, 5, 7, 9.

  • Gemiddelde μ = 5.
  • Populatievariantie σ^2 = ( (2−5)^2 + (4−5)^2 + ... + (9−5)^2 ) / 8 = 4.
  • Populatie-standaardafwijking σ = sqrt(4) = 2.
  • Als dit slechts een steekproef is (n = 8), is de steekproefvariantie s^2 = (som van gekwadrateerde afwijkingen)/(n−1) = 4,5714..., en s ≈ 2,138.

Interpretatie en eigenschappen

  • De standaardafwijking is altijd ≥ 0; een waarde van 0 betekent dat alle waarnemingen gelijk zijn.
  • Ongeveer 68% van de waarden valt binnen ±1σ van het gemiddelde, ongeveer 95% binnen ±2σ en ongeveer 99,7% binnen ±3σ wanneer de verdeling normaal (gaussisch) is — dit is de empirische regel (68–95–99,7 regel).
  • Standaardafwijking is gevoelig voor uitbijters: enkele extreem grote of kleine waarden kunnen de standaardafwijking sterk verhogen.

Relatie tot standaardfout en foutmarge

De standaardfout van het gemiddelde is s / sqrt(n) en beschrijft de verwachte spreiding van het steekproefgemiddelde rond het populatiegemiddelde als je herhaalde steekproeven zou nemen. De term foutmarge (margin of error) die in enquêtes en betrouwbaarheidsintervallen wordt gegeven, wordt vaak berekend als een veelvoud van de standaardfout (bijvoorbeeld ≈1,96 × standaardfout voor een 95%-interval). Daarom is de uitspraak dat de foutmarge “gewoonlijk tweemaal de standaardafwijking” te algemeen: in veel contexten bedoelt men ongeveer twee keer de standaardfout, niet twee keer de standaardafwijking van individuele waarnemingen.

Toepassingen

  • Beoordelen van consistentie in metingen en experimenten.
  • Risicobeoordeling in financiën (schommelingen in rendementen).
  • Beslissen of waargenomen verschillen statistisch relevant zijn ten opzichte van de natuurlijke spreiding.
  • Vergelijken van spreiding tussen groepen of condities.

Aandachtspunten en alternatieven

  • Als de data sterk scheef zijn of uitbijters bevatten, zijn robuustere spreidingsmaten zoals de interkwartielafstand (IQR) of de mediaan absolute deviatie (MAD) vaak zinvoller.
  • Controleer altijd welke standaardafwijking wordt gerapporteerd: die van de populatie (σ) of die van een steekproef (s).
  • Voor kleine steekproeven kan de Bessel-correctie (delen door n−1) belangrijk zijn om een onpartijdige schatting van de populatievariantie te krijgen.

Samenvattend: de standaardafwijking is een eenvoudige en veelgebruikte maat voor spreiding. Begrijpen welke variant (populatie of steekproef) wordt gebruikt en hoe deze zich verhoudt tot standaardfout en foutmarge is essentieel voor juiste interpretatie van statistische resultaten.