Standaardfout
De standaardafwijking is de standaardafwijking van de steekproefverdeling van een statistiek. De term kan ook worden gebruikt voor een schatting (goede gok) van die standaardafwijking op basis van een steekproef van de hele groep.
Het gemiddelde van een deel van een groep (een steekproef genoemd) is de gebruikelijke manier om het gemiddelde voor de hele groep te schatten. Het is vaak te moeilijk of kost te veel geld om de hele groep te meten. Maar als een andere steekproef wordt gemeten, zal die een gemiddelde hebben dat een beetje afwijkt van de eerste steekproef. De standaardafwijking van het gemiddelde is een manier om te weten hoe dicht het gemiddelde van de steekproef bij het gemiddelde van de hele groep ligt. Het is een manier om te weten hoe zeker je kunt zijn over het gemiddelde van de steekproef.
Bij echte metingen is de werkelijke waarde van de standaardafwijking van het gemiddelde voor de hele groep meestal niet bekend. Daarom wordt de term standaardafwijking vaak gebruikt om een schatting van het werkelijke getal voor de hele groep aan te geven. Hoe meer metingen er in een steekproef zijn, hoe dichter de gok zal liggen bij het ware getal voor de hele groep.
Voor een waarde die is bemonsterd met een onvertekende normaal verdeelde fout, geeft het bovenstaande het aandeel van de steekproeven weer die tussen 0, 1, 2 en 3 standaarddeviaties boven en onder de werkelijke waarde zouden vallen.
Hoe vind je de standaardfout van het gemiddelde
Een manier om de standaardfout van het gemiddelde te vinden is een groot aantal steekproeven. Eerst wordt voor elke steekproef het gemiddelde gevonden. Dan worden het gemiddelde en de standaardafwijking van die steekproefgemiddelden gevonden. De standaardafwijking van alle steekproefgemiddelden is de standaardfout van het gemiddelde. Dit kan veel werk zijn. Soms is het te moeilijk of kost het te veel geld om veel monsters te hebben.
Een andere manier om de standaardfout van het gemiddelde te vinden is een vergelijking te gebruiken waarvoor slechts één steekproef nodig is. De standaardafwijking van het gemiddelde wordt gewoonlijk geschat door de standaardafwijking voor een steekproef uit de hele groep (standaardafwijking van de steekproef) te delen door de vierkantswortel van de steekproefgrootte.
S E x ¯ = s n {\displaystyle SE_{\bar {x}} ={\frac {s}{\sqrt {n}}}}
waarbij
s de standaardafwijking van de steekproef is (d.w.z. de op de steekproef gebaseerde schatting van de standaardafwijking van de populatie), en
n is het aantal metingen in de steekproef.
Hoe groot moet de steekproef zijn, zodat de schatting van de standaardafwijking van het gemiddelde dicht bij de werkelijke standaardafwijking van het gemiddelde voor de hele groep ligt? Er moeten minstens zes metingen in een steekproef zijn. Dan zal de standaardfout van het gemiddelde voor de steekproef binnen 5% liggen van de standaardfout van het gemiddelde als de hele groep gemeten zou zijn.
Correcties voor sommige gevallen
Er is een andere vergelijking die moet worden gebruikt als het aantal metingen 5% of meer van de hele groep betreft:
Er zijn speciale vergelijkingen die moeten worden gebruikt als een monster minder dan 20 metingen heeft.
Soms komt een steekproef van één plaats, hoewel de hele groep verspreid kan zijn. Ook kan een steekproef soms in een korte periode worden getrokken terwijl de hele groep een langere tijd bestrijkt. In dat geval zijn de aantallen in de steekproef niet onafhankelijk. Dan worden speciale vergelijkingen gebruikt om hiervoor te corrigeren.
bruikbaarheid
Een praktisch resultaat: Men kan zekerder worden van een gemiddelde waarde door meer metingen in een steekproef te doen. Dan zal de standaardafwijking van het gemiddelde kleiner zijn omdat de standaardafwijking door een groter getal wordt gedeeld. Maar om de onzekerheid (standaardafwijking van het gemiddelde) in een gemiddelde waarde half zo groot te maken, moet de steekproefgrootte (n) vier keer zo groot zijn. Dit komt doordat de standaardafwijking wordt gedeeld door de vierkantswortel van de steekproefgrootte. Om de onzekerheid een tiende keer zo groot te maken, moet de steekproefgrootte (n) honderd keer zo groot zijn!
Standaardfouten zijn gemakkelijk te berekenen en worden veel gebruikt omdat:
- Indien de standaardafwijking van verschillende individuele grootheden bekend is, kan de standaardafwijking van een of andere functie van de grootheden in vele gevallen gemakkelijk worden berekend;
- Indien de waarschijnlijkheidsverdeling van de waarde bekend is, kan deze worden gebruikt om een goede benadering van een exact betrouwbaarheidsinterval te berekenen; en
- Indien de kansverdeling niet bekend is, kunnen andere vergelijkingen worden gebruikt om een betrouwbaarheidsinterval te schatten
- Als de steekproefomvang zeer groot wordt, blijkt uit het principe van de centrale limiettheorie dat de getallen in de steekproef zeer veel lijken op de getallen in de hele groep (ze hebben een normale verdeling).
Relatieve standaardfout
De relatieve standaardafwijking (RSE) is de standaardafwijking gedeeld door het gemiddelde. Dit getal is kleiner dan één. Vermenigvuldiging met 100% geeft het als percentage van het gemiddelde. Dit helpt om aan te geven of de onzekerheid belangrijk is of niet. Neem bijvoorbeeld twee enquêtes over het inkomen van huishoudens die beide resulteren in een steekproefgemiddelde van $50.000. Als de ene enquête een standaardfout van $10.000 heeft en de andere van $5.000, dan zijn de relatieve standaardfouten respectievelijk 20% en 10%. De enquête met de lagere relatieve standaardfout is beter omdat de meting nauwkeuriger is (de onzekerheid is kleiner).
Mensen die gemiddelde waarden moeten kennen, beslissen vaak hoe klein de onzekerheid moet zijn voordat zij besluiten de informatie te gebruiken. Het National Center for Health Statistics van de VS rapporteert bijvoorbeeld geen gemiddelde als de relatieve standaardfout groter is dan 30%. NCHS vereist ook minstens 30 waarnemingen voor een schatting om te worden gerapporteerd. []
Voorbeeld
Er zijn bijvoorbeeld veel roodbaarzen in het water van de Golf van Mexico. Om te weten te komen hoeveel een roodbaars van 42 cm gemiddeld weegt, is het niet mogelijk om alle roodbaarzen van 42 cm lang te meten. In plaats daarvan is het mogelijk om een aantal van hen te meten. De vissen die daadwerkelijk gemeten worden, worden een monster genoemd. De tabel toont het gewicht van twee monsters van roodbaarzen, alle 42 cm lang. Het gemiddelde gewicht van het eerste monster is 0,741 kg. Het gemiddelde gewicht van het tweede monster is 0,735 kg, een beetje anders dan dat van het eerste monster. Elk van deze gemiddelden verschilt een beetje van het gemiddelde dat zou worden verkregen door elke 42 cm lange roodbaars te meten (wat overigens niet mogelijk is).
De onzekerheid in het gemiddelde kan worden gebruikt om te weten hoe dicht het gemiddelde van de steekproeven ligt bij het gemiddelde dat zou worden verkregen door meting van de hele groep. De onzekerheid in het gemiddelde wordt geschat als de standaardafwijking voor de steekproef, gedeeld door de vierkantswortel van het aantal monsters min één. Uit de tabel blijkt dat de onzekerheden in de gemiddelden voor de twee steekproeven zeer dicht bij elkaar liggen. Ook is de relatieve onzekerheid de onzekerheid in het gemiddelde gedeeld door het gemiddelde, maal 100%. De relatieve onzekerheid in dit voorbeeld is 2,38% en 2,50% voor de twee steekproeven.
Als men de onzekerheid in het gemiddelde kent, kan men weten hoe dicht het steekproefgemiddelde ligt bij het gemiddelde dat zou worden verkregen door de hele groep te meten. Het gemiddelde voor de hele groep ligt tussen a) het gemiddelde voor de steekproef plus de onzekerheid in het gemiddelde, en b) het gemiddelde voor de steekproef min de onzekerheid in het gemiddelde. In dit voorbeeld zal het gemiddelde gewicht voor alle 42 cm lange roodbaarzen in de Golf van Mexico naar verwachting 0,723-0,759 kg bedragen op basis van de eerste steekproef, en 0,717-0,753 kg op basis van de tweede steekproef.
Voorbeeld van een roodbaars (ook bekend als red drum, Sciaenops ocellatus) die in het voorbeeld wordt gebruikt.
Vragen en antwoorden
V: Wat is de standaardfout?
A: De standaardfout is de standaardafwijking van de steekproefverdeling van een statistiek.
V: Kan de term standaardafwijking gebruikt worden voor een schatting van de standaardafwijking?
A: Ja, de term standaardafwijking kan gebruikt worden voor een schatting (goede gok) van die standaardafwijking uit een steekproef van de hele groep.
V: Hoe schat men het gemiddelde voor een hele groep?
A: Het gemiddelde van een deel van een groep (een steekproef genoemd) is de gebruikelijke manier om het gemiddelde voor de hele groep te schatten.
V: Waarom is het moeilijk om de hele groep te meten?
A: Het is vaak te moeilijk of te duur om de hele groep te meten.
V: Wat is de standaardafwijking van het gemiddelde en wat bepaalt die?
A: De standaardafwijking van het gemiddelde is een manier om te weten hoe dicht het gemiddelde van de steekproef bij het gemiddelde van de hele groep ligt. Het is een manier om te weten hoe zeker men kan zijn over het gemiddelde van de steekproef.
V: Is de werkelijke waarde van de standaardafwijking van het gemiddelde meestal bekend bij echte metingen?
A: Nee, de werkelijke waarde van de standaardafwijking van het gemiddelde voor de hele groep is meestal niet bekend bij echte metingen.
V: Hoe beïnvloedt het aantal metingen in een steekproef de nauwkeurigheid van de schatting?
A: Hoe meer metingen er in een steekproef zitten, hoe dichter de schatting bij het ware getal voor de hele groep zal liggen.