Studentverdeling | kansverdeling
De t-verdeling van Student is een kansverdeling die in 1908 werd ontwikkeld door William Sealy Gosset. Student is het pseudoniem dat hij gebruikte toen hij het artikel publiceerde waarin hij de verdeling beschreef.
Een normale verdeling beschrijft een volledige populatie, t-verdelingen beschrijven steekproeven getrokken uit een volledige populatie; bijgevolg is de t-verdeling voor elke steekproefgrootte anders, en hoe groter de steekproef, hoe meer de verdeling op een normale verdeling lijkt.
De t-verdeling speelt een rol in veel veel gebruikte statistische analyses, waaronder de Student's t-test voor het beoordelen van de statistische significantie van het verschil tussen twee steekproefgemiddelden, de constructie van betrouwbaarheidsintervallen voor het verschil tussen twee populatiegemiddelden, en in lineaire regressieanalyse. De Student's t-verdeling komt ook voor bij de Bayesiaanse analyse van gegevens uit een normale familie.
Geschiedenis
Gosset werkte bij een brouwerij en was geïnteresseerd in de problemen van kleine monsters, bijvoorbeeld de chemische eigenschappen van gerst. Bij de problemen die hij analyseerde, kon de steekproefomvang niet meer dan drie zijn. Vanwege de kleine steekproefgrootte is het schatten van de standaardafwijking niet mogelijk. Ook was in veel gevallen die Gosset tegenkwam de kansverdeling van de monsters niet bekend.
Eén versie van de oorsprong van het pseudoniem is dat de werkgever van Gosset er de voorkeur aan gaf dat medewerkers pseudoniemen gebruikten (in plaats van hun echte naam) bij het publiceren van wetenschappelijke artikelen, dus gebruikte hij de naam "Student" om zijn identiteit te verbergen. Een andere versie is dat de brouwerij niet wilde dat hun concurrenten wisten dat zij de t-test gebruikten om de kwaliteit van grondstoffen te testen.
Eigenschappen
Als we een steekproef van n waarnemingen nemen uit een normale verdeling, dan kan de t-verdeling met ν = n-1 vrijheidsgraden worden gedefinieerd als de verdeling van de locatie van het steekproefgemiddelde ten opzichte van het ware gemiddelde gedeeld door de standaardafwijking de steekproef over de normalisatieterm (dat wil zeggen, )). Op deze manier kan de t-verdeling worden gebruikt om te schatten hoe waarschijnlijk het is dat het ware gemiddelde in een bepaald bereik ligt.
De t-verdeling is symmetrisch en klokvormig, zoals de normale verdeling, maar heeft zwaardere staarten, wat betekent dat hij meer geneigd is waarden te produceren die ver van het gemiddelde liggen. Dit maakt haar nuttig voor het begrijpen van het statistisch gedrag van bepaalde soorten verhoudingen van willekeurige grootheden, waarbij de variatie in de noemer wordt versterkt en afwijkende waarden kan opleveren wanneer de noemer van de verhouding dicht bij nul ligt. De t-verdeling van Student is een speciaal geval van de veralgemeende hyperbolische verdeling.
Gerelateerde pagina's
- F-verdeling
Vragen en antwoorden
V: Wat is de t-verdeling van Student?
A: De t-verdeling van Student is een kansverdeling die in 1908 werd ontwikkeld door William Sealy Gosset. Hij beschrijft steekproeven uit een volledige populatie, en hoe groter de steekproefgrootte, hoe meer hij op een normale verdeling lijkt.
V: Wie heeft de t-verdeling van Student ontwikkeld?
A: William Sealy Gosset ontwikkelde de t-verdeling van Student in 1908. Hij gebruikte het pseudoniem "Student" toen hij de paper publiceerde waarin hij de verdeling beschreef.
V: Wat zijn enkele toepassingen van de t-verdeling van Student?
A: De t-verdeling van Student speelt een rol in veel veel gebruikte statistische analyses, waaronder de Student's t-test voor het beoordelen van de statistische significantie van verschillen tussen twee steekproefgemiddelden, het construeren van betrouwbaarheidsintervallen voor verschillen tussen twee populatiegemiddelden en lineaire regressieanalyse. Het komt ook voor bij Bayesiaanse analyse van gegevens uit een normale familie.
V: Hoe beïnvloedt de steekproefgrootte de vorm van een t-verdeling?
A: Hoe groter de steekproefomvang, hoe meer deze op een normale verdeling zal lijken. Voor elke verschillende steekproefgrootte is er een bijbehorende unieke t-verdeling die deze beschrijft.
V: Is er een verband tussen de T-verdeling van de Student en de normale verdeling?
A: Ja - terwijl normale verdelingen volledige populaties beschrijven, beschrijven student's T verdelingen steekproeven getrokken uit die populaties; als zodanig delen zij overeenkomsten, maar verschillen afhankelijk van hun respectieve grootte. Zoals hierboven vermeld, lijken grotere steekproeven meer op normale verdelingen dan kleinere.
V: Bestaat er een andere naam voor dit type verdeling?
A: Nee - dit type verdeling staat bekend als "Student's T Distribution", genoemd naar de ontwikkelaar ervan, William Sealy Gosset, die zijn pseudoniem "Student" gebruikte toen hij zijn artikel erover publiceerde.