Studentens t-teststatistikk

Studentens t-test, i statistikk, en metode for å teste hypoteser om gjennomsnittet av en liten prøve hentet fra en normalt fordelt populasjon når populasjonsstandardavviket er ukjent.

I 1908 utviklet William Sealy Gosset, en engelskmann som publiserte under pseudonymet Student, t-testen og t-distribusjonen. T-fordelingen er en familie av kurver der antall frihetsgrader (antall uavhengige observasjoner i prøven minus en) spesifiserer en bestemt kurve. Når prøvestørrelsen (og dermed frihetsgradene) øker, nærmer t-fordelingen seg klokkeformen til standard normalfordeling. I praksis brukes normalt fordelingen for tester som involverer gjennomsnittet av en prøve på større enn 30.

Det er vanlig å formulere en nullhypotese, som sier at det ikke er noen effektiv forskjell mellom det observerte utvalgsmidlet og det antatte populasjonsmidlet, dvs. at enhver målt forskjell bare skyldes tilfeldigheter. I en jordbruksstudie, for eksempel, kan nullhypotesen være at en påføring av gjødsel ikke hadde hatt noen innvirkning på avlingene, og et eksperiment ville bli utført for å teste om det har økt høsten. Generelt kan en t-test være enten tosidig (også betegnet som tosidig), med angivelse ganske enkelt at midlene ikke er likeverdige, eller ensidige, og spesifiserer om det observerte gjennomsnittet er større eller mindre enn det antatte middelverdien. Teststatistikken t blir deretter beregnet. Hvis den observerte t-statistikken er mer ekstrem enn den kritiske verdien bestemt av passende referansefordeling, blir nullhypotesen avvist. Den aktuelle referansefordelingen for t-statistikken er t-fordelingen. Den kritiske verdien avhenger av testens signifikansnivå (sannsynligheten for feilaktig avvisning av nullhypotesen).

Anta for eksempel at en forsker ønsker å teste hypotesen om at en prøve med størrelse n = 25 med gjennomsnitt x = 79 og standardavvik s = 10 ble trukket tilfeldig fra en populasjon med gjennomsnittlig mikroskop = 75 og ukjent standardavvik. Ved å bruke formelen for t-statistikken tilsvarer den beregnede t 2. For en tosidig test på et felles nivå av betydning α = 0,05, er de kritiske verdiene fra t-fordelingen på 24 frihetsgrader −2.064 og 2.064. Den beregnede t overskrider ikke disse verdiene, og derfor kan ikke nullhypotesen avvises med 95 prosent tillit. (Tillitsnivået er 1 - α.)

En annen anvendelse av t-distribusjonen tester hypotesen om at to uavhengige tilfeldige prøver har samme gjennomsnitt. T-fordelingen kan også brukes til å konstruere konfidensintervaller for det sanne gjennomsnittet av en populasjon (den første applikasjonen) eller for forskjellen mellom to utvalgsmidler (den andre applikasjonen). Se også intervallestimering.