Inhoud
- TL; DR (te lang; niet gelezen)
- Het verschil tussen betrouwbaarheidsniveau versus betrouwbaarheidsinterval
- Berekening van betrouwbaarheidsintervallen of niveaus voor grote monsters
- Berekening van betrouwbaarheidsintervallen voor kleine monsters
Statistieken gaan over het trekken van conclusies in het licht van onzekerheid. Wanneer u een steekproef neemt, kunt u er niet helemaal zeker van zijn dat uw steekproef echt de populatie weerspiegelt waaruit deze is getrokken. Statistici gaan met deze onzekerheid om door rekening te houden met de factoren die van invloed kunnen zijn op de schatting, door hun onzekerheid te kwantificeren en door statistische tests uit deze onzekere gegevens te trekken.
Statistici gebruiken betrouwbaarheidsintervallen om een bereik van waarden te specificeren dat waarschijnlijk het "echte" populatiegemiddelde op basis van een steekproef kan bevatten, en drukken hun mate van zekerheid hierin uit door middel van betrouwbaarheidsniveaus. Hoewel het berekenen van betrouwbaarheidsniveaus niet vaak nuttig is, is het berekenen van betrouwbaarheidsintervallen voor een bepaald betrouwbaarheidsniveau een zeer nuttige vaardigheid.
TL; DR (te lang; niet gelezen)
Bereken een betrouwbaarheidsinterval voor een bepaald betrouwbaarheidsniveau door de standaardfout te vermenigvuldigen met de Z score voor uw gekozen betrouwbaarheidsniveau. Trek dit resultaat af van uw steekproefgemiddelde om de ondergrens te krijgen en voeg het toe aan het steekproefgemiddelde om de bovengrens te vinden. (Zie bronnen)
Herhaal hetzelfde proces maar met de t score in plaats van de Z score voor kleinere monsters (n < 30).
Zoek een betrouwbaarheidsniveau voor een gegevensset door de helft van de grootte van het betrouwbaarheidsinterval te nemen, dit te vermenigvuldigen met de vierkantswortel van de steekproefgrootte en vervolgens te delen door de standaarddeviatie van de steekproef. Zoek het resultaat op Z of t score in een tabel om het niveau te vinden.
Het verschil tussen betrouwbaarheidsniveau versus betrouwbaarheidsinterval
Wanneer u een statistiek tussen aanhalingstekens ziet, wordt er soms een bereik achter gegeven, met de afkorting "CI" (voor "betrouwbaarheidsinterval") of gewoon een plus-min-symbool gevolgd door een cijfer. Bijvoorbeeld: "het gemiddelde gewicht van een volwassen man is 180 pond (CI: 178.14 tot 181.86)" of "het gemiddelde gewicht van een volwassen man is 180 ± 1,86 pond." Beide vertellen u dezelfde informatie: op basis van het monster gebruikt, valt het gemiddelde gewicht van een man waarschijnlijk binnen een bepaald bereik. Het bereik zelf wordt het betrouwbaarheidsinterval genoemd.
Als u er zeker van wilt zijn dat het bereik de werkelijke waarde bevat, kunt u het bereik verbreden. Dit zou uw "betrouwbaarheidsniveau" in de schatting verhogen, maar het bereik zou meer potentiële gewichten dekken. De meeste statistieken (inclusief die hierboven geciteerd) worden gegeven als betrouwbaarheidsintervallen van 95 procent, wat betekent dat er een kans van 95 procent is dat de werkelijke gemiddelde waarde binnen het bereik ligt. U kunt ook een betrouwbaarheidsniveau van 99 procent of een betrouwbaarheidsniveau van 90 procent gebruiken, afhankelijk van uw behoeften.
Berekening van betrouwbaarheidsintervallen of niveaus voor grote monsters
Wanneer u een betrouwbaarheidsniveau in statistieken gebruikt, hebt u dit meestal nodig om een betrouwbaarheidsinterval te berekenen. Dit is een beetje gemakkelijker om te doen als je een grote steekproef hebt, bijvoorbeeld meer dan 30 mensen, omdat je kunt gebruiken Z score voor uw schatting in plaats van ingewikkelder t scores.
Neem uw onbewerkte gegevens en bereken het steekproefgemiddelde (tel de individuele resultaten op en deel deze door het aantal resultaten). Bereken de standaarddeviatie door het gemiddelde van elk afzonderlijk resultaat af te trekken om het verschil te vinden en dit vierkant te kwadrateren. Tel al deze verschillen op en deel het resultaat door de steekproefgrootte min 1. Neem de vierkantswortel van dit resultaat om de standaarddeviatie van de steekproef te vinden (zie bronnen).
Bepaal het betrouwbaarheidsinterval door eerst de standaardfout te vinden:
SE = s / √n
Waar s is de standaarddeviatie van uw steekproef en n is uw steekproefgrootte. Als u bijvoorbeeld een steekproef van 1000 mannen nam om het gemiddelde gewicht van een man te berekenen en een standaardafwijking van 30 kreeg, zou dit het volgende opleveren:
SE = 30 / √1000 = 30 / 31.62 = 0.95
Om het betrouwbaarheidsinterval hiervan te vinden, zoekt u het betrouwbaarheidsniveau op waarvoor u het interval wilt berekenen in a Z-score tabel en vermenigvuldig deze waarde met de Z score. Voor een betrouwbaarheidsniveau van 95 procent is de Z-score is 1,96. In het voorbeeld betekent dit:
Gemiddelde ± Z × SE= 180 pond ± 1,96 × 0,95 = 180 ± 1,86 pond
Hier is ± 1,86 pond het betrouwbaarheidsinterval van 95 procent.
Als u in plaats daarvan dit stukje informatie hebt, samen met de steekproefgrootte en de standaardafwijking, kunt u het betrouwbaarheidsniveau berekenen met behulp van de volgende formule:
Z = 0,5 × grootte van betrouwbaarheidsinterval × √n / s
De grootte van het betrouwbaarheidsinterval is slechts tweemaal de waarde ±, dus in het bovenstaande voorbeeld weten we 0,5 keer dat dit 1,86 is. Dit geeft:
Z = 1.86 × √1000 / 30 = 1.96
Dit geeft ons een waarde voor Z, die u kunt opzoeken in een Z-score tabel om het bijbehorende betrouwbaarheidsniveau te vinden.
Berekening van betrouwbaarheidsintervallen voor kleine monsters
Voor kleine monsters is er een soortgelijk proces voor het berekenen van het betrouwbaarheidsinterval. Trek eerst 1 af van uw steekproefomvang om uw "vrijheidsgraden" te vinden. In symbolen:
df = n −1
Voor een monster n = 10, dit geeft df = 9.
Zoek uw alfawaarde door de decimale versie van het betrouwbaarheidsniveau (d.w.z. uw percentage betrouwbaarheidsniveau gedeeld door 100) af te trekken van 1 en het resultaat te delen door 2, of in symbolen:
α = (1 - decimaal betrouwbaarheidsniveau) / 2
Dus voor een betrouwbaarheidsniveau van 95 procent (0,95):
α = (1 – 0.95) / 2 = 0.05 / 2 = 0.025
Zoek uw alfawaarde en vrijheidsgraden op in een (één staart) t distributietabel en noteer het resultaat. U kunt ook de verdeling door 2 hierboven weglaten en een tweestaart gebruiken t waarde. In dit voorbeeld is het resultaat 2.262.
Bereken, net als in de vorige stap, het betrouwbaarheidsinterval door dit getal te vermenigvuldigen met de standaardfout, die op dezelfde manier wordt bepaald met behulp van uw steekproefstandaardafwijking en steekproefomvang. Het enige verschil is dat in plaats van de Z score, gebruik je de t score.