Inhoud
- Willekeurige bemonstering
- precisie
- Vertrouwensintervallen
- Standaardfout
- Moeilijkheden bij het gebruik van grotere voorbeeldformaten
Steekproefgrootte geeft het aantal waarnemingen aan dat is gedaan om een statistische analyse uit te voeren. Steekproefgroottes kunnen bestaan uit mensen, dieren, voedselbatches, machines, batterijen of welke populatie ook wordt geëvalueerd.
Willekeurige bemonstering
Willekeurige steekproef is een methode waarmee willekeurige steekproeven van een populatie worden verzameld om informatie over de populatie te schatten zonder bevooroordeeld te zijn. Als u bijvoorbeeld wilt weten wat voor soort mensen in een bepaalde stad wonen, moet u verschillende mensen willekeurig interviewen / meten. Als je echter gewoon iedereen uit de bibliotheek zou gebruiken, zou je geen eerlijke / onbevooroordeelde schatting hebben van hoe de algemene bevolking die de stad bezet is, alleen de mensen die naar de bibliotheek gaan.
precisie
Naarmate de steekproefomvang toeneemt, worden schattingen nauwkeuriger. Als we bijvoorbeeld willekeurig tien mannelijke volwassen mensen selecteren, kunnen we vaststellen dat hun gemiddelde lengte 6-voet-3-inch lang is, misschien omdat er een basketbalspeler is die onze schatting opblaast. Als we echter twee miljoen volwassen mannelijke mensen zouden meten, zouden we een betere voorspeller hebben van de gemiddelde lengte van mannen omdat de uitersten in evenwicht zouden zijn en het werkelijke gemiddelde eventuele afwijkingen van het gemiddelde zou overschaduwen.
Vertrouwensintervallen
Wanneer een statisticus een voorspelling doet over een uitkomst, bouwt hij vaak een interval rond zijn schatting. Als we bijvoorbeeld het gewicht van 100 vrouwen meten, kunnen we zeggen dat we 90 procent vertrouwen hebben dat het echte gemiddelde gewicht van vrouwen tussen de 103 en 129 pond ligt. (Dit hangt natuurlijk ook af van andere factoren, zoals variabiliteit in de metingen.) Naarmate de steekproefomvang toeneemt, worden we zelfverzekerder over onze schatting en worden onze intervallen kleiner. Met een miljoen vrouwen kunnen we bijvoorbeeld zeggen dat we 98 procent vertrouwen hebben dat het echte gemiddelde gewicht van vrouwen tussen de 115 en 117 pond ligt. Met andere woorden, naarmate de steekproefomvang toeneemt, neemt ons vertrouwen in onze metingen toe en neemt de omvang van onze betrouwbaarheidsintervallen af.
Standaardfout
Variatie is een maat voor de verspreiding van gegevens rond het gemiddelde. Standaarddeviatie is de vierkantswortel van variatie en helpt bij het schatten welk percentage van de populatie valt tussen een reeks waarden ten opzichte van het gemiddelde. Naarmate de steekproefgrootte toeneemt, neemt de standaardfout, die afhankelijk is van de standaardafwijking en de steekproefgrootte, af. Bijgevolg wordt de nauwkeurigheid van schattingen verhoogd en wordt onderzoek dat op deze schattingen is gebaseerd, als betrouwbaarder beschouwd (met minder foutenrisico).
Moeilijkheden bij het gebruik van grotere voorbeeldformaten
Grotere steekproefgroottes produceren uiteraard betere, nauwkeurigere schattingen over populaties, maar er zijn verschillende problemen met onderzoekers die grotere steekproefgroottes gebruiken. Allereerst kan het moeilijk zijn om een willekeurige steekproef te vinden van mensen die een nieuw medicijn willen proberen. Wanneer u dat doet, wordt het duurder om het medicijn aan meer mensen te verstrekken en meer mensen in de loop van de tijd te volgen. Bovendien kost het meer moeite om een grotere steekproefomvang te verkrijgen en te behouden. Zelfs als grotere steekproefgroottes nauwkeurigere statistieken opleveren, zijn de extra kosten en inspanningen niet altijd nodig, omdat kleinere steekproefgroottes ook significante resultaten kunnen opleveren.