Hoe het interkwartielbereik te berekenen

Posted on
Schrijver: Monica Porter
Datum Van Creatie: 22 Maart 2021
Updatedatum: 19 November 2024
Anonim
Centrummaten en spreidingsmaten - Statistiek voor beginners │BijlesHuis
Video: Centrummaten en spreidingsmaten - Statistiek voor beginners │BijlesHuis

Inhoud

Het interkwartielbereik, vaak afgekort als de IQR, vertegenwoordigt het bereik van het 25e percentiel tot het 75e percentiel, of de middelste 50 procent, van een gegeven gegevensset. Het interkwartielbereik kan worden gebruikt om te bepalen wat het gemiddelde prestatiebereik van een test zou zijn: u kunt het gebruiken om te zien waar de meeste mensen op een bepaalde test scoren, of om te bepalen hoeveel geld de gemiddelde werknemer bij een bedrijf elke maand verdient. . Het interkwartielbereik kan een effectiever hulpmiddel voor gegevensanalyse zijn dan het gemiddelde of de mediaan van een gegevensset, omdat u hiermee het spreidingsbereik kunt identificeren in plaats van slechts een enkel getal.

TL; DR (te lang; niet gelezen)

Het interkwartielbereik (IQR) vertegenwoordigt de middelste 50 procent van een gegevensset. Om dit te berekenen, bestelt u eerst uw gegevenspunten van minste naar grootste, en bepaalt u vervolgens uw eerste en derde kwartielposities met behulp van respectievelijk de formules (N + 1) / 4 en 3 * (N + 1) / 4, waarbij N het nummer is van punten in de gegevensset. Trek ten slotte het eerste kwartiel af van het derde kwartiel om het interkwartielbereik voor de gegevensset te bepalen.

Bestel gegevenspunten

Berekening van het interkwartielbereik is een eenvoudige taak, maar voordat u berekent, moet u de verschillende punten van uw gegevensset rangschikken. Om dit te doen, begint u met het bestellen van uw datapunten van de minste naar de grootste. Als uw gegevenspunten bijvoorbeeld 10, 19, 8, 4, 9, 12, 15, 11 en 20 waren, zou u ze als volgt herschikken: {4, 8, 9, 10, 11, 12, 15, 19, 20}. Nadat uw gegevenspunten op deze manier zijn geordend, kunt u doorgaan naar de volgende stap.

Bepaal de positie van het eerste kwartiel

Bepaal vervolgens de positie van het eerste kwartiel met behulp van de volgende formule: (N + 1) / 4, waarbij N het aantal punten in de gegevensset is. Als het eerste kwartiel tussen twee nummers valt, neem dan het gemiddelde van de twee nummers als je eerste kwartielscore. In het bovenstaande voorbeeld, omdat er negen gegevenspunten zijn, zou u 1 tot 9 toevoegen om 10 te krijgen en vervolgens delen door 4 om 2,5 te krijgen. Omdat het eerste kwartiel tussen de tweede en derde waarde valt, zou je het gemiddelde van 8 en 9 nemen om een ​​eerste kwartielpositie van 8,5 te krijgen.

Bepaal de positie van het derde kwartiel

Nadat u uw eerste kwartiel hebt bepaald, bepaalt u de positie van het derde kwartiel met behulp van de volgende formule: 3 * (N + 1) / 4 waarbij N opnieuw het aantal punten in de gegevensset is. Evenzo, als het derde kwartiel tussen twee getallen valt, neem dan gewoon het gemiddelde zoals u zou doen bij het berekenen van de eerste kwartielscore. In het bovenstaande voorbeeld, omdat er negen gegevenspunten zijn, zou u 1 tot 9 toevoegen om 10 te krijgen, vermenigvuldigen met 3 om 30 te krijgen en vervolgens delen door 4 om 7,5 te krijgen. Omdat het eerste kwartiel tussen de zevende en achtste waarde valt, zou je het gemiddelde van 15 en 19 nemen om een ​​derde kwartielscore van 17 te krijgen.

Bereken interkwartielbereik

Nadat u uw eerste en derde kwartiel hebt bepaald, berekent u het interkwartielbereik door de waarde van het eerste kwartiel af te trekken van de waarde van het derde kwartiel. Als u het voorbeeld wilt afwerken dat in de loop van dit artikel is gebruikt, trekt u 8,5 van 17 af om te ontdekken dat het interkwartielbereik van de gegevensset gelijk is aan 8,5.

Voor- en nadelen van IQR

Het interkwartielbereik heeft het voordeel dat het uitbijters aan beide uiteinden van een gegevensset kan identificeren en elimineren. IQR is ook een goede maat voor variatie in gevallen van scheve gegevensdistributie en deze methode voor het berekenen van IQR kan werken voor gegroepeerde gegevenssets, zolang u een cumulatieve frequentiedistributie gebruikt om uw gegevenspunten te organiseren. De interkwartielbereikformule voor gegroepeerde gegevens is hetzelfde als bij niet-gegroepeerde gegevens, waarbij IQR gelijk is aan de waarde van het eerste kwartiel afgetrokken van de waarde van het derde kwartiel. Het heeft echter verschillende nadelen in vergelijking met standaarddeviatie: minder gevoeligheid voor enkele extreme scores en een bemonsteringsstabiliteit die niet zo sterk is als standaarddeviatie.