Hoe uitbijters te berekenen

Posted on
Schrijver: Lewis Jackson
Datum Van Creatie: 14 Kunnen 2021
Updatedatum: 15 Kunnen 2024
Anonim
Statistics - How to find outliers
Video: Statistics - How to find outliers

Inhoud

Een uitbijter is een waarde in een gegevensset die ver verwijderd is van de andere waarden. Uitbijters kunnen worden veroorzaakt door experimentele of meetfouten of door een populatie met een lange staart. In de eerste gevallen kan het wenselijk zijn om uitbijters te identificeren en ze uit gegevens te verwijderen voordat een statistische analyse wordt uitgevoerd, omdat ze de resultaten kunnen weggooien zodat ze de steekproefpopulatie niet nauwkeurig weergeven. De eenvoudigste manier om uitbijters te identificeren is met de kwartielmethode.

    Sorteer de gegevens in oplopende volgorde. Neem bijvoorbeeld de gegevensset {4, 5, 2, 3, 15, 3, 3, 5}. Gesorteerd is de voorbeeldgegevensset {2, 3, 3, 3, 4, 5, 5, 15}.

    Zoek de mediaan. Dit is het nummer waarbij de helft van de gegevenspunten groter is en de helft kleiner. Als er een even aantal gegevenspunten is, worden de middelste twee gemiddeld. Voor de voorbeeldgegevensset zijn de middelste punten 3 en 4, dus de mediaan is (3 + 4) / 2 = 3,5.

    Vind het bovenste kwartiel, Q2; dit is het gegevenspunt waarop 25 procent van de gegevens groter is. Als de gegevensset even is, gemiddeld de 2 punten rond het kwartiel. Voor de voorbeeldgegevensset is dit (5 + 5) / 2 = 5.

    Vind het onderste kwartiel, Q1; dit is het gegevenspunt waarop 25 procent van de gegevens kleiner is. Als de gegevensset even is, gemiddeld de 2 punten rond het kwartiel. Voor de voorbeeldgegevens, (3 + 3) / 2 = 3.

    Trek het onderste kwartiel af van het hogere kwartiel om het interkwartielbereik, IQ, te krijgen. Voor de voorbeeldgegevensset is Q2 - Q1 = 5 - 3 = 2.

    Vermenigvuldig het interkwartielbereik met 1,5. Voeg dit toe aan het bovenste kwartiel en trek het af van het onderste kwartiel. Elk gegevenspunt buiten deze waarden is een milde uitbijter. Voor de voorbeeldset, 1,5 x 2 = 3; dus 3 - 3 = 0 en 5 + 3 = 8. Dus elke waarde kleiner dan 0 of groter dan 8 zou een milde uitbijter zijn. Dit betekent dat 15 in aanmerking komt als een milde uitbijter.

    Vermenigvuldig het interkwartielbereik met 3. Voeg dit toe aan het bovenste kwartiel en trek het af van het onderste kwartiel. Elk gegevenspunt buiten deze waarden is een extreme uitbijter. Voor de voorbeeldset, 3 x 2 = 6; dus 3 - 6 = –3 en 5 + 6 = 11. Dus elke waarde kleiner dan –3 of groter dan 11 zou een extreme uitbijter zijn. Dit betekent dat 15 in aanmerking komt als een extreme uitbijter.

    Tips