Wat zijn hiaten, clusters en uitbijters in wiskunde?

Posted on
Schrijver: Louise Ward
Datum Van Creatie: 11 Februari 2021
Updatedatum: 6 Juli- 2024
Anonim
Examples analyzing clusters, gaps, peaks and outliers for distributions | 6h grade | Khan Academy
Video: Examples analyzing clusters, gaps, peaks and outliers for distributions | 6h grade | Khan Academy

Inhoud

Zakelijke, overheids- en academische activiteiten vereisen bijna altijd het verzamelen en analyseren van gegevens. Een van de manieren om numerieke gegevens weer te geven, is via grafieken, histogrammen en grafieken. Met deze visualisatietechnieken kunnen mensen beter inzicht krijgen in problemen en oplossingen bedenken. Hiaten, clusters en uitbijters zijn kenmerken van gegevensverzamelingen die wiskundige analyse beïnvloeden en gemakkelijk zichtbaar zijn op visuele weergaven.

Gaten in de gegevens

Gaten verwijzen naar ontbrekende gebieden in een gegevensset. Als een wetenschappelijk experiment bijvoorbeeld temperatuurgegevens verzamelt in het bereik van 50 graden Fahrenheit tot 100 graden Fahrenheit, maar niets tussen 70 en 80 graden, zou dat een gat in de gegevensset vertegenwoordigen. Een lijnplot van deze gegevensset zou "x" hebben voor temperaturen tussen 50 en 70 en opnieuw tussen 80 en 100, maar er zou niets tussen 70 en 80 zijn. Onderzoekers kunnen dieper graven en onderzoeken waarom bepaalde gegevenspunten niet verschijnen in een verzameld monster.

Geïsoleerde groepen

Clusters zijn geïsoleerde groepen gegevenspunten. Lijnplots, een van de manieren om gegevenssets weer te geven, zijn lijnen met "x" -tekens boven specifieke nummers om hun frequentie van voorkomen in de gegevensset weer te geven. Een cluster wordt afgebeeld als een verzameling van deze "x" -markeringen in een kleine interval of gegevenssubset. Als de examenscores voor een klas van 10 studenten bijvoorbeeld 74, 75, 80, 72, 74, 75, 76, 86, 88 en 73 zijn, zijn de meeste "x" -markeringen op een lijnplot in de 72- tot 76 score-interval. Dit zou een gegevenscluster vertegenwoordigen. Merk op dat de frequentie voor 74 en 75 twee is, maar voor alle andere scores is het één.

Aan de uitersten

Uitbijters zijn extreme waarden - gegevenspunten die aanzienlijk buiten andere waarden in een gegevensset liggen. Een uitbijter moet aanzienlijk kleiner zijn dan of groter zijn dan de meerderheid van de getallen in een gegevensset. De definitie van "extreem" hangt af van de omstandigheid en een consensus van de analisten die bij het onderzoek zijn betrokken. Uitbijters kunnen slechte gegevenspunten zijn, ook bekend als ruis, of ze kunnen waardevolle informatie bevatten over het fenomeen dat wordt onderzocht en de gegevensverzamelingsmethode zelf. Als klassenscores bijvoorbeeld meestal in het bereik van 70 tot 80 liggen, maar een paar scores in de lage jaren 50, kunnen deze uitschieters zijn.

Alles bij elkaar gezet

Hiaten, uitbijters en clusters in gegevenssets kunnen de resultaten van wiskundige analyse beïnvloeden. Hiaten en clusters kunnen fouten in de gegevensverzamelingsmethodologie vertegenwoordigen. Als een telefonische enquête bijvoorbeeld alleen bepaalde regiocodes peilt, zoals wooncomplexen met een laag inkomen of high-end woonwijken in de voorsteden, en niet een brede dwarsdoorsnede van de bevolking, is de kans groot dat er gaten en clusters in de gegevens zijn . Uitbijters kunnen de gemiddelde of gemiddelde waarde van een gegevensset scheeftrekken. De gemiddelde of gemiddelde waarde van een gegevensset bestaande uit vier getallen - 50, 55, 65 en 90 - is bijvoorbeeld 65. Zonder de uitbijter 90 is het gemiddelde echter ongeveer 57.