Inhoud
- Snelle datavisualisatie
- Relatieve overvloed visualiseren
- Complexe gegevenssets moeten mogelijk in intervallen worden ingedeeld
- Frequentietabellen kunnen scheeftrekking en kurtosis verbergen
Frequentietabellen kunnen nuttig zijn voor het beschrijven van het aantal keren dat een bepaald type datum binnen een gegevensset voorkomt. Frequentietabellen, ook wel frequentieverdelingen genoemd, zijn een van de meest basistools voor het weergeven van beschrijvende statistieken. Frequentietabellen worden op grote schaal gebruikt als een directe verwijzing naar de distributie van gegevens; ze zijn gemakkelijk te interpreteren en ze kunnen grote datasets op een redelijk beknopte manier weergeven. Frequentietabellen kunnen helpen om voor de hand liggende trends in een gegevensset te identificeren en kunnen worden gebruikt om gegevens tussen gegevenssets van hetzelfde type te vergelijken. Frequentietabellen zijn echter niet geschikt voor elke toepassing. Ze kunnen extreme waarden verdoezelen (meer dan X of minder dan Y) en ze lenen zich niet voor analyses van de scheeftrekking en kurtosis van de gegevens.
Snelle datavisualisatie
Frequentietabellen kunnen snel uitbijters en zelfs belangrijke trends binnen een gegevensset onthullen met niet veel meer dan een vluchtige inspectie. Een docent kan bijvoorbeeld de cijfers van een student voor een tussentijdse periode weergeven op een frequentietabel om snel een beeld te krijgen van hoe haar klas het in het algemeen doet. Het getal in de frequentiekolom vertegenwoordigt het aantal studenten dat dat cijfer krijgt; voor een klas van 25 studenten kan de frequentieverdeling van ontvangen briefcijfers er ongeveer zo uitzien: Grade Frequency A .............. 7 B ........... ..13 C .............. 3 D .............. 2
Relatieve overvloed visualiseren
Frequentietabellen kunnen onderzoekers helpen om de relatieve overvloed van elke specifieke doelgegevens in hun steekproef te onderzoeken. Relatieve overvloed vertegenwoordigt hoeveel van de gegevensset bestaat uit de doeldata. Relatieve abundantie wordt vaak weergegeven als een frequentiehistogram, maar kan eenvoudig worden weergegeven in een frequentietabel. Overweeg dezelfde frequentieverdeling van tussentijdse cijfers. Relatieve overvloed is gewoon het percentage studenten dat een bepaald cijfer heeft gescoord, en kan nuttig zijn om gegevens te conceptualiseren zonder erover na te denken. Met de toegevoegde kolom die het percentage voorkomen van elk cijfer weergeeft, kunt u bijvoorbeeld gemakkelijk zien dat meer dan de helft van de klas een B heeft gescoord, zonder de gegevens in detail te moeten onderzoeken.
Rangfrequentie Relatieve overvloed (% frequentie) A .............. 7 .............. 28% B ......... .... 13 ............ 52% C .............. 3 ............. 12% D 2 .............. .............. 8%
Complexe gegevenssets moeten mogelijk in intervallen worden ingedeeld
Een nadeel is dat het moeilijk is om complexe gegevenssets te begrijpen die op een frequentietabel worden weergegeven. Grote gegevenssets kunnen worden onderverdeeld in intervalklassen voor eenvoudige visualisatie met behulp van een frequentietabel. Als u bijvoorbeeld aan de volgende 100 mensen vraagt wat uw leeftijd is, krijgt u waarschijnlijk een breed scala aan antwoorden, variërend van drie tot drieënnegentig. In plaats van rijen voor elke leeftijd op te nemen in uw frequentietabel, kunt u de gegevens indelen in intervallen, zoals 0 - 10 jaar, 11 - 20 jaar, 21 - 30 jaar enzovoort. Dit kan ook worden aangeduid als een gegroepeerde frequentieverdeling.
Frequentietabellen kunnen scheeftrekking en kurtosis verbergen
Tenzij weergegeven op een histogram, zijn scheeftrekken en kurtosis van gegevens mogelijk niet direct zichtbaar in een frequentietabel. De scheefheid geeft aan in welke richting uw gegevens neigen. Als cijfers over de X-as van een grafiek worden weergegeven die de frequentie van tussentijdse cijfers voor onze 25 studenten hierboven toont, zou de verdeling scheef trekken naar de As en Bs. Kurtosis vertelt u over de centrale piek van uw gegevens - of deze in lijn zou vallen met een normale verdeling, wat een mooie vloeiende belcurve is, of lang en scherp is. Als je in ons voorbeeld de middellange rangen in grafiek zet, zul je een hoge piek bij B vinden met een scherpe daling in de verdeling van lagere rangen.