Het verschil tussen cluster- en factoranalyse

Posted on
Schrijver: Peter Berry
Datum Van Creatie: 14 Augustus 2021
Updatedatum: 13 November 2024
Anonim
Cluster Analysis and Factor Analysis Intro (Marketing Research Module 5, Video 1)
Video: Cluster Analysis and Factor Analysis Intro (Marketing Research Module 5, Video 1)

Inhoud

Clusteranalyse en factoranalyse zijn twee statistische methoden voor gegevensanalyse. Deze twee vormen van analyse worden veel gebruikt in de natuur- en gedragswetenschappen. Zowel clusteranalyse als factoranalyse stelt de gebruiker in staat om delen van de gegevens te groeperen in "clusters" of op "factoren", afhankelijk van het type analyse. Sommige onderzoekers die nieuw zijn in de methoden van cluster- en factoranalyses, kunnen vinden dat deze twee soorten analyses over het algemeen vergelijkbaar zijn. Hoewel clusteranalyse en factoranalyse op het eerste gezicht vergelijkbaar lijken, verschillen ze op vele manieren, ook wat betreft hun algemene doelstellingen en toepassingen.

Doelstelling

Clusteranalyse en factoranalyse hebben verschillende doelstellingen. Het gebruikelijke doel van factoranalyse is om de correlatie in een set gegevens te verklaren en variabelen aan elkaar te relateren, terwijl het doel van clusteranalyse is om heterogeniteit in elke set gegevens aan te pakken. In de geest is clusteranalyse een vorm van categorisatie, terwijl factoranalyse een vorm van vereenvoudiging is.

ingewikkeldheid

Complexiteit is een vraag waarop factoranalyse en clusteranalyse verschillen: de gegevensgrootte beïnvloedt elke analyse anders. Naarmate de gegevensset groeit, wordt clusteranalyse computationeel onhandelbaar. Dit is waar omdat het aantal datapunten in clusteranalyse direct gerelateerd is aan het aantal mogelijke clusteroplossingen. Het aantal manieren om twintig objecten in vier gelijke clusters te verdelen, is bijvoorbeeld meer dan 488 miljoen. Dit maakt directe berekeningsmethoden, inclusief de categorie methoden waartoe factoranalyse behoort, onmogelijk.

Oplossing

Hoewel de oplossingen voor zowel factoranalyse- als clusteranalyseproblemen tot op zekere hoogte subjectief zijn, stelt factoranalyse een onderzoeker in staat om een ​​'beste' oplossing te leveren, in de zin dat de onderzoeker een bepaald aspect van de oplossing kan optimaliseren (orthogonaliteit, gemak van interpretatie enzovoort). Dit is niet het geval voor clusteranalyse, omdat alle algoritmen die mogelijk de beste oplossing voor clusteranalyse kunnen opleveren, rekenkundig inefficiënt zijn. Daarom kunnen onderzoekers die clusteranalyse gebruiken geen optimale oplossing garanderen.

toepassingen

Factoranalyse en clusteranalyse verschillen in hoe ze worden toegepast op echte gegevens. Omdat factoranalyse de mogelijkheid heeft om een ​​onhandige set variabelen te reduceren tot een veel kleinere set factoren, is deze geschikt voor het vereenvoudigen van complexe modellen. Factoranalyse heeft ook een bevestigend gebruik, waarbij de onderzoeker een reeks hypothesen kan ontwikkelen met betrekking tot hoe variabelen in de gegevens zijn gerelateerd. De onderzoeker kan vervolgens factoranalyse uitvoeren op de gegevensset om deze hypothesen te bevestigen of te ontkennen. Clusteranalyse is daarentegen geschikt om objecten volgens bepaalde criteria te classificeren. Een onderzoeker kan bijvoorbeeld bepaalde aspecten van een groep nieuw ontdekte planten meten en deze planten in soortencategorieën plaatsen door clusteranalyse te gebruiken.