Hoe een correlatiematrix te berekenen

Posted on
Schrijver: John Stephens
Datum Van Creatie: 25 Januari 2021
Updatedatum: 20 November 2024
Anonim
How to Calculate a Correlation Matrix in Excel
Video: How to Calculate a Correlation Matrix in Excel

Inhoud

De correlatie (r) is een maat voor de lineaire relatie tussen twee variabelen. Beenlengte en romplengte zijn bijvoorbeeld sterk gecorreleerd; lengte en gewicht zijn minder sterk gecorreleerd en lengte en naamlengte (in letters) zijn niet gecorreleerd.

Een perfecte positieve correlatie: r = 1. (Wanneer de ene omhoog gaat, gaat de andere omhoog) Een perfecte negatieve correlatie: r = -1 (Wanneer de ene omhoog gaat, gaat de andere omlaag) Geen correlatie: r = 0 (er is geen lineaire verhouding)

Een correlatiematrix is ​​een matrix van vele correlaties.

Een correlatiematrix berekenen met R

    Haal de gegevens op. Als uw gegevens zich in Excel bevinden, is de eenvoudigste methode om het op te slaan als een .csv-bestand (klik in Excel 7 op "Bestand", vervolgens op "Opslaan als" en vervolgens op "andere indelingen." tot CSV (door komma's gescheiden waarden). Elke rij moet gegevens over één onderwerp bevatten en elke kolom moet één variabele zijn.

    Lees de gegevens in R met read.csv. Als uw gegevens bijvoorbeeld in "c: mydisk mydir data.csv" staan, voert u mydata <- read.csv ("c: /mydisk/mydir/data.csv") in.

    Bereken de correlatiematrix met cor (). Bijvoorbeeld: cor (mydata). Of u kunt de correlatiematrix opslaan als een object voor later gebruik, met: cormat <- cor (mydata).

Een correlatiematrix berekenen met SAS

    Haal de gegevens op. SAS kan gegevens in vele formaten lezen. Als u uw gegevens in Excel opslaat, moet u één onderwerp op elke rij en één variabele in elke kolom hebben

    Lees de gegevens in SAS. U kunt de IMPORT-wizard gebruiken om uw gegevens op te halen. Klik op "Bestand" en vervolgens op "Gegevens importeren" en kies vervolgens een gegevenstype met behulp van het vervolgkeuzemenu. Klik op 'Volgende' en navigeer naar uw gegevens en klik vervolgens op 'Voltooien'.

    Bereken de correlatiematrix. Als uw gegevens in SAS worden opgeslagen als mydata, met variabelen VAR1, VAR2 en VAR3, typt u: PROC CORR data = mydata; VAR var1 var2 var3; RENNEN;

    Tips

    waarschuwingen