Inhoud
Het vinden van de sterkte van de associatie tussen twee variabelen is een belangrijke vaardigheid voor alle soorten wetenschappers. Als twee variabelen met elkaar zijn gecorreleerd, geeft dit aan dat er een verband tussen is. Een positieve correlatie betekent dat wanneer de ene variabele toeneemt, de andere dat ook doet, en een negatieve correlatie betekent dat wanneer de ene variabele toeneemt, de andere afneemt. Correlaties bewijzen geen oorzakelijk verband, hoewel het mogelijk is dat verdere tests een oorzakelijk verband tussen de variabelen zullen aantonen. De correlatiecoëfficiënt R toont de sterkte van de relatie tussen de twee variabelen, en of het een positieve of een negatieve correlatie is.
TL; DR (te lang; niet gelezen)
Noem een variabele X en een variabele Y. Bereken de waarde van R met behulp van de formule:
R = ÷ √ {}
Waar n is uw steekproefgrootte.
Maak een tabel met uw gegevens. Dit moet één kolom bevatten voor het deelnemersnummer, één kolom voor de eerste variabele (gelabeld X) en één kolom voor de tweede variabele (gelabeld Y). Als u bijvoorbeeld wilt kijken of er een verband is tussen lengte en schoenmaat, identificeert één kolom elke persoon die u meet, één kolom toont de lengte van elke persoon en een andere toont hun schoenmaat. Maak drie extra kolommen, een voor xy, een voor X2 en een voor Y2.
Gebruik uw gegevens om de drie extra kolommen in te vullen. Stel je bijvoorbeeld voor dat je eerste persoon 75 centimeter lang is en maat 12 voet heeft. De X (hoogte) kolom zou 75 weergeven, en de Y (schoenmaat) kolom zou 12. weergeven. Je moet vinden xy, X2 en Y2. Dus met dit voorbeeld:
xy = 75 × 12 = 900
X2 = 752 = 5,625
Y2 = 122 = 144
Voer deze berekeningen uit voor elke persoon voor wie u gegevens hebt.
Maak een nieuwe rij onderaan uw tabel voor de bedragen van elke kolom. Voeg alle X waarden, alle Y waarden, alle xy waarden, alle X2 waarden en alle Y2 waarden en plaats vervolgens de resultaten onderaan de overeenkomstige kolom in uw nieuwe rij. U kunt uw nieuwe rij 'som' noemen of een sigma (Σ) symbool gebruiken.
Je vindt R van uw gegevens met behulp van de formule:
R = ÷ √ {}
Dit ziet er een beetje ontmoedigend uit, dus je kunt het in twee delen opsplitsen, die we zullen noemen s en t.
s = n (Σxy) - (Σx) (Σy)
t = √ {}
In deze vergelijkingen n is het aantal deelnemers dat u heeft (uw steekproefomvang). De rest van de delen van de vergelijking zijn de bedragen die u in de laatste stap hebt berekend. Dus voor s, vermenigvuldig de grootte van uw steekproef met de som van de xy en trek vervolgens de som van de af X kolom vermenigvuldigd met de som van de Y kolom hieruit.
Voor t, er zijn vier hoofdstappen. Eerst berekenen n vermenigvuldigd met de som van uw X2 kolom en trek vervolgens de som van uw af X kolom in het kwadraat (vermenigvuldigd met zichzelf) van deze waarde. Ten tweede, doe precies hetzelfde, maar met de som van de Y2 kolom en de som van de Y kolom in plaats van de X delen (d.w.z. n × Σy2 -). Ten derde, vermenigvuldig deze twee resultaten (voor de Xs en Ys) samen. Ten vierde, neem de vierkantswortel van dit antwoord.
Als je in delen hebt gewerkt, kun je berekenen R zo simpel R = s ÷ t. U krijgt een antwoord tussen −1 en 1. Een positief antwoord vertoont een positieve correlatie, waarbij iets meer dan 0,7 over het algemeen als een sterke relatie wordt beschouwd. Een negatief antwoord vertoont een negatieve correlatie, waarbij alles boven -0.7 als een sterke negatieve relatie wordt beschouwd. Evenzo wordt ± 0,5 als een gematigde relatie beschouwd en wordt ± 0,3 als een zwakke relatie beschouwd. Alles in de buurt van 0 vertoont een gebrek aan correlatie.