Hur man beräknar korrelationskoefficienten i Excel (2 enkla sätt)

Excel är ett kraftfullt verktyg som har fantastiska funktioner och funktioner när du arbetar med statistik.

Att hitta en korrelation mellan två dataserier är en av de vanligaste statistiska beräkningarna när man arbetar med stora datamängder,

Jag arbetade som finansanalytiker för några år sedan, och även om vi inte var starkt involverade i statistiska data, var det fortfarande något vi måste göra för att hitta korrelation.

I denna handledning kommer jag att visa dig två riktigt enkla sätt att beräkna korrelationskoefficienten i Excel. Det finns redan en inbyggd funktion för att göra detta, och du kan också använda Data Analysis Toolpak.

Så låt oss komma igång!

Vad är korrelationskoefficienten?

Eftersom detta inte är en statistikklass, låt mig kort förklara vad som är korrelationskoefficienten, och sedan går vi vidare till avsnittet där vi beräknar korrelationskoefficienten i Excel.

En korrelationskoefficient är ett värde som berättar hur nära två dataserier är relaterade.

Ett vanligt exempel är vikten och höjden på 10 personer i en grupp. Om vi ​​beräknar korrelationskoefficienten för höjd- och viktdata för dessa personer får vi ett värde mellan -1 och 1.

Ett värde mindre än noll indikerar en negativ korrelation, vilket innebär att om höjden ökar så minskar vikten, eller om vikten ökar då höjden minskar.

Och ett värde mer än noll indikerar en positiv korrelation, vilket innebär att om höjden ökar så ökar vikten, och om höjden minskar så minskar vikten.

Ju närmare värdet är 1, desto starkare är den positiva korrelationen. Så ett värde på .8 skulle indikera att höjd- och viktdata är starkt korrelerade.

Obs: Det finns olika typer av korrelationskoefficienter och statistik, men i den här självstudien kommer vi att titta på den vanligaste som är Pearson -korrelationskoefficienten

Låt oss nu se hur vi beräknar denna korrelationskoefficient i Excel.

Beräkning av korrelationskoefficient i Excel

Som jag nämnde finns det ett par sätt att beräkna korrelationskoefficienten i Excel.

Använda CORREL Formula

CORREL är en statistikfunktion som introducerades i Excel 2007.

Antag att du har en datauppsättning som visas nedan där du vill beräkna korrelationskoefficienten mellan höjden och vikten på 10 personer.

Nedan är formeln som skulle göra detta:

= CORREL (B2: B12, C2: C12)

Ovanstående CORREL -funktion tar två argument - serien med höjddatapunkterna och serien med viktdatapunkterna.

Och det är allt!

Så snart du trycker på enter, gör Excel alla beräkningar i back-end det ger dig ett enda Pearson-korrelationskoefficienttal.

I vårt exempel är det värdet lite över .5, vilket indikerar att det finns en ganska stark positiv korrelation.

Denna metod används bäst om du har två serier och allt du vill ha är korrelationskoefficienten.

Men om du har flera serier och du vill ta reda på korrelationskoefficienten för alla dessa serier, kan du också överväga att använda dataanalysverktygspaketet i Excel (nedan)

Använda Data Analysis Toolpak

Excel har ett Data Analysis Toolpak som kan användas för att snabbt beräkna olika statistikvärden (inklusive att få korrelationskoefficienten).

Men Data Analysis Toolpak är inaktiverat som standard i Excel. Så det första steget skulle vara att aktivera dataanalysverktyget tillbaka och sedan använda det för att beräkna Pearson -korrelationskoefficienten i Excel.

Aktivera Tool Analysis Toolpak

Nedan följer stegen för att aktivera Data Analysis Toolpak i Excel:

  1. Klicka på fliken Arkiv
  2. Klicka på Alternativ
  3. Klicka på alternativet Tillägg i sidofältet i dialogrutan Excel-alternativ som öppnas
  4. I rullgardinsmenyn Hantera väljer du Excel-tillägg
  5. Klicka på Kör. Detta öppnar tilläggsdialogrutan
  6. Kontrollera alternativet Analysis Toolpak
  7. Klicka på Ok

Stegen ovan skulle lägga till en ny grupp på fliken Data i Excel -bandet som heter Analysis. Inom denna grupp skulle du ha alternativet Dataanalys

Beräkning av korrelationskoefficienten med hjälp av Data Analysis Toolpak

Nu när du har analysverktyget tillgängligt i bandet, låt oss se hur vi beräknar korrelationskoefficienten med det.

Antag att du har en datamängd som visas nedan och du vill ta reda på sambandet mellan de tre serierna (höjd och vikt, höjd och inkomst, och vikt och inkomst)

Nedan följer stegen för att göra detta:

  1. Klicka på fliken Data
  2. Klicka på alternativet Dataanalys i gruppen Analys
  3. Klicka på "Korrelation" i dialogrutan Dataanalys som öppnas
  4. Klicka på OK. Detta öppnar dialogrutan Korrelation
  5. För inmatningsområde, välj de tre serierna - inklusive rubrikerna
  6. För "Grupperad efter", se till att "Kolumner" är valt
  7. Välj alternativet - "Etikett på första raden". Detta kommer att se till att data i de resulterande data skulle ha samma rubriker och det skulle vara mycket lättare att förstå resultaten
  8. I utmatningsalternativen väljer du var du vill ha den resulterande tabellen. Jag kommer att gå med cell G1 på samma arbetsblad. Du kan också välja att få dina resultat i ett nytt kalkylblad eller en ny arbetsbok
  9. Klicka på OK

Så snart du gör detta skulle Excel beräkna korrelationskoefficienten för alla serier och ge dig en tabell enligt nedan:

Observera att den resulterande tabellen är statisk och inte uppdateras om någon av datapunkterna i tabellen ändras. Vid förändringar måste du upprepa ovanstående steg igen för att skapa en ny tabell över korrelationskoefficienter.

Så det här är två snabba och enkla metoder för att beräkna korrelationskoefficienten i Excel.

Jag hoppas att du tyckte att denna handledning var användbar!

Du kommer att bidra till utvecklingen av webbplatsen, dela sidan med dina vänner

wave wave wave wave wave