Så här gör du grundläggande dataanalys i Excel
Merparten av tiden när du kör statistik vill du använda statistisk programvara. Dessa verktyg är byggda för att göra beräkningar som t-tester, chi-square test, korrelationer, och så vidare. Excel är inte avsett för dataanalys. Men det betyder inte att du inte kan göra det.
Tyvärr är inte Excel statistiska funktioner intuitiva. Och de ger dig vanligtvis esoteriska resultat. Så istället för att använda statistikfunktioner ska vi använda Go-to Excel-statistiktillägget: Data Analysis Toolpak.
Toolpak, trots dess ganska olyckliga stavning, innehåller ett brett utbud av användbar statistikfunktionalitet. Låt oss se vad vi kan göra med Excel-statistik.
Lägga till Excel Data Analysis Toolpak
Medan du kan gör statistik utan Data Analysis Toolpak, det är mycket lättare med det. För att installera Toolpak i Excel 2016, gå till Arkiv> Alternativ> tillägg.
Klick Gå bredvid “Hantera: Excel-tillägg.”
Markera rutan bredvid i det resulterande fönstret Analysverktygsspak och klicka sedan på ok.
Om du korrekt lagt till Data Analysis Toolpak i Excel ser du en Dataanalys knapp i Data flik, grupperade i Analys sektion:
Om du vill ha mer ström måste du kolla in externs tilläggsverktyg Power Up Excel med 10 tillägg för att bearbeta, analysera och visualisera data som en Pro Power Up Excel med 10 tillägg för att bearbeta, analysera och visualisera data Som en Pro Vanilla Excel är fantastiskt, men du kan göra det ännu kraftfullare med tillägg. Oavsett vilken data du behöver bearbeta är chansen att någon skapade en Excel-app för den. Här är ett urval. Läs mer .
Beskrivande statistik i Excel
Oavsett vilket statistiskt test du kör, vill du förmodligen få Excels beskrivande statistik först. Detta ger dig information om medel, medianer, varians, standardavvikelse och fel, kurtosis, skewness och en mängd andra figurer.
Löpande beskrivande statistik i Excel är lätt. Klick Dataanalys På fliken Data väljer du Beskrivande statistik, och välj ditt ingångsområde. Klicka på pilen bredvid fältet för ingångsintervall, klicka och dra för att välja dina data och tryck på Stiga på (eller klicka på motsvarande nedåtpil), som i GIF nedan.
Därefter måste du berätta för Excel om din data har etiketter, om du vill ha utmatningen i ett nytt ark eller på samma och om du vill ha sammanfattande statistik och andra alternativ.
Efter det, träffa ok, och du får din beskrivande statistik:
Studentens t-test i Excel
De t-testet är en av de mest grundläggande statistiska testerna, och det är lätt att beräkna i Excel med Toolpak. Klicka på Dataanalys knappen och bläddra ner tills du ser t-testalternativ.
Du har tre val:
- t-Test: Parat Två Prov För Medel bör användas när dina mätningar eller observationer var parade. Använd detta när du tog två mätningar av samma ämnen, till exempel mätning av blodtryck före och efter ingrepp.
- t-Test: Två-Prov antagande lika avvikelser ska användas när dina mätningar är oberoende (vilket vanligtvis betyder att de gjordes på två olika ämnesgrupper). Vi diskuterar “lika avvikelser” del i ett ögonblick.
- t-Test: Två-Prov antagande ojämlika variationer är också för oberoende mätningar, men används när dina avvikelser är ojämlika.
För att testa om varianterna av dina två prover är lika måste du köra ett F-test. Hitta F-test två-prov för variationer I listan Analysverktyg väljer du den och klickar på ok.
Ange dina två dataset i rutorna för ingångsintervall. Lämna alfabetet till 0,05 om du inte har anledning att ändra det - om du inte vet vad det betyder, lämna bara. Slutligen klickar du på ok.
Excel ger dig resultaten i ett nytt ark (om du inte valt Utmatningsområde och en cell i ditt aktuella ark):
Du tittar på P-värdet här. Om det är mindre än 0,05, har du ojämna avvikelser. Så att springa t-test, bör du använda alternativet för ojämna avvikelser.
Att köra a t-test, välj det lämpliga testet i fönstret Analysverktyg och välj båda uppsättningarna av dina data på samma sätt som du gjorde för F-testet. Lämna alfavärdet på 0,05 och träffa ok.
Resultaten inkluderar allt du behöver för att rapportera för en t-test: medel, grader av frihet (df), t statistik och P-värden för både en- och två-tailed test. Om P-värdet är mindre än 0,05 är de två proven väsentligt olika.
Om du inte är säker på att du ska använda en-eller två-tailed t-test, kolla in denna förklarare från UCLA.
ANOVA i Excel
Excel Data Analysis Toolpak erbjuder tre typer av variansanalyser (ANOVA). Tyvärr ger det dig inte möjlighet att köra nödvändiga uppföljningstester som Tukey eller Bonferroni. Men du kan se om det finns ett förhållande mellan några olika variabler.
Här är de tre ANOVA-testerna i Excel:
- ANOVA: Enfaktor analyserar varians med en beroende variabel och en oberoende variabel. Det är att föredra att använda flera t-tester när du har mer än två grupper.
- ANOVA: Tvåfaktor med replikering liknar de parade t-testa; Det innebär flera mått på enskilda ämnen. De “två-faktor” En del av detta test indikerar att det finns två oberoende variabler.
- ANOVA: Tvåfaktor utan replikering innefattar två oberoende variabler men ingen replikering i mätning.
Vi ska gå över enkelfaktoranalysen här. I vårt exempel tittar vi på tre uppsättningar nummer, märkta “Intervention 1,” “Intervention 2,” och “Intervention 3.” För att köra en ANOVA klickar du på Dataanalys, välj sedan ANOVA: Enfaktor.
Välj ingångsintervall och se till att Excel berättar om dina grupper är i kolumner eller rader. Jag har också valt “Etiketter i första raden” här så att gruppnamnen visas i resultaten.
Efter att ha slagit ok, vi får följande resultat:
Observera att P-värdet är mindre än 0,05, så vi har ett betydande resultat. Det betyder att det finns en signifikant skillnad mellan minst två av grupperna i testet. Men eftersom Excel inte ger test för att bestämma som grupper skiljer sig, det bästa du kan göra är att titta på medelvärdena som visas i sammanfattningen. I vårt exempel ser Intervention 3 ut som det är förmodligen den som skiljer sig från.
Detta är inte statistiskt ljud. Men om du bara vill se om det finns en skillnad, och se vilken grupp som förmodligen orsakar det, kommer det att fungera.
Tvåfaktor ANOVA är mer komplicerad. Om du vill veta mer om när du ska använda tvåfaktormetoden, se den här videon från Sophia.org och “utan replikering” och “med replikering” exempel från Real Statistics.
Korrelation i Excel
Att beräkna korrelation i Excel är mycket enklare än t-test eller en ANOVA. Använd Dataanalys knappen för att öppna fönstret Analysverktyg och välj Korrelation.
Välj ditt ingångsområde, identifiera dina grupper som kolumner eller rader och berätta för Excel om du har etiketter. Efter det, träffa ok.
Du får inte några viktiga åtgärder, men du kan se hur varje grupp är korrelerad med de andra. Ett värde av en är en absolut korrelation, vilket indikerar att värdena är exakt densamma. Ju närmare korrelationsvärdet desto starkare är korrelationen.
Regression i Excel
Regression är en av de vanligaste statistiska testerna i branschen, och Excel packar en överraskande mängd kraft för denna beräkning. Vi kör en snabb multipel regression i Excel här. Om du inte är bekant med regression, kolla in HBRs guide för att använda regression för företag.
Låt oss säga att vår beroende variabel är blodtryck, och våra två oberoende variabler är vikt och saltintag. Vi vill se vilken som är en bättre förutsägare för blodtryck (eller om de är båda bra).
Klick Dataanalys och välj regression. Du måste vara försiktig när du fyller i rutorna för ingångsintervall den här gången. De Input Y Range rutan bör innehålla din enda beroende variabel. De Input X Range rutan kan innehålla flera oberoende variabler. För en enkel regression, oroa dig inte om resten (men kom ihåg att berätta om Excel om du markerade etiketter).
Så här ser vår beräkning ut:
Efter att ha slagit ok, du får en stor lista över resultat. Jag har markerat P-värdet här för både vikt och saltintag:
Som du kan se är P-värdet för vikt större än 0,05, så det finns ingen signifikant relation där. P-värdet för salt är dock under 0,05, vilket indikerar att det är en bra förutsägelse för blodtryck.
Om du planerar att presentera din regressionsdata, kom ihåg att du kan lägga till en regressionsrad i en scatterplot i Excel. Det är ett utmärkt visuellt hjälpmedel Så här visualiserar du din dataanalys med Excels verktyg. Så här visualiserar du din dataanalys med Excels verktyg. Excel dödar det med sina avancerade datahanteringsfunktioner. När du har använt ett av de nya verktygen kommer du att vilja ha dem alla. Bli en mästare i din dataanalys med elverktyg! Läs mer för denna analys.
Excel statistik: överraskande kapabel
Medan Excel inte är känt för sin statistiska kraft, packar det faktiskt några riktigt användbara funktioner. Speciellt när du laddar ner Data Analysis Toolpak-statistiktillägget. Jag hoppas att du har lärt dig hur du använder Toolpak, och att du nu kan leka på egen hand för att ta reda på hur du använder mer av funktionerna.
Med detta nu under ditt bälte, ta dina Excel-färdigheter till nästa nivå med våra artiklar om hur du använder Excels sökfunktion för mer datakrypning, mastering av IF-uttalanden i Excel och lägga till listrutor som celler i Excel.
Jag har också länkat till andra webbplatser som har bra statistikhandledning där vi var tvungna att hoppa över förvirrande begrepp. Var noga med att kolla in vår guide till gratis statistikresurser Läs statistik gratis med dessa 6 resurser Läs statistik gratis med dessa 6 resurser Statistik har ett rykte för ett ämne som är svårt att förstå. Men att lära av rätt resurs hjälper dig att förstå undersökningsresultat, valrapporter och dina statistikuppgifter på nolltid. Läs mer också.
Utforska mer om: Microsoft Excel, kalkylblad.