Vad är dataanalys och varför är det viktigt?
Dataanalys är processen med att utvärdera data med hjälp av analytiska och statistiska verktyg för att upptäcka användbar information och hjälp i beslutsfattandet. Det finns flera metoder för analys av data, inklusive data mining, textanalys, affärsinformation och datavisualisering.
Hur utförs dataanalys?
Dataanalys är en del av en större process för att härleda affärsinformation. Processen innefattar ett eller flera av följande steg:
- Definiera mål: Varje studie måste börja med en uppsättning tydligt definierade affärsmål. Många av de beslut som fattas under resten av processen beror på hur tydligt målen för studien har fastställts.
- Posing Questions: Ett försök görs att ställa en fråga i problemområdet. Till exempel kommer röda sportbilar i olyckor oftare än andra?
- Datainsamling: Uppgifter som är relevanta för frågan måste samlas in från lämpliga källor. I exemplet ovan kan data samlas in från en mängd olika källor, inklusive: DMV- eller polisolyckorapporter, försäkringsskador och sjukhusinformation. När data samlas in med hjälp av surverys, behövs ett frågeformulär som ska presenteras för ämnena. Frågorna ska lämpligen modelleras för den statistiska metoden som används.
- Data Wrangling: Rådata kan samlas in i flera olika format. Den insamlade data måste rengöras och konverteras så att dataanalysverktyg kan importera det. För vårt exempel kan vi få DMV-olycksrapporter som textfiler, försäkringsanspråk från en relationsdatabas och information om sjukhusinformation som ett API. Dataanalysen måste samla dessa olika dataformer och konvertera den till en form som är lämplig för analysverktygen.
- Dataanalys: Detta är steget där den rengjorda och aggregerade data importeras till analysverktyg. Med dessa verktyg kan du utforska data, hitta mönster i den och fråga och svara om vad som händer. Det här är processen med vilken känsla görs av data som samlas in i forskning genom korrekt tillämpning av statistiska metoder.
- Ritnings slutsatser och förutsägelser: Detta är steget där, efter tillräcklig analys, slutsatser kan dras av data och lämpliga förutsägelser kan göras. Dessa slutsatser och predications kan sedan sammanfattas i en rapport som levereras till slutanvändare.
Låt oss nu titta i detalj på metoderna för dataanalys i synnerhet.
Data Mining
Data mining är en metod för dataanalys för att upptäcka mönster i stora datamängder med hjälp av metoderna Hur blir en datavetenskapare Hur man blir en datavetenskapare Datavetenskap har gått från en nymodad term i 2007 för att vara en av de mest eftertraktade discipliner idag. Men vad gör en datavetenskapare? Och hur kan du bryta in i fältet? Läs mer om statistik, artificiell intelligens, maskininlärning och databaser. Målet är att omvandla rådata till begriplig affärsinformation. Dessa kan innefatta identifierande grupper av dataposter (även känd som gruppanalys) eller identifiera anomolier och beroenden mellan datagrupper.
Tillämpningar av data mining:
- Anomoly-detektion kan hantera enorma mängder data (“stora data”) och identifierar automatiskt outlier-fall, eventuellt för uteslutning från beslutsfattande eller upptäckt av bedrägeri (t.ex. bankbedrägerier).
- Lärande kundköpsvanor. Maskininlärningstekniker kan användas för att modellera kundernas köpvanor och bestämma ofta köpta föremål.
- Clustering kan identifiera tidigare okända grupper inom data.
- Klassificering används för att automatiskt klassificera dataposter i fördefinierade fack. Ett vanligt exempel är att klassificera e-postmeddelanden som “skräppost” eller “ej spam” och få systemet att lära av användaren.
Text Analytics
Textanalys är processen att härleda användbar information från text. Det uppnås genom att bearbeta ostrukturerad textinformation, extrahera meningsfull numerisk spararid med textoperationer i Excel Spara tid med textoperationer i Excel Excel kan göra magi med siffror och det kan hantera tecken lika bra. Den här handboken visar hur man analyserar, konverterar, ersätter och redigerar text i kalkylblad. Dessa grunder gör att du kan utföra komplexa omvandlingar. Läs mer index från informationen och gör informationen tillgänglig för statistiska och maskininlärningsalgoritmer för vidare bearbetning.
Textminingprocessen inkluderar ett eller flera av följande steg:
- Samla in information från olika källor, inklusive webb, filsystem, databas osv.
- Lingvistisk analys inklusive naturlig språkbehandling.
- Mönsterigenkänning (t.ex. igenkänning av telefonnummer, e-postadresser etc.)
- Extrahera sammanfattad information från texten, till exempel relativa frekvenser av orden, bestämning av likheter mellan dokument etc..
Exempel på textanalysprogram:
- Analysera analysundersökningar med öppna svar. Dessa undersökningar är av förklarande karaktär och inkluderar öppna frågor relaterade till ämnet i fråga. Respondenterna kan sedan uttrycka sina åsikter utan att vara begränsade till ett visst svarformat.
- Analys av e-post, dokument etc. för att filtrera bort “skräp”. Detta inkluderar även automatisk klassificering av meddelanden i fördefinierade rutor för routning till olika avdelningar.
- Undersök konkurrenter genom att krypa på deras webbplatser. Detta kan användas för att härleda information om konkurrenternas verksamhet.
- Säkerhetsapplikationer som kan hantera loggfiler för intrångsdetektering.
Business Intelligence
Business Intelligence Hur man använder Cortana för att analysera data med Power BI Hur man använder Cortana för att analysera data med Power BI Vilka förenklar din dataanalys? Få snabba svar från Cortana med den här guiden. Read More omvandlar data till användbar intelligens för affärsändamål och kan användas i en organisations strategiska och taktiska beslutsfattande. Det ger ett sätt för människor att undersöka trender från insamlade data och härleda insikter från det.
Några exempel på affärsintelligens som används idag:
- En organisations operativa beslut som produktplacering och prissättning.
- Identifiera nya marknader, bedöma produktens efterfrågan och lämplighet för olika marknadssegment.
- Budgetering och rullande prognoser.
- Använda visuella verktyg som värmekartor, pivottabeller och geografisk kartläggning.
Datavisualisering
Datavisualisering Omedelbar visualisera data och information med Google Fusion-tabeller Visualisera omedelbart data och information med Google Fusion-tabeller Oavsett om du sätter ihop en rapport för arbete, eller om du bara vill representera information på din blogg på ett grafiskt sätt kan Google Fusion Tables hjälp. Google Fusion är faktiskt en funktion inbäddad i ... Läs mer hänvisar helt enkelt till den visuella representationen av data. I samband med dataanalys innebär det att man använder verktyg för statistik, sannolikhet, pivottabeller och andra artefakter för att presentera data visuellt. Det gör komplexa data mer begripliga och användbara.
Ökande datamängder genereras av ett antal sensorer i miljön (kallad “Internet av saker” eller “IOT”). Denna data (hänvisad till som “stora data”) presenterar utmaningar i förståelse som kan lindras genom att använda verktygen för datavisualisering. Datavisualisering används i följande applikationer.
- Utdragning av sammanfattande data från IOTs rådata.
- Använd ett stapeldiagram för att representera försäljningsprestanda över flera kvartaler.
- Ett histogram visar distributionen av en variabel som inkomst genom att dividera intervallet i rutor.
Visualiseringen av Googles dataset 7 Fantastiska sökresultat för Google Dataset du kan använda nu 7 Fantastiska sökresultat för Google Dataset du kan använda nu Googles nya dataset-sökmotor hjälper forskare att hälla genom stora dataset från offentliga källor. Read More är ett bra exempel på hur stora data visuellt kan styra beslutsfattandet.
Dataanalys i granskning
Dataanalys används för att utvärdera data med statistiska verktyg för att hitta användbar information. En mängd olika metoder används för detta ändamål, inklusive data mining, textanalys, affärsinformation och datavisualisering.
Har du använt dataanalys i din organisation för att modellera något? Hur var din erfarenhet? Har du några användbara insikter att erbjuda? Vänligen meddela oss i kommentarerna nedan.
Utforska mer om: Big Data, .