Bevis någonting med statistik som använder spurious korrelationer [konstig och underbar webb]
Mark Twain sa en gång, “Det finns lögner, dömda lögner och statistik.” Poängen är att statistik kan användas för att bevisa någonting, oavsett om de är gjorda på plats eller genereras av verkliga data.
Du behöver inte heller ta mitt ord för det, eftersom en webbplats som heter Spurious Correlations, visar perfekt hur statistiken kan böjas och formas för att passa en viss bias. Det visar sig att statistiken är faktiskt ganska värdelös.
Hemsidan
Spurious Correlations är brainchild av Tyler Vigen, en kriminologistudent vid Harvard Law School. Vigen fascineras av empirisk forskning, så han skapade en enkel hemsida dedikerad till att jämföra variabler, och hur nära de korrelerar med varandra.
Det finns en ny av dessa Spurious Correlations publicerade på webbplatsen varje dag, med över 24 000 som hittills publicerats. Förutom de som genereras automatiskt kan besökarna upptäcka sina egna genom att välja två olika dataset för att jämföra med varandra.
Prova det, du kommer bli förvånad över hur beroendeframkallande allting är.
Exemplen
Följande är fem exempel på Spurious Correlations som valts något slumpmässigt, även om Nicolas Cage alltid var avsedd att göra ett utseende. För att han är Nicolas Cage.
Kom ihåg att inget av dessa exempel visar något annat än det faktum att statistik kan användas för att dra slutsatser som inte existerar. Men det är väldigt roligt att föreställa sig varför dessa statistik matchar.
Pengarna som spenderas på husdjur i USA är korrelerade med antalet advokater i Kalifornien. Skämmer bort husdjur 6 Apps som gör din iPad till en överdriven, ännu en enorm kattleksak 6 Apps som gör din iPad till en överprissatt ännu en fantastisk kattleksak Katter är fantastiska. Vi är alla överens om det. Jag måste dock erkänna att även för en kattälskare som jag, verkade tanken att låta mina katter leka med min dyrbara iPad en lite galen ... Läs mer stämma sina rika ägare? Eller är det bara en ren slump?
Antalet personer som drunknade genom att falla i en simbassäng korrelerar med antalet filmer där Nicolas Cage har dykt upp. Cage har några galna handlingar, men de leder inte säkert till drunkningar.
Den totala intäkterna från arkader i USA är korrelerade med antalet datavetenskap som är öppna för alla: 6 datavetenskapsprojekt från MIT Media Lab som du kan prova idag öppen för alla: 6 datavetenskapsprojekt från MIT Media Lab som du kan försöka idag Varje stor utbildningsinstitution har en gemensam kvalitet - innovation. MIT Media Labs är ett centre av excellens som främjar mångfacetterat tänkande och dess “huvuddirektivet” är att fokusera på utvecklingen som finns på ... Läs mer doktorander tilldelade i USA Det kan tänkligen vara en länk, men det är mer troligt att dessa två saker bara växte i popularitet tillsammans.
Antalet tyska personbilar som säljs i USA är korrelerade med antalet självmord genom att krascha av motorfordon i USA. Kör en tysk billedning för att känna sig deprimerad och självmordsmässig. 7 Online-resurser för att hjälpa de som är deprimerade och självmordsförsörjande 7 Online-resurser Att hjälpa dem som är deprimerade och självmord Även om jag är chef för MakeUseOf, har jag en stor funktionsnedsättning i mitt liv som är klinisk depression. Det började tillbaka 2002, som en depression relaterad till stress i mitt jobb, ... Läs mer? Vi misstänker inte.
Skilsmässan i Maine korrelerar med konsumtionen av margarine per capita i USA. Kanske borde den som ansvarar för livsmedelsbutiken ha köpt smör istället.
Lektionen
Spurious Correlations är, på sidan av det, en fin liten hemsida som kan distrahera dig i några minuter. Men det är mer än så. Det är också en påminnelse att statistik inte ska accepteras på nominellt värde. I stället borde de undersökas närmare för att de verkligen stack upp.
Vi har nog alla sett rubriker på tidningar som förklarar en länk mellan en slumpmässig trend och en annan. Tabloid-journalister och redaktörer älskar dessa saker, eftersom de är en billig gimmick garanterad att sälja tidningar. Men de är ofta antingen oskyldigt vilseledande, eller helt och avsiktligt falskt. Bulls ** t, med andra ord.
Och nu, tack vare Spurious Correlations, vet vi varför det är så.
Slutsatser
Spendera lite tid på Spurious Correlations och se vilka två helt ouppkopplade datasatser du kan matcha. Och kom tillbaka hit och berätta vad du hittade. Känn dig inte skyldig i att sprida felaktig information; Tabloidtidningar gör det varje dag i veckan.
Bildkrediter: Simon Cunningham via Flickr, Ken Teegardin via Flickr, Ben Brown via Flickr