15 massiva online databaser du borde veta om

15 massiva online databaser du borde veta om / internet

Tänk på dina favorit öppna databaser.

Jag är säker på att Wikipedia och IMDb omedelbart kommer i åtanke, men du kanske inte har behov av all den kunskapen någonsin, eller en omfattande databas med allt underhållning. Ibland behöver du lite VLDB (Very Large Data Base) smak. Något att krydda din dataanalys Hur man blir en datavetenskapare Hur man blir en datavetenskapare Datavetenskap har gått från en nymodad term i 2007 till att vara en av de mest eftertraktade disciplinerna idag. Men vad gör en datavetenskapare? Och hur kan du bryta in i fältet? Läs mer . Något att sätta “stor” i dina stora data. Whelp, bra person, du är på rätt ställe.

Här är 15 massiva online databaser Så vad är en databas, hur som helst? [MakeUseOf Explains] Så vad är en databas, hur som helst? [MakeUseOf Förklarar] För en programmerare eller en teknikentusiast är begreppet en databas något som verkligen kan tas för givet. Men för många människor är begreppet en databas i sig lite utländsk ... Läs mer du kan komma åt och analysera gratis Excel Vs. Access - Kan ett kalkylblad ersätta en databas? Excel Vs. Access - Kan ett kalkylblad ersätta en databas? Vilket verktyg ska du använda för att hantera data? Access och Excel har båda data filtrering, sortering och frågande. Vi visar dig vilken som passar bäst för dina behov. Läs mer, eller bara granska på fritiden.

1000 genom

2003 års färdigställande av Human Genome Project (HGP) var bara början. Sedan dess har framsteg inom sekvenseringstekniken väsentligt minskat per personkostnaden, vilket möjliggör en omfattande expansion av HGP från den ursprungliga forskningsbasen av tjugo universitetslaboratorier till ett spridande, globaliserat nätverk av sammankopplade genomkartläggningsanläggningar.

Du kan ladda ner en del av 1000 Genomes Project, som innehåller sekvenseringsinformation för över 2600 personer från 26 befolkningar runt om i världen. Detta är en 200TB-fil, så var beredd. Vi föreslår att du använder den tillsammans med en kraftfull cloud computing-plattform.

Se även: Djurgenomstorleksdatabasen för genomdata relaterad till 5635 arter.

Airliners

Planspotternas himmel. En massiv bilddatabas med 2,532,457 bilder av alla slags flygplan, från den minsta enskilda båten till de stora flygande fästningarna.

Flygbolagen har också en omfattande data om flygplan och historikavsnittet hålls alltid uppdaterat i samarbete med Aerospace Publications för att säkerställa faktisk noggrannhet. Detta har gjort det till en av de mest detaljerade flygdatabaserna på Internet.

Se även: Försök Planespotters.net för ett annat antal bilder, eller SeatGuru för planeringsscheman för flygplan.

Internetarkivet

Webbplatsen tidigare känd som Internetarkivet, har gått igenom en omfattande omdesign. Webbplatsen hade inte ändrats mycket sedan omkring 2002, men mycket har ändrats sedan dess. Internetarkivet har gjortännu mer växande sedan de tidiga dagarna.

Arkivera allt på Internet, ger webbplatsen dig fri tillgång till digitala medier, inklusive böcker, musik, spel Internet Archive tar 900 klassiska arkadspel till din webbläsare. Här är 7 av de bästa internetarkiverna med 900 klassiska arkadspel till din webbläsare. Här är 7 av de bästa Din stads arkad kan ha stängt i mitten av 90-talet, men det borde inte stoppa dig från att få din klassiska spel fixa. Läs mer, videoklipp och mycket mer. Samlingen beräknas för närvarande vara cirka 10 petabyter. Minnesstorlekar förklaras: Gigabyte, Terabytes och Petabyter i kontextminneformat Förklarade: Gigabyte, Terabytes och Petabyter i kontext Det är lätt att se att 500GB är mer än 100 GB. Men hur jämför olika storlekar? Vad är en gigabyte till en terabyte? Var passar en petabyte in? Låt oss rensa upp det! Läs mer, och eftersom deras webcrawlers fortsätter att krypa, fortsätter den att växa.

Freebase

Freebase är “en community-curated databas av kända personer, platser och saker,” lagras i en datastruktur som heter a Graf. Ett diagram består av noder, förbundna med sina kanter, vilket gjorde det möjligt för Freebase att snabbt expandera innehållet utan att störa befintliga poster.

Tyvärr har Freebase, som ägs av Google, bytt till läsbara läge i början av året innan den fristående servicedatabasen överförs till Wikimedia Foundation för integration. Försök Beta-funktioner på Wikimedia och förhandsgranskning Vad är nytt innan någon annan provar Beta-funktioner på Wikimedia och förhandsgranskning Vad är nytt innan någon annan Wikimedia's Beta Features-program kan låta någon prova de kommande nya funktionerna på Wikimedia och dess wikis. Delta i och hjälpa till att göra Wikimedia till en bättre upplevelse för oss alla. Läs mer i Wikidata-projektet (slutet av juni 2015). Utvecklare kan fortfarande komma åt Freebase med befintliga API, men när omkopplaren är klar måste utvecklarna använda Wikimedia APIs för att komma åt data.

Hitta en grav

Från hemmabasen av ett Internet-kunskaps-drömlag från Google och Wikimedia flyttar vi till det morbidiska. Hitta en grav är en enorm, 121 miljoner rekorddatabas av begravningar runt om i världen.

De mest omfattande dokumenten kommer från USA, men det finns några mindre länder med stor data. Komplett med bilder, intressanta monument och ett antal intressanta epitafs ... om du behöver inspiration?

Gamerankings

En databas som underhålls av det ständigt närvarande granskningslaget på Gamespot. GameRankings ger en väl avrundad bild av ett spelets popularitet genom att täcka on-and-offline spelrecensioner från välrenommerade källor. 6 Platser för att ta reda på vad som är de bästa videospel någonsin 6 ställen att ta reda på vad är de bästa videospel någonsin Det är bara naturligt för en fan av spel att undra vad de bästa spelen någonsin gjort är, eller åtminstone vad experterna tycker är bäst. Läs mer .

The Big Cartoon Database

På samma sätt som den massiva IMDb fokuserar The Big Cartoon Database uteslutande på alla animerade saker: tecknade filmer, filmer, tv-program, annonser och mycket mer. Om det är en animering hittar du den här - och om inte, anmäla dig som bidragsgivare till den ständigt växande databasen.

The Big Cartoon Database har en systerwebbplats i The Big Comic Database, hem till ytterligare 100 000 eller fler serietidningar 9 Video Game Themed Comics Böcker Du Börja Läs 9 Videospel Themed Comics Böcker Du Börja Det är dags att stänga av och gå till säng. Men du är fortfarande kliande för att spela ditt favoritspel. Du måste slå ner, varför läser du inte ditt favoritspel istället? Läs mer, spänner över 5 000 serier, med över 35 000 täckningsskanningar. Den innehåller också en omfattande sökfunktion, bland annat en prisguide för priskatalog som visar nuvarande återförsäljningsvärden på olika graderingsnivåer.

Se även: The Grand Comics Database, en icke-kommersiell företagsdatabas av serier världen över.

CiteSeerX

Ett ovärderligt verktyg för studenter Skapa bibliografier och fotnot Citat är enklare med bokningar för Mac Skapa bibliografier och fotnot Citat är enklare med bokningar för Mac Bookends för Mac utför praktiskt taget forsknings- och citationsformateringsuppgifterna för dig. Läs mer och akademiker lika, CiteSeerX är en offentlig sökmotor och digitala bibliotek med akademiska och vetenskapliga artiklar. Det var ofta det första automatiserade citationsindexeringssystemet, det var inspirationen till Google Scholar och Microsoft Academic Search. Även om den senare har integrerats i Bing-sökmotorn.

CiteSeerX fokuserar på indexering av offentliga vetenskapliga dokument. Om ditt forskningspapper är öppet distribuerat har det en högre chans att visas inom sökmotorn. CiteSeerX är ett utmärkt exempel på kraften i delad kunskap tillgänglig för en mycket bredare publik.

Se även: Google Scholar för ett annat utbud av böcker och citat.

WorldCat

Tyvärr inte en databas av varje kattbild på Internet. Nu skulle det vara något! WorldCat är mycket mer användbar än det. Referensplatsen dokumenterar samlingar av över 72 000 bibliotek runt om i världen, omfattar 170 länder och territorier. Det här är användbart om du forskar i ett främmande land, eller bara har en önskan att läsa sällsynta böcker personligen.

Den enda nackdelen är uppdateringsmetoden. WorldCat använder en batchbehandlingsmodell i stället för att tillåta användare att få tillgång till data i realtid. Så, WorldCat anger inte låne status för katalogiserade böcker, oavsett om ett bibliotek äger flera kopior av en bok, eller om den aktuella boken är direkt tillgänglig för dem som vill besöka. Det är fortfarande ett mycket användbart verktyg, särskilt när det används tillsammans med CiteSeerX.

Simpsons arkiv

“Internetens clearinghouse av Simpsons guider, nyheter och information.” Jag kunde inte ha gjort det bättre själv. Den långvariga fanfavoriten började vägen tillbaka 1994, och går fortfarande stark även utan interaktivt multimedia, om bara för att undvika det vaksamma ögat Foxs juridiska avdelning.

WinCustomize

Du hittar en av de enskilt största databaserna med anpassningsverktyg för Windows Hur man anpassar ljud på Windows 10 (och varifrån de ska hämta dem) Hur man anpassar ljud på Windows 10 (och varifrån de ska hämtas) Anpassa ljuden på Windows 10, hitta nya låter teman och system och förbättrar ljudkvaliteten på din dator. Läs mer här, spänner från XP till Windows 8.1 10 Windows 8 Startskärmshackar 10 Windows 8 Startskärmshackar Windows går mot en mer låst nerriktning med Windows 8 och dess startskärm och "moderna" appmiljö. Det kan inte nekas här - du kan inte ens ställa in en anpassad startskärmbakgrund utan att installera ... Läs mer. Jag är säker på att det inte tar lång tid för Windows 10 att börja göra rundorna. Dess stora popularitet härrör från en kombination av krafter. Ägare Stardock, subventionerar webbplatsen vilket innebär att det finns lite-till-inga annonser. Det drar också nytta av antalet personer som trätt till platsen från Stardock.

Ultimate Guitar Archive

Ah, en resa ner nostalgi lane till en databas som påminner mig om att jag aldrig skulle vara Roger Waters. Faktum är att jag fortfarande kan knappt leka, men det är en annan historia.

Ultimate Guitar Archive, eller bara Ultimate-Guitar (UG), har över 1 500 000 registrerade medlemmar runt om i världen, övervaka en löjligt stor mängd gemenskapsinnehåll. Det är nästan överväldigande hur mycket gitarrelaterad information sprids ut från en enda källa. Gemenskapen upprätthåller inte en massiv databas, de samarbetar också ofta med varandra för att skapa spridande musikprojekt.

Växter för en framtid

Växter för framtida dokument ekologiskt hållbar trädgårdsodling. Det har en stor hand att sprida kunskap om artens mångfald och vikten av permakultur. Det som började som ett litet projekt i djupet av Cornwall har långsamt blivit en världsomspännande databas.

Tillväxten är något långsam och fokuserar i stor utsträckning på permakultur i Storbritannien och EU, men många av registeren kan bytas ut för specifika platser i USA när du har arten detaljer.

Quandl

Kör upp med detta Excel-tillägg för att bearbeta och analysera data Power Up Excel med 10 tillägg för att bearbeta, analysera och visualisera data som en Pro Power Up Excel med 10 tillägg för att bearbeta, analysera och visualisera data som en Pro Vanilla Excel är fantastiskt, men du kan göra det ännu kraftfullare med tillägg. Oavsett vilken data du behöver bearbeta är chansen att någon skapade en Excel-app för den. Här är ett urval. Läs mer . Huvud Quandl-webbplatsen fungerar som en databassökning och lokaliserar databaser från hela världen som matchar dina söktermer. Prova om du behöver lite extra data i bråttom, eller precis som att spela med stora dataset (ärligt, vem gör det inte ?!).

Se även: Enigma databas sökmotor.

Tiny bilder

Tiny Images dataset fungerar som en visuell ordbok. Klicka någonstans inom bilden och en sökterm dyker upp med extra information. Du kan också använda specifika termer för att siktas igenom 80 miljoner bilder.

Databasen är en del av ett bredare maskininlärningsprojekt Hur intelligent programvara kommer att förändra ditt liv Hur intelligent programvara kommer att förändra ditt liv Skynet kommer, och det kommer att bli otroligt populärt. Nya AI-tekniker utvecklas som kommer att slumpa hur vi lever, spelar och arbetar, Läs mer fokuserat på att undervisa datorer till “se” och “läsa” semantiska fält inom bilder.

Bonuskälla: / r / dataset

De “framsidan av Internet” är ett solidt hem för data mining entusiaster runt om i världen. Det finns subreddits dedikerade till maskininlärning, data mining, text till data och dataset. Om du behöver något specifikt, gör en förfrågan. Nya dataset visas varje vecka.

Se upp för de intressanta dataset som postas som immuniseringsnivåer inom barnomsorg och skolor för Kalifornien.

Användar du rikedomarna?

Internet har skapat den enskilt klaraste möjligheten för individer att komma ihop och koncentrera sin kunskap till en enda databas. Vi försöker försiktigt dokumentera allt om någonting. Några av dessa databaser är för perusing, andra är för lärande Hur man använder ett Excel-pivottabell för dataanalys Hur man använder ett Excel-pivottabell för dataanalys Pivottabellen är ett av de enda kraftfullaste verktygen i Excel 2013-repertoaren. Det används ofta för stor dataanalys. Följ vår steg-för-steg demonstration för att lära dig allt om det. Läs mer, men vi hoppas du njuter av dem alla.

Vilka är dina favoritdatabaser? Finns det några öppna massiva referenskällor jag borde ha med i denna lista?

Bildkrediter: nätverksserver via Shutterstock, bibliotek via Shutterstock

Utforska mer om: Encyclopedia.