Så här söker du Amazon för miljontals offentliga dokument, bilder och mer

Så här söker du Amazon för miljontals offentliga dokument, bilder och mer / internet

Amazon Web Services (AWS) är den blå whalen av cloud computing. Du kanske inte inser det, men de flesta webbplatser och webbtjänster går på denna plattform. Och faktum är att AWS: s offentliga moln är större än Microsoft, Google och IBM kombinerat.

Precis som alla andra massiva molnplattformar, värd AWS en mängd allmänt tillgängliga data. Till exempel kan du hitta enorma 100 miljoner starka dataset av Creative Commons bilder och videor från Flickr. Öppna den med hjälp av YFCC100m Browser.

Prova en sökning med Google. Du kommer att bli överraskad av den enorma mängd offentliga dokument som du kan hitta på AWS. Ett av de snabbaste sätten att söka AWS för PDF-filer är att använda bra gammal Google och en av dess avancerade sökoperatörer.

[Keyword] filetype: PDF-webbplats: amazonaws.com

Självklart är filerna öppna för allmänheten och kan vara tillgängliga från sökportalerna på de webbplatser som värd dem på AWS. Men det här sökordet är en “experimentell sökning” det hjälper dig att gräva in i den stora höstacken på en gång istället för att gå till varje sida.

Du kan också använda Googles avancerade söksida för att bygga din fråga mer exakt och sedan utföra det för att söka Amazons moln. Jag föredrar ett litet sökverktyg som heter Advangle. Så här ökar du noggrannheten i sökresultatet på Google och Bing. Så fort ökar du noggrannheten i sökresultaten på Google och Bing. Det är därför det bästa sättet att söka fortfarande kräver användning av booleska sökoperatörer. Men vem vill memorera alla olika sökoperatörer? Lyckligtvis finns det en lösning! Läs mer, vilket hjälper dig att bygga sökfrågor på ett visuellt sätt.

En “Osynlig” Plats för webbforskning

En sökmotor är en ytterdörr till webben. Men det finns många sätt att söka efter djupa data. Resan till det dolda nätet: En guide för ny forskares resa till det dolda nätet: En guide för nya forskare Den här handboken tar dig på en turné genom de många nivåerna på den djupa webben: databaser och information tillgänglig i akademiska tidskrifter. Slutligen kommer vi fram till Tors portar. Läs mer och lägg till dina forskningsfärdigheter. Naturligtvis, använd inte informationen (särskilt bilder) blint. Hitta den webbplats som äger informationen och kontrollera deras upphovsrättsrestriktioner.

Jag tror att Googles avancerade sökoperatörer borde vara en del av våra forskningsvanor. Vad tror du? Nämna några öppna kataloger där du gillar att göra din onlineforskning.

Utforska mer om: Amazon Web Services, Google Sök, Websökning.