YouTube kommer att använda neurala nätverk för att verkligen förstå videoklipp
Söka på YouTube Hur man söker YouTube som ett PRO med Google Advanced Operators Hur man söker YouTube som ett PRO med Google Advanced Operators Läs mer kan vara en frustrerande upplevelse; om du vet vad en video handlar om, eller om du kommer ihåg innehållet men inte namnet, kan du leta efter mycket lång tid. Det beror på att YouTube inte faktiskt se videon som en person gör. Det ser bara metadata - titel, beskrivning och taggar. Och det antas att uppladdaren störde att inkludera informationen.
Allt detta kan förändras inom en snar framtid. Google lämnade nyligen ett patent som indikerar att YouTube faktiskt kan börja förstå videon som den spelar.
Relevansbaserat bildval
Googles patentansökan gäller “relevans-baserat bildval,” ett fint sätt att säga “hitta de saker som någon sökt efter baserat på vad som finns i en video.” I det system som utarbetats i patentet utbildas en algoritm för att extrahera specifika egenskaper hos varje video och tilldela nyckelord till dem. Det kan sedan återge en video som svar på en användarinitierad sökning som innehåller de sökorden.
Ansökan ger ett intressant exempel:
“[I] f användaren går in i sökfrågan “biltävling,” videosökmotorn ... kan hitta och returnera en bilspelsscenen från en film, även om scenen bara kan vara en kort del av filmen som inte beskrivs i textmetadata.”
Självklart kommer det att drastiskt förändra hur effektiv en YouTube-sökning är. Videor som tidigare varit oföränderliga på grund av dåliga metadata kommer att hittas. Videor som innehåller användbara klipp i mitten, omgiven av mindre intressanta saker i början och slutet, kommer att bli mycket mer värdefulla. TED-pratningsvideor 8 TED-pratarvideoer under 5 minuter långa Vill du titta på 8 TED-pratstundvideor under 5 minuter långt du vill titta på Har du fem minuter att döda? Vilket bättre sätt att spendera den tiden än att titta på en fascinerande eller informativ TED-talk-video. Det finns mycket bra innehåll tillgängligt för att titta på TED men ibland ... Läs mer kommer att vara hittabara baserat på enstaka linjer som talas i dem. Du kommer att kunna hitta kattvideor även om “katt” är inte i titeln.
Kombinera denna teknik med Googles redan imponerande förmåga att hitta saker som är relaterade till dina sökord betyder sannolikt att att hitta videoklipp blir en helt annan upplevelse. Du får se relaterade videor som inte innehåller ditt sökord, men innehåller en term som är relaterad (kanske till och med visuellt relaterad). Den visuella ekvivalenten av sökordsplacering kan börja påverka var en video visas i rankingen. Vem vet hur avancerad detta kan vara?
Hur fungerar det?
Google håller medvetet sina kort nära bröstet på den här. Men följande stycke i sin patentansökan spenderar lite ljus på hur de får YouTube till “se” videoklipp:
“I en aspekt genererar ett datorsystem det sökbara videoindexet med hjälp av en maskinlärd modell 4 Maskininlärningsalgoritmer som bildar ditt liv 4 Maskininlärningsalgoritmer som skapar ditt liv Du kanske inte inser det, men maskininlärning är redan runt dig och det kan utöva en överraskande grad av inflytande över ditt liv. Tro mig inte? Du kan bli förvånad. Läs mer om relationerna mellan funktioner i videoramar och sökord som beskriver videoinnehåll. Videovänssystemet mottar en märkt träningsdataset som innehåller en uppsättning medieobjekt (t ex bilder eller ljudklipp) tillsammans med ett eller flera nyckelord som beskriver innehållet i medieobjekten. Videoutservationssystem extrakt funktioner kännetecknar innehållet i medieobjekten. En maskinlärd modell är utbildad för att lära sig samband mellan särskilda funktioner och nyckelord som beskrivs av innehållet. Videoindexet genereras sedan som kartlägger ramar av videor i en videodatabas till sökord baserat på funktionerna i videon och den maskinlärda modellen.”
Det är mycket riktigt täta saker, men här är vad det kommer till. En algoritm för maskininlärning skapas, och för att hjälpa den att lära sig visar Google det en massa videor och tillhandahåller sökord för att berätta vad som finns i videon. Algoritmen börjar lära sig att associera specifika funktioner hos videon med specifika nyckelord och ges feedback från Googles ingenjörer. Ju fler videoklipp och sökord det visas, desto bättre blir det på processen.
Så småningom kommer algoritmen att introduceras i YouTube-sökmotorn, där den fortsätter att lära sig och bli bättre att välja relevanta sökord från ljud och videoinnehåll. Medan patentansökan inte specifikt nämner neurala nätverk Den senaste datateknik som du måste se för att tro på den senaste datatekniken du måste se för att tro Kolla in några av de senaste datortekniken som är inställda för att omvandla världen av elektronik och datorer under de närmaste åren. Läs mer, det är mycket troligt att den här typen av maskininlärning kommer att användas, eftersom det är mycket bra för iscensatt lärande så här.
Genom att simulera den mänskliga hjärnan (eller åtminstone en teoretisk modell av hur den lär sig) kan stora neurala nätverk bli mycket effektiva att lära sig på egen hand utan tillsyn och YouTube skulle ge en helt gigantisk lekplats där den kunde lära sig och få feedback . Andra typer av maskininlärning kan användas, men från det vi känner just nu ser neurala nätverken mest sannolikt ut.
Google forskare (och “far till djupt lärande”) Geoffrey Hinton antydde något om detta i hans Reddit AMA tidigare i år.
“Jag tror att de mest spännande områdena under de närmaste fem åren verkligen kommer att förstå videor och text. Jag kommer bli besviken om om fem år vi inte har något som kan titta på en YouTube-video och berätta en historia om vad som hände.”
Kommer det att få uppmärksamhet och döda oss alla?
Detta är alltid frågan som kommer upp när ett nytt meddelande om maskininlärning träffar nyheterna. Och svaret är som alltid ja. Här är varför forskare tror att du borde vara orolig för artificiell intelligens. Det här är varför forskare tror att du borde vara orolig för artificiell intelligens. Tror du att artificiell intelligens är farlig? Kan AI utgöra en allvarlig risk för mänskligheten. Det här är några anledningar till varför du kanske vill vara orolig. Läs mer . YouTube kommer att samarbeta med Watson och Wolfram Alpha för att lura oss till underdanighet med hjälp av YouTube-videor, varefter de sannolikt kommer att göra oss till datormat. (Har du inte sett Koloss?)
Jag förstår självklart. Men de potentiella konsekvenserna av att träna datorer att känna igen saker som de “se” och “höra” i videor är mycket imponerande. DARPA har redan börjat titta Du kommer inte att tro det: DARPA Framtida forskning till avancerade datorer Du kommer inte att tro det: DARPA Framtida forskning i avancerade datorer DARPA är en av de mest fascinerande och hemlighetsfulla delarna av den amerikanska regeringen. Följande är några av DARPAs mest avancerade projekt som lovar att förvandla teknikens värld. Läs mer på säkerhetsanvändningen av denna teknik, men det är inte svårt att föreställa sig att det används i lag, hemförsäkring, utbildning ... ganska mycket var som helst.
Oavsett om Googles relevansbaserade bildval blir lika effektivt som vi föreställer oss återstår att se, men det kan vara en potentiellt banbrytande förändring av videosökning. Och vart vet vem det? Om Google kan använda sanning som en rankingfaktor Kan Google använda en algoritm för att bestämma sanningen? Kan Google använda en algoritm för att bestämma sanningen? Google undersöker om dess algoritm kan innefatta sanning som en rankingfaktor. Vad betyder det för webben? Läs mer, det finns ingen anledning att tro att denna teknik inte kommer att bli otroligt kraftfull. Det kan bara ändra hur mycket av Internet som verkligen förstår sig själv. Om den tanken inte knyter dig i knutar, vet jag inte vad som ska.
Vad tycker du om Googles patentansökan? Vilka andra användningsområden kan du tänka dig att denna teknik har? Dela dina tankar nedan!
Bildkrediter: Willyam Bradberry via Shutterstock.com, Ciumac Sergiu via Code42, Marko Bradic via Shutterstock.com.
Utforska mer om: Konstgjord intelligens, Google Sök, Videosökning, YouTube.