Glöm Siri 4 sätt Din telefon handlar om att bli smartare

Alla tre av de stora telefonplattformarna har nu sin egen röst. Apple har Siri, Microsoft har Cortana och Google har den lite mindre sassy Google Now 6 Google Now-funktioner som kommer att ändra hur du söker 6 Google Nu-funktioner som kommer att ändra hur du söker Du kan redan använda Google Nu på din Android-enhet, men får du allt du kan ut av det? Att veta om dessa små funktioner kan göra stor skillnad. Läs mer .

Med dessa system kan du hantera grundläggande uppgifter genom röststyrning. Var och en är en slags virtuell sekreterare som kan svara på enkla frågor, öppna program, göra anteckningar och relämeddelanden. De är användbara, men de är också frustrerande begränsade. De kan inte göra något de inte uttryckligen programmerades för, och många uppgifter är helt enkelt bortom sina förmågor.

Det finns dock ett antal teknologier som utvecklas som kommer att förbättra dessa system dramatiskt - och de kommer att vara kommersiellt tillgängliga på bara några år. Här är de fem bästa sätten att telefonen ska bli mycket smartare.

Det kommer att se vad du ser

Taligenkänning har gjort stora framsteg under de senaste fem åren tack vare utvecklingen av kraftfulla neurala nätverk. Moderna smartphones kan identifiera tal med överraskande noggrannhet (det har varit ett tag sedan Google Now har missförstått mig) och kan till och med göra saker som att identifiera låtar och tv-program baserat på deras ljud.

Det här är bra - men det är bara början. Människor interagerar inte med världen framför allt genom ljud. Vi använder syn för nästan allting - och snart kommer våra maskiner också. Vi börjar se debuten för de första bärbara headsetdisplayerna som Google Glass och Microsofts HoloLens Microsoft-program från New HoloLens Demos på Build Conference Microsoft visar av New HoloLens Demos på Build Conference Microsofts kommande HoloLens-headset är den första avancerade förstärkta verkligheten enhet som har visats för allmänheten. Är det fortfarande en fantasifull gizmo eller en teknik som är nära förverkligande? Läs mer, som kan strömma information från sina kameror till din smartphone, vilket ger en rik och alltid tillgång till visuell information. Många observatörer, inklusive mig själv, förväntar mig att dessa blir vanliga de närmaste fem åren eller så.

Så vad kan din telefon göra med all denna data?

Massor. Google har redan visat med sin Tango-tablett Google vill lägga en 3D-kamera på din smartphone - Det här är varför Google vill lägga en 3D-kamera på din smartphone - Det är därför att Googles Project Tango tar 3D-sensorer till mobila enheter. Här är vad vi vet hittills. Läs mer att en djupkamera kan bestämma den fysiska platsen för fysiska objekt med extremt hög noggrannhet. På samma sätt har det varit några fantastiska framsteg i maskinvisionen - som Microsofts neurala nätverk som kan identifiera enskilda hundraser och Googles neurala nätverk som kan exakt beskriva innehållet i fotografierna. Tillsammans öppnar dessa tekniker en hel värld av applikationer:

Vad är den här bulten? Maskinens visningsalgoritm vet, och kan beställa en ersättare på Amazon på fem sekunder. Vad heter kvinnan du träffade i baren igår kväll? Du kanske har förlorat hennes kort, men dina glasögon fångade hennes ansikte och kan hitta henne på Facebook. Du har en konstig mol. Ska du se din läkare? Din telefon kan ta en titt och meddela dig. Du är livsmedelsbutik: vad behöver du? Dina glasögon kommer ihåg den sista gången du tittade i ditt kylskåp och vet vad som saknas. De kan även ge dig vägledningar för att hitta de enskilda objekten.

Sekretesskonsekvenserna av denna teknik är skrämmande, men det här låter också otroligt användbart.

Det kommer att veta vad du vill

Smak kan vara en svår sak att sticka ner. Det är väldigt personligt och kan vara väldigt godtyckligt. Spotify och Netflix klarar av att göra rekommendationer baserade på användningsmönster (en teknik som helt ignorerar innehållet) - men det finns verkliga gränser för detta tillvägagångssätt.

Framtiden är i algoritmer som kan förstå konsten på en djup nivå - komplexa neurala nätverk som kan lära sig att välja komplexa subtiliteter av musik och filmer. Det ger en mycket rikare förståelse av vad människor gör och inte tycker om en bit media - ett konkret grepp om deras smak.

De första tidiga tipsen på detta börjar dyka upp. Liksom Spotify s “Upptäck varje vecka” spellista, som använder dessa typer av innehållsanalysverktyg för att rekommendera låtar - inklusive låtar som du kanske inte normalt hör, eftersom de är för oklara för att rangordna sig bra baserat på användningsmönster. Dessa tekniker kommer bara att bli kraftfullare i framtiden, och smarttelefonen är en bra plattform för att utnyttja denna information.

Letar du efter något att göra med vänner? Vad händer om appar på dina telefoner kan samarbeta, pool information om dina respektive smaker och välj en film eller konsert som de tycker att du kommer att gilla? Vad sägs om datingsidor som rangordnar dig baserat på djupa egenskaper i dina respektive smaker? Vad sägs om appar som kan rekommendera dig böcker, eftersom de har läst dem?

Möjligheterna är oändliga, och någon kommer att tjäna mycket pengar med dessa.

Det blir Chatty

Mänsklig: var är du nu?
Maskin: Jag är mitt i ingenstans.
Mänsklig: Vad är syftet med att dö?
Maskin: att ha ett liv.
Mänsklig: vad är syftet med att vara intelligent?
Maskin: för att ta reda på vad det är.
Mänsklig: Vad är syftet med känslor?
Maskin: Jag vet inte.

Det här är en konversation med ett neuralt nätverk som utvecklats av Google, vilket lär ut från stora databaser med text utan mänsklig tillsyn. Den här versionen var utbildad på ett antal gamla filmskript och utbildade för att förutse nästa mening i varje konversation den stötte på. Som det visar sig, om du tränar en AI på filmskript, är alla dess samtal super dramatisk.

Om du inte är imponerad är det förståeligt. Chatbots har funnits länge Hur man gör en Chatt Bot för din webbplats eller företag Hur man gör en Chatt Bot för din webbplats eller företag Svårigheten att ansluta med så många människor över hela världen är tidszoner. Du kanske vill vara tillgänglig för att interagera med din läsare eller att göra affärer med potentiella kunder, men hos vissa ... Läs mer .

Men ta en närmare titt. Googles system är speciellt på två viktiga sätt.

För det första är det väldigt enkelt vad gäller arkitektur: det är ett enda stort neuralt nätverk, och det var självklart att lära sig dynamiken i det mänskliga språket. Vanliga chatbots fungerar genom att använda tusentals handkodade regler för hur man svarar på olika situationer. När de reciterar ett svar, beror det på att det var handkodat eller memorerat från ett visst exempel. Googles nätverk är annorlunda. Det lärde sig sitt beteende organiskt, genom att försöka förstå den mänskliga skrivelsens djupa struktur.

För det andra tar det några överraskande subtila dynamik som andra chattrobotar inte gör. Det kan svara på sunt förnuftsfrågor om världen, trots att det inte uttryckligen är programmerat att göra det.

Mänsklig: vem är skywalker ?
Maskin: han är en hjälte .
Mänsklig: vem är Bill Clinton? ?
Maskin: han är miljardär .
Mänsklig: är himmelsblå eller svart ?
Maskin: blå .
Mänsklig: har en katt en svans ?
Maskin: ja .
Mänsklig: har en katt en vinge ?
Maskin: Nej
Mänsklig: kan en katt flyga ?
Maskin: Nej .
Mänsklig: hur många ben har en katt ?
Maskin: fyra tror jag .

En annan version av chatten bot, utbildad på teknisk support loggar, kan störa genom att ge riktigt tekniskt stöd överraskande bra. Det finns stumbles (det verkar ha svårt att komma ihåg vilket operativsystem du använder) - men jag har säkert fått dåligt tekniskt stöd från faktiska människor.

Allt detta är en bra indikation på att vi börjar komma till den punkt där artificiell intelligens kan vara riktigt konversation. Nätverket ovan kan fortsätta en tolerabel konversation, även om dess träningsmål endast kräver att den följer den ytliga strukturen i en fram och tillbaka dialog.

Med tanke på bättre träningsdata och en belöningsfunktion som betonar informationsutbyte är möjligheterna obegränsade. Föreställ dig en version av Siri som kan engagera dig i en riktig konversation, ge svar och råd som svar på frågor och utföra uppgifter utan att behöva programmeras specifikt för att göra det. Det är inte långt borta.

Det blir väl läst

En annan teknik som Google har arbetat med har att göra med läsförståelse. Det heter “Tankevektorer,” och konceptet är överraskande enkelt. Du kan extrahera “tankevektorer” från aktiviteten hos ett neuralt nätverk som har en bit av information, som en mening eller en artikel. Vad du får är en ogenomskinlig information som inte betyder något för alla utom det nätverk som genererade det. Den här informationen, i viss mening, lagrar “menande” av texten, separat från hur den ursprungligen formulerades.

Detta har några användbara egenskaper. Till att börja med liknar dessa vektorer varandra för meningar med liknande betydelser. Om du smälter två meningar på detta sätt kan du avgöra om de betyder samma sak eller inte. Du kan också manipulera dem. Genom att använda två neurala nätverk att generera “tankevektorer” från text på olika språk och sedan träna ett tredje nätverk för att lära sig att kartlägga mellan dem, kan du skapa en extremt kraftfull maskinöversättningsmetod som fångar innebörden av texten och inte bara orden i den.

En annan potentiell tillämpning av detta är att använda denna teknik för att samla in stora mängder information och smälta den i en kompakt representation och sedan skapa en sammanfattning baserad på utgången. Detta kan vara enormt kraftfullt för mobila applikationer.

Tänk dig att kunna fråga din telefon om att läsa allt som är tillgängligt på Google om ett visst ämne. Därefter, kom tillbaka till dig och rapportera dess resultat kortfattat, på naturligt språk och svara på frågor om resultaten. Detta kommer att bli verklighet verkligen, verkligen snart, och det kommer att bli oerhört användbart.

Framtidens telefon

Telefoner i framtiden kommer antagligen att se väldigt annorlunda än telefoner idag. De kan vara krökta. De kan vara modulära. Du kan interagera med dem med hjälp av augmented reality glasses. Den viktigaste skillnaden kommer dock att vara intelligens. Funktionerna som beskrivs här omvandlar våra enheter till kraftfulla handledare och hjälpare.

Det finns för närvarande en uppvärmd vapenrace Microsoft vs Google - Vem leder det artificiella intelligenslottet? Microsoft vs Google - Vem leder det artificiella intelligenslottet? Konstgjorda intelligensforskare gör konkreta framsteg, och folk börjar prata allvarligt om AI igen. De två titanerna som leder den artificiella intelligensloppet är Google och Microsoft. Läs mer i djupt lärande teknik. Biverkningen är att dessa tekniker utvecklas otroligt snabbt, och de kommer att vara på marknaden tidigare än du kanske tror.

Är du upphetsad av smartare smartphones? Bekymrad om konsekvenserna för privatlivet? Låt oss veta i kommentarerna!

Bildkrediter: Mänsklig hjärna av Mopic via Shutterstock

Utforska mer om: Konstgjord intelligens, mobilautomatisering, Siri, taligenkänning, slitstark teknik.

« Glöm läsning. Nu kan du lyssna på artiklar från populära webbplatser [iOS / Android] Glöm de grundläggande subredditerna Prenumerera på dessa 7 alternativ istället »