Hur rösttypning är den nya bästa funktionen i Google Dokument
Röstigenkänning brukade vara fruktansvärt felaktigt. Det fungerade bara för en handfull människor en handfull gånger. Men nu är det faktiskt ganska bra tack vare kombinerade insatser Nuance, Microsoft, Apple och Google, som har kastat otaliga resurser för att faktiskt förbättra det.
Av alla dessa företag har få matchat engagemanget för röstigenkänning av Google, som har gjort det till en grundläggande lynchpin i sin mobil- och tjänstestrategi.
En av Googles första förseningar var den kortvariga GOOG-411 (eller Google Voice Local Search). Det lanserades 2008 och fick personer att söka efter telefonnummer med hjälp av sin röst. Röstigenkänningstekniken har också varit ett centrum av Android och med lanseringen av JellyBean Vad är de största förbättringarna i Android 4.2 och 4.3? Vad är de största förbättringarna i Android 4.2 och 4.3? Om du sitter fast på 4,0 Ice Cream Sandwich eller 4.1 Jelly Bean, ska du uppgradera? Läs mer det blev äntligen tillgängligt offline.
Tidigare denna vecka introducerade Google äntligen röstigenkänning i Google Dokument.
Användare kan bokstavligen diktera sina dokument (mycket som jag gör med den här artikeln) utan att behöva installera ytterligare program eller plugin-program. Det är ett viktigt steg framåt för kontorspaketet online, men är det bra?
Komma igång
Innan vi börjar dyka in i dess funktioner vill jag beröra hur du får Google Voice Typing. Om du har ett Google-konto har du redan det här. Öppna bara Google Dokument och öppna ett nytt eller befintligt dokument. Då kommer ett fönster att dyka upp som frågar om du vill prova röstdiktation. Klick Försök.
Därefter måste du ge Google Docs tillåtelse att använda din mikrofon. Det handlar bara om att klicka Tillåta till ett popup-fönster.
Då måste du välja vilket språk du vill använda med Google Voice-typing. Utbudet av språk och dialekter erbjuds varierar från engelska och spanska till afrikaans och arabiska.
Klicka sedan på mikrofonikonen och börja prata.
Hur exakt är det?
En av de största hindren för röstigenkänning som slår mot det vanliga är det ofta det är inte tillräckligt nog. Det brukade vara en given att om du ser använda röstigenkänning måste du spendera ett bra antal timmar att redigera och korrigera din text. Så hur tar Googles erbjudande pris i detta avseende?
Ganska bra, faktiskt. För det mesta förstod Google Voice Typing vad jag sa, även om jag har en regional engelsk accent (vi talar om accenter senare).
Jag var särskilt imponerad av hur Googles röstigenkänning hanterade bakgrundsbrus. När jag skrev den här artikeln skällde en Yorkshire Terrier i mitt vardagsrum, och mitt fönster var delvis öppet. Jag bor på en trafikerad väg där bilar körs förbi hela tiden. Men trots det kunde Google filtrera ut det och fokusera på precis vad jag sa.
Det största problemet var att Google Voice Typing kämpade ofta med skiljetecken. jag skulle säga “kommatecken”, “period” och “punkt”, och det skulle tolka det som jag vill skriva “kommatecken”, “period”, och “punkt”. Detta var frustrerande av två skäl.
För det första, eftersom det skulle taunt mig, genom att först använda den korrekta skiljetecken, innan du omedelbart återgår till den stavade versionen av ordet. Det gick inte att stoppa det här, och jag måste manuellt redigera dokumentet för att åtgärda det.
Men, kanske värre, jag kunde inte hindra det från att hända. Det finns ingen ordlista där du kan stryka stavning. Det händer bara, och du måste hantera det.
Jag vill inte underskatta hur frustrerande detta är. Det är allvarligt irriterande. Men det är också något jag är övertygad om kommer att förbättras på efter allt fler människor använder den här funktionen och eftersom Google åtar sig fler resurser för att förbättra sin röstigenkänning.
Förutom den speciella irritationen var jag ganska nöjd med noggrannheten i Googles röstigenkänning.
Hur det hanterar accenter
Jag blev förvånad över hur många språk och dialekter som Google Voice Typing stöder. På engelska ensam stöder den Nya Zeeland, australiensiska, indiska, sydafrikanska, amerikanska och brittiska dialekter, för att bara nämna några. Problemet är att det inte är någon amerikansk accent, som om det inte finns en brittisk accent. Snarare finns det en rad accenter och dialekter som skiljer sig från plats till plats.
Det är en truism som Storbritannien har en accent för varje postkod. MakeUseOf-teamet har en rad olika accenter bland brittisk personal. Christian Cawley talar med en bred Middlesbrough-accent. Rob Nightingale, som kommer från Southport, har en nordligare dragning. Medan Mark O'Neil har en skotsk twang.
Jag bor i Liverpool, så jag har en Scouse-accent som driver lite till Atlanten, till stor del tack vare min amerikanska fiancee och den tid jag bodde i Schweiz.
Och det är rättvist att säga att röstigenkänningsprogrammen ofta kämpar för att förstå regionala engelska dialekter. När Siri kom ut, blev hans oförmåga att förstå skotska användare blivit ett springande skämt.
Men Googles erbjudande var exceptionellt. Tro mig när jag säger att du inte behöver träna tala med en annan accent Vilka Apps & Webbplatser kommer att förbättra min accent när man talar ett annat språk? Vilka program och webbplatser kommer att förbättra min accent när man talar ett annat språk? Jag vill verkligen göra mitt uttal matchande med en modersmålsman. Finns det några appar eller webbplatser som kan hjälpa mig? Läs mer . Jag har pratat med en handfull vänner som också har regionala engelska accenter, och de har haft liknande positiva erfarenheter med det. Medan jag medger att det är ett litet och helt okunnigt prov, är det verkligen lovande.
Röstdiktationshastighet
Röstigenkänningsprogram har traditionellt blivit förskräckt av en oförmåga att hålla fast vid den hastighet som användaren dikterar. Visserligen var jag lite bekymrad över att Googles erbjudande skulle vara annorlunda, särskilt med tanke på att det är en onlinetjänst snarare än ett program som körs på min soppade MacBook Pro.
Men jag var imponerad. Google kunde hålla fast vid min högt koffeinerade talhastighet och fungerade inte som en flaskhals för min produktivitet. Det var det fullständiga motsatsen till mina erfarenheter med andra röstdiktatverktyg.
Jag vet inte om det var för att jag har en snabb FTTC (Fiber to the Cabinet). Vad är skillnaden mellan FTTC och FTTP, och varför ska du bry dig? Vad är skillnaden mellan FTTC och FTTP, och varför ska du bry dig? Vi har alla varit där på en eller annan punkt. Sjuk på vår internettjänst, letar efter ett nytt sätt att ansluta till Internet, men förvirrad av de många olika alternativen. Läs mer hemanslutning till Internet eller det faktum att Google har ett gränslöst utbud av snabba servrar till sitt förfogande. Hur som helst kunde jag få saker gjorda.
En anteckning på mikrofoner
Inbyggda mikrofoner tenderar att vara hit-och-miss. Enligt min erfarenhet är de antingen utmärkta, som de är på Apples bärbara datorer, eller de är inte. Det är väldigt sällan någon mellanklass.
Allmänt sett, de billigaste bärbara datorerna Bästa bärbara datorer under $ 300: Allt du behöver veta Bästa bärbara datorer Under $ 300: Allt du behöver veta Att hitta en bra bärbar dator för mindre än $ 300 är nästan omöjlig idag, men kan göras om du vet vad att leta efter. Här är allt du behöver veta för att köpa ett köp du ... Läs mer har de värsta interna mikrofonerna. Det är bara en av de funktioner som tenderar att förbises av enhets tillverkare.
Jag började diktera denna artikel med hjälp av den interna mikrofonen på min MacBook Pro. Även om Google Docs ofta sa att det hade problem med att höra mig, översatte det inte till långsammare eller felaktig diktering. Allt fungerade bra.
Jag försökte också skriva Google Voice med en dyr Blue Yeti External Microphone. Dessa är podcastkvalitetsmikrofoner som säljs på Amazon för över 100 dollar.
Blå Yeti USB Mikrofon - Silver Blå Yeti USB Mikrofon - Silver Köp nu På Amazon $ 94.49
Visserligen märkte jag inga skillnader när det gällde precisionen eller hastigheten på dikteringen. Den största fördelen med att använda denna mikrofon var dock att jag kunde infoga ett par AKG-hörlurar och använda dem som en bildskärm. Detta gjorde det möjligt för mig att vara mer medveten om bakgrundsbrus och att självjustera om jag var för hög eller för tyst.
Slutgiltiga tankar
Googles röstigenkänning är inte perfekt. Men det är knappast en överraskning, eftersom solid röstigenkänning är en ganska svår prestation att dra av. Det finns mycket som jag kände att kunde förbättras.
Detta handlar mestadels kring hur mjukvaran handlar om skiljetecken och meningsstruktur. I en ideal värld sätter Google automatiskt in interpunktion baserat på rytmen och kadens av din röst, men vi är en lång långt ifrån det.
Det är också synd att den här programvaran ännu inte har gjort det till Googles andra erbjudanden, som Gmail. Helst skulle jag vilja ha möjlighet att ladda ner Google Voice Typing som en app och använda den med andra programvaror, som iWorks sidor 5.0 för Mac innehåller Smart Inspector Panel, men mindre funktioner Sidor 5.0 för Mac Innehåller Smart Inspector Panel, Men mindre funktioner Det finns gott om lätta och lättanvända textredigerare för Mac-användare, men för projekt som kräver skrivbordsförlagringsfunktioner är Apples nyligen omarbetade sidor fortfarande en bra lösning. Läs mer eller markdownredigeraren IA Writer iA Writer för Mac & IOS: Den bästa ordbehandlaren du aldrig använt iA Writer för Mac & IOS: Den bästa ordbehandlaren du aldrig har använt Är det ett skolpapper eller ett blogginlägg, vi alla vid någon tidpunkt befinner oss i att kunna dumpa en massa tecken i en textfil. Medan mobiltelefonen ... Läs mer .
Men det är två mindre irriterande, Google Voice Typing är lika bra som det blir. I kontrast skrev jag det här avsnittet av artikeln med hjälp av det inbyggda röstigenkännetecknet för OS X, och det var ingenstans lika exakt eller lika snabbt.
Om detta inte övertygar folk att byta till Google Drive, vet jag inte vad som ska.
Nu över till dig! Har du blivit frestad av Google Drive taligenkänning? Har du provat det, ännu? Berätta allt om det i kommentarerna nedan.
Utforska mer om: Google Dokument, Taligenkänning, Tal till Text.