Vad är det bästa fria OCR- eller ICR-programmet för manuskript-transkription?

Javier frågar:
Jag är författare av noveller och berättelser. Jag letar efter ett gratis program för optisk teckenigenkänning (OCR) eller Intelligent Character Recognition (ICR) för att skanna mina gamla manuskript från bilder eller fotografier så att jag kan konvertera dem till Microsoft Word-filer.

Finns det några fria och korrekta program som kan göra detta? Tyvärr har jag inte en scanner, men jag har tillgång till en digitalkamera med en 20 megapixel upplösning.

Kanons svar:

Som du redan har nämnt finns det flera typer av teckenigenkänningstekniker som automatiskt kan konvertera handskriven eller skrivad skrivning till digitala tecken. Nivån på noggrannheten hos dessa typer av programvaror varierar kraftigt mellan olika implementeringar. Vissa konverterar på bokstavsbasis och andra kan konvertera hela ord. Det finns tre allmänna kategorier av denna programvara:

Optisk teckenigenkänning (OCR)
Intelligent karaktärsigenkänning (ICR)
Intelligent Word Recognition (IWR)

Optisk teckenigenkänning

I själva verket är OCR en generisk term och ofta används alla metoder som beskrivs i denna artikel som OCR - Wikipedia, men ger OCR sin egen klassificering, men moderna implementeringar tenderar att klumpa samman flera metoder. Så vad gör det? OCR omvandlar enskilda typskrivna eller handskrivna bokstäver till digitala tecken. Så ser programvaran på ett dokument och försöker sedan konvertera det till vanlig text genom att gissa vad varje tecken är.

Programvaran är inte perfekt. OCR-mjukvaran kan felstolka enskilda tecken med liknande utseende, vilket resulterar i felstavade ord och felaktiga utgångar. För det mesta kan användarna kopiera texten som genereras av ett OCR-program till en ordbehandlare och fixa automatiskt stavfel. Ofta visas fel som liknande tecken. Till exempel bokstaven “d” kan vara representerad som “cl”.

Men när det gäller handskrivna texter fungerar inte OCR mycket bra. Åtminstone är majoriteten av de fria implementationerna tragiskt dåliga. Det finns några kommersiella produkter som kan verkligen nagelhandskriven transkription, men deras prissättning ger dem helt utom räckhåll för allmänheten. Till exempel finns Lexmarks ReadSoft OCR-programvara. Den här företagets enda programvaran kostar tusentals av dollar.

Intelligent karaktärsgenkänning

ICR är en delmängd av OCR som specialiserar sig på att konvertera handskriven text till enskilda digitala tecken. Med tanke på att dina anteckningar och manuskript är handskrivna, är ett ICR-program det mest användbara. Jag är dock inte säker på hur exakt de kan konvertera texter skrivna på främmande språk, till exempel spanska. Som med OCR kan användarna förbättra kvaliteten på de utmatade texterna genom att kopiera dem till en ordbehandlare med stavningskorrigering aktiverad och sedan korrekturläsning för hand.

Intelligent ordigenkänning

Den senaste utvecklingen av OCR och ICR är Intelligent Word Recognition-programvara. Istället för att känna igen enskilda tecken försöker man översätta hela handskriven ord. I likhet med OCR och ICR, intelligent ordigenkänning omdirigerar ofta ord och kräver att användaren manuellt korrigerar eventuella misstag.

Vad är den bästa gratis OCR-programvaran?

tesseract

Det finns många alternativ tillgängliga. Tesseract är förmodligen bäst öppen källa (och gratis) OCR-programvara där ute. Enligt min kunskap ser det bara på enskilda tecken och inte hela ord.

Eftersom du använder Microsoft Word (som har den bästa och mest anpassningsbara stavningskontrollen Hur stavning och grammatik Check in Microsoft Word Hur stavning och grammatik Check in Microsoft Word Du kan anpassa Microsoft Words inbyggda stavnings- och grammatikkontrollverktyg för att möta dina behov. Du kan även använda AutoCorrect för att påskynda din typing. Läs mer i företagen) Du kan bara kopiera hela texten till Word och sedan köra en stavningskontroll för att städa upp stavfel.

Tesseract är faktiskt en OCR-motor som går från kommandoraden. Om du inte är villig att hantera svårigheten att använda ett kommandoradsverktyg, kommer du sannolikt att installera något mer användarvänligt. Det finns en nedladdningsbar “front-end” (eller ett grafiskt användargränssnitt) som låter dig använda Tesseract som ett drag och släppverktyg: PDF OCR X. Installera först programvarupaketet och kör sedan det. Då ser du ett fönster:

Sedan dra och släpp du bara bildfilen på fönstret. När bilden laddas, kör OCR-transkriptionsprogrammet. Det kan ta en minut eller så.

Tyvärr visade det sig helt otillräckligt att hantera din text. Så här ser det ut när du har extrakt text från dokumentet:

Microsoft OneNote

Eftersom det verkar att du redan använder Microsoft Office, är det bästa alternativet troligen också från Microsoft. Jag ska gissa att du äger en kopia av Microsoft Office, som inkluderar OneNote. Detta är utrustad med ganska avancerad OCR-teknik.

Också i både iOS och Android finns det också helt gratis Microsoft Office Lens, som kan konvertera JPEG (och andra bildformat) direkt till text. Vad som gör mobilversionerna så underbara är att du kan skjuta en bild, ladda upp den till Microsofts cloud computing-system och sedan köra textutdraget från OneNote på ett skrivbord.

Processen är ganska enkel. Ta först ett foto på din text. Om du har bestämt dig för att använda OneNote-appen behöver du bara spara filen till ditt OneDrive-konto. Annars överför bilden till din dator och släpp på OneNote.

Högerklicka sedan på bilden och välj Kopia Text från bild från snabbmenyn.

Högerklicka sedan på en tom del av OneNote (eller i en textläsning) och klistra in texten i. Den utmatade texten från ditt dokument ser så här ut:

Tyvärr gör resultaten från OneNote inte var som helst nära ett bra jobb och producerar fullständigt nonsens. Detta kan orsakas av en kombination av faktorer, till exempel en förvrängd bild eller skrivning som inte görs i en rak linje, eller helt enkelt för att programvaran inte är tillräckligt bra.

Google Keep

Just nu är den bästa lösningen för OCR på handskrivna dokument relaterat till maskininlärning: Specifikt, djuplärande. Djuplärande är en sofistikerad metod att träna en dator för att utföra uppgifter som tidigare bara mänskliga utmärkta, till exempel ansiktsigenkänning (Picasa gör ansiktsigenkänning. Användning av ansiktsigenkänning i Picasa Web Albums. Användning av ansiktsigenkänning i Picasa Web Albums Läs mer , tro det eller ej). Google köpte nyligen DeepMind som utvecklar djupt lärande teknik Coola forskningsprojekt som kan förändra framtiden Coola forskningsprojekt som kan förändra framtiden Kommer mega-företag som Google, Microsoft, IBM och Intel att fortsätta ge framtida generationer världen vi kan föreställ dig bara nu? Dessa spännande forskningsprojekt säger att det är ett löfte de kommer att behålla. Läs mer . Detta nyckelförvärv hade en stor effekt: Microsoft förlorar till Google i OCR Microsoft vs Google - Vem leder det artificiella intelligenslottet? Microsoft vs Google - Vem leder det artificiella intelligenslottet? Konstgjorda intelligensforskare gör konkreta framsteg, och folk börjar prata allvarligt om AI igen. De två titanerna som leder den artificiella intelligensloppet är Google och Microsoft. Läs mer . Just nu erbjuder Google en av de mest avancerade metoderna (och gratis): Google Keep.

Google Keep (som vi först granskade i 2013 Enkla anteckningar på språng: Google håller för Android Uppskattade enkla anteckningar på språng: Google Keep for Android Recenserade Det finns några fantastiska noterbara appar där ute, men här är en som meriterar : Google Keep, en notiser som har både en snygg Android-app och en smidig webapp. Läs mer) erbjuder också en mobilversion av deras app till Android. Som med OneNote kan du skjuta bilden och överföra den direkt till Googles moln. Dra bara bilden i Google Keep-fönstret. Klicka sedan på menyknappen (tre vertikala prickar) och välj Ta tag i bildtext från snabbmenyn.

Så här ser det ut efter att du har extrakt texten:

Google fortsätter att vinna

Som du kan se dominerar Google Keep i tävlingen. Resultaten kan förbättras ytterligare med hjälp av ett bildredigeringsverktyg 10 Gratis Photo Editor-verktyg för att få ut det mesta av dina bilder 10 Gratis Photo Editor-verktyg för att göra det mesta av dina bilder Vad som hände med alla ögonblicksbilder du har tagit i det förflutna ? Om du har planer och idéer, här är några bra Windows och några plattformsverktyg för att bearbeta dem med. Läs mer för att öka kontrasten och raka upp bilden.

Förhoppningsvis hjälper dessa alternativ. Om du behöver fler OCR-alternativ, kolla in de 5 bästa OCR-verktygen De 5 bästa OCR-verktygen för att extrahera text från bilder De 5 bästa OCR-verktygen för att extrahera text från bilder När du har pappersstrålar, får du allt som skrivs ut Text konverteras till något som ett digitalt program kommer att kunna identifiera och indexera? Håll en bra OCR-programvara i närheten. Läs mer, för mer information.

Utforska mer om: OCR, transkription.

« Vad är den bästa Firefox-alternativa webbläsaren för Linux? Vad är den bästa GPS-spåraren för din bil? »