Topp 5 gratis OCR-programvaruverktyg för att konvertera bilder till text
Helt uppriktigt, jag önskar att jag visste om det här enkla sättet att använda fritt tillgänglig OCR-programvara på min skoldag. Självklart hade vi inte kameratelefoner eller billigt Digicams, men skulle det inte ha sparat timmar med kopieringsanteckningar!
Åh, modern teknik är underbar; ta en skannad bild (eller ta en snap med en mobilkamera / Digicam) och Presto-OCR-mjukvaran extraherar all information från bilden till lätt redigerbart textformat.
Optisk teckenigenkänning (OCR) är ett system för att konvertera skannade tryckta / handskrivna bildfiler till maskinläsbara textformat. OCR-programvara fungerar genom att analysera ett dokument och jämföra det med teckensnitt som är lagrat i sin databas och / eller genom att notera egenskaper som är typiska för tecken. En del OCR-programvara sätter den också genom en stavningskontroll till “gissa” okända ord. 100% noggrannhet är svår att uppnå, men nära approximation är vad de flesta programvaran strävar efter.
Kanske har du redan stött på vår tidigare Hur man extraherar text från bilder (OCR) Hur man extraherar text från bilder (OCR) Hur man extraherar text från bilder Det bästa sättet att extrahera text från en bild är att använda optisk teckenigenkänning (OCR). Vi visar dig sju gratis OCR-verktyg för jobbet. Läs mer posta och använda JOCR, ett gratis OCR-mjukvaruverktyg. Eller du kanske har ställt in dina preferenser för några OCR-verktyg på nätet. Sedan, om du har tänkt på sätt att utnyttja OCR-programvara för genvägar för produktivitet, låt oss ge dig några fler verktyg att spela med.
Vi kommer att titta på 5 gratis bitar av OCR-programvara och för att börja så låt vi se de förbisedda två som redan är installerade på våra system.
OCR Använda Microsoft OneNote 2007
För tillfälliga grundläggande OCR-grejer är MS OneNotes optiska teckenigenkänningsfunktion en tidsbesparing. Du kanske har saknat det; det heter Kopiera text från bild.
- Dra en skanning eller en sparade bild till OneNote. Du kan också använda OneNote till klämma del av skärmen eller en bild i OneNote.
- Högerklicka på den infogade bilden och välj Kopiera text från bild. Den kopierade optiskt erkända texten går till klippbordet och du kan nu klistra in det i något program som Word eller Notepad.
OneNote är enkelhet personifierad. Men det är inte så bra för handskrivna tecken eller till och med fuzzy. Men för ett snabbt jobb är jag allt för OneNotes klipp och klistra in.
OCR Använda Microsoft Office Document Imaging
Ett annat litet använt verktyg inom Microsoft-familjen. Det är rätt där under Meny> Microsoft Office> Microsoft Office-verktyg> Microsoft Office Document Imaging.
Att göra OCR med dokumentbildningsverktyget är lite begränsande eftersom det endast tar emot TIFF-format (eller MDI). Men det är inte för mycket av störningar, eftersom någon grafisk applikation kan användas för att konvertera en bild till TIFF. I skärmdumpen nedan har jag använt MS Paint för att konvertera en JPEG till en TIFF.
- Öppna filen i Microsoft Office Document Imaging> Arkiv> Öppna.
- Klicka på den lilla ögonikonen: Känna igen text med OCR.
- Klicka på MS Word Icon-Skicka text till Word.
- En MS Word-fil öppnas med den redigerbara konverterade texten.
- Alternativt kan du också använda MS Paint för att välja ett specifikt område och kopiera det till urklippet. Öppna MS Office Document Imaging > välj Sidan - Klistra in för att kopiera urvalet för OCR.
Återigen hanterade MODI tryckt text, men min handskriven text möttes med en “OCR utfördes men kunde inte identifiera text” prompt'. Självklart prova med din egen handstil.
Så, låt oss nu lämna Microsoft-familjen bakom och titta på tre gratis verktyg som kallar sig OCR Software.
SimpleOCR
Svårigheten jag hade med handskriftsigenkänning med MS-verktyg, kunde ha hittat en lösning i SimpleOCR. Men mjukvaran erbjuder endast handskriftsigenkänning som en 14 dagars gratis provperiod. Maskinutskrift erkännande dock gör inte har några restriktioner.
- Programvaran kan ställas in för att läsa direkt från en skanner eller genom att lägga till en sida (jpg, tiff, bmp-format).
- SimpleOCR erbjuder lite kontroll över konvertering genom textval, bildval och text ignoreringsfunktioner.
- Omvandling till text tar processen i en godkännande skede; En användare kan korrigera skillnader i den konverterade texten med hjälp av en inbyggd stavningskontroll.
- Den konverterade filen kan sparas i ett doc- eller txt-format.
SimpleOCR var bra med normal text, men hanteringen av layouter med flera kolonner var en komedown. Enligt min uppfattning var konverteringsnoggrannheten hos Microsoft-verktygen betydligt bättre än SimpleOCR.
SimpleOCR (v3.1) är en 9 MB nedladdning och är kompatibel med Windows.
TopOCR
Precis vad jag pratade om i början! TopOCR, i ett avbrott från den typiska OCR-mjukvaran, är utformad mer för digitalkameror (minst 3 MP) och mobiltelefoner tillsammans med skannrar. Liksom SimpleOCR, har den ett tvåfönster gränssnitt-källan Bild fönster och Text fönster.
Bilden som hämtas från en kamera eller en skanner i det vänstra fönstret omvandlas till textformatet i textredigeraren till höger. Textredigeraren fungerar som WordPad och kan använda Microsofts Text till tal motor.
- Programvaran stöder JPEG, TIFF, GIF och BMP format.
- Bildinställningar som ljusstyrka, färg, kontrast, despeckle, skärpa etc. kan användas för att förbättra bildens läsbarhet.
- Kamerafilterinställningar kan också konfigureras för att förbättra bilden.
- Den konverterade filen kan sparas i olika format-PDF, RTF, HTML och Text.
- TopOCR fungerar bra med rakt orienterad text men det vanliga misslyckandet med OCR med kolumntext kvarstår.
- Programvaran analyserar emellertid en blandad sida (text plus grafik) och behandlar endast texten.
- Programvaran fungerar med 11 språk.
För bästa resultat med din kamera läs dit Hur man får de bästa resultaten med TopOCR-sidan.
TopOCR (v3.1) är en 8 MB nedladdning och är kompatibel med Windows (ej testad på Vista).
FreeOCR
Denna gratis OCR-programvara använder Tesseract OCR motor. Tesseract OCR-kod utvecklades vid HP Labs mellan 1985 och 1995 och är för närvarande med Google. Det anses som en av de mest exakta OCR-motorerna med öppen källkod.
FreeOCR är ett enkelt Windows-gränssnitt för den underliggande koden.
- Den stöder de flesta bildfiler och flersidiga TIFF-filer.
- Den kan hantera PDF-format och är också kompatibel med TWAIN-enheter som skannrar.
- FreeOCR har också det bekanta dubbla fönstergränssnittet med lättlästa inställningar.
- Innan du startar en klickomvandlingsprocess kan du justera bildkontrasten för bättre läsbarhet.
FreeOCR (v.2.03) kräver Microsoft Net 2.0-ramverket. Den Windows XP / Vista-kompatibla 4,38 MB programvaran kan också laddas ner från den här alternativa sidan.
Gratis OCR-verktyg har sina egna begränsningar. Och att skanna en sida måste göra mycket med resolutioner, kontraster och tydlighet i teckensnitt. Från en genomsnittlig användares synpunkt är 100% OCR-noggrannhet en pipedream. Hur bild-till-text fungerar (aka optisk teckenigenkänning). Hur bild-till-text fungerar (aka optisk teckenigenkänning). Dra ut text ur bilder har aldrig varit enklare än det är idag tack vare optisk teckenigenkänning (OCR) -teknologi. Men vad är OCR? Och hur fungerar OCR? Läs mer .
Den gratis OCR-programvaran jag skulle välja
Även om de fria verktygen var tillräckliga med tryckt text misslyckades de med normal kursiv handskriven text. Min personliga preferens för off-hand OCR använder lutning mot de två Microsoft-produkter som jag nämnde i början.
Din egen säger saker. Vilket är ditt valfria verktyg? Låt den fria OCR-mjukvaran känna igen vad du har på det? Och ännu viktigare, känner du igen vad de kasta tillbaka på dig? Låt oss veta!
Observera att om du letar efter professionella resultat måste du prova professionell OCR-mjukvara. Gratis vs Betald OCR-programvara: Microsoft OneNote och Nuance OmniPage Jämfört gratis vs Betald OCR-programvara: Microsoft OneNote och Nuance OmniPage Jämfört OCR-skannerprogramvaran låter dig konvertera Text i bilder eller PDF-filer till redigerbara textdokument. Är ett gratis OCR-verktyg som OneNote tillräckligt bra? Låt oss ta reda på! Läs mer, till exempel Nuance OmniPage.
Bildkrediter: kalleboo
Utforska mer om: Bildredigerare, OCR.