Vad är optisk teckenigenkänning (OCR)?

Optisk teckenigenkänning (OCR) avser programvara som skapar en digital version av ett skrivet, skrivet eller handskriven dokument som datorer kan läsa utan att manuellt skriva in eller skriva in texten. OCR används vanligtvis på skannade dokument i PDF-format, men kan också skapa en datorläsbar version av text inom en bildfil.

Vad är OCR?

OCR, även kallad textigenkänning, är mjukvara som omvandlar tecken som siffror, bokstäver och skiljetecken (även kallade glyfer) från tryckta eller skriftliga dokument till en elektronisk form som lättare kan identifieras och läsas av datorer och andra program. Vissa OCR-program gör det här eftersom ett dokument skannas eller fotograferas med en digitalkamera och andra kan tillämpa denna process på dokument som tidigare har skannats eller fotograferats utan OCR. OCR tillåter användare att söka inom PDF-dokument, redigera text och omformatera dokument.

Vad används OCR för?

För snabb, varje dag behöver skanning, OCR kan inte vara en stor sak. Om du gör en stor mängd skanning kan du söka i PDF-filer för att hitta den exakta du behöver, spara lite tid och göra OCR-funktionaliteten i ditt skannerprogram viktigare. Här är några andra saker som OCR hjälper till med:

Automatiserad databehandling och datainmatning (Exempel: Spårningssystem för arbetssökande för återupptagning)
Gör sökbara böcker sökbara
Konvertera handskrivna skanningar till datorläsbar text
Att göra dokument mer användbar av läsarprogram som hjälper visuellt nedsatta användare
Bevara historiska dokument och tidningar, samtidigt som de gör dem sökbara
Datautvinning och överföring till redovisningsprogram (Exempel: Kvitton och fakturor)
Indexering av dokument för användning av sökmotorer
Erkännande av körkort med snabbkamera och kamera med röd ljuskamera
Talsynteser för personer som inte kan tala - teoretisk fysiker Stephen Hawking är kanske den mest kända användaren av ett talesyntesprogram

Varför använda OCR?

Varför inte bara ta en bild, eller hur? Eftersom du inte skulle kunna redigera någonting eller söka på texten eftersom det bara skulle vara en bild. Skanna dokumentet och löpa OCR-programvaran kan göra den filen till något du kan redigera och kunna söka.

Historia om OCR

Medan den allra tidigaste användningen av textigenkänningsdatum till 1914 började den breda utvecklingen och användningen av OCR-relaterade tekniker allvarligt på 1950-talet, särskilt med skapandet av mycket förenklade typsnitt som var enklare att konvertera till digitalt läsbar text. Den första av dessa förenklade typsnitt skapades av David Shepard och vanligtvis kallad OCR-7B. OCR-7B används fortfarande idag i finansbranschen för standardfonten som används på kreditkort och betalkort. På 1960-talet började posttjänster i flera länder använda OCR-teknik för att snabbt öka e-post sorteringen, inklusive USA, Storbritannien, Kanada och Tyskland. OCR är fortfarande kärntekniken som används för att sortera post för posttjänster runt om i världen. År 2000 användes viktig kunskap om gränserna och egenskaperna hos OCR-tekniken för att utveckla CAPTCHA-programmen som används för att stoppa robotar och spammare.

Under årtiondena har OCR vuxit mer exakt och mer sofistikerat på grund av framsteg inom relaterade teknikområden, såsom artificiell intelligens, maskininlärning och datorsyn. Idag använder OCR-mjukvaran mönsterigenkänning, funktionsdetektering och textmining för att förvandla dokument snabbare och mer exakt än någonsin tidigare.