Hva er Optisk tegngjenkjenning (OCR)?

Optisk tegngjenkjenning (OCR) refererer til programvare som lager en digital versjon av et trykt, skrevet eller håndskrevet dokument som datamaskiner kan lese uten at man må skrive inn eller skrive inn teksten manuelt. OCR brukes vanligvis på skannede dokumenter i PDF-format, men kan også lage en datamaskinlesbar versjon av tekst i en bildefil.

Hva er OCR?

OCR, også referert til som tekstgjenkjenning, er programvareteknologi som forvandler tegn som tall, bokstaver og tegnsetting (også kalt glyphs) fra trykte eller skrevne dokumenter til elektronisk form, som lettere kan gjenkjennes og leses av datamaskiner og andre programmer. Noen OCR-programmer gjør dette når et dokument skannes eller fotograferes med et digitalkamera, og andre kan bruke denne prosessen til dokumenter som tidligere har blitt skannet eller fotografert uten OCR. OCR lar brukerne søke i PDF-dokumenter, redigere tekst og omformater dokumenter.

Hva brukes OCR til?

For rask, daglig scanning trenger, kan OCR ikke være en stor avtale. Hvis du gjør en stor mengde skanning, kan du søke i PDF-filer for å finne den nøyaktige du trenger, spare tid og gjøre OCR-funksjonaliteten i skanneren din viktigere. Her er noen andre ting som OCR hjelper med:

Automatisert databehandling og dataregistrering (Eksempel: Sporingssystemer for søkesøkere for gjenopptak)
Gjør skannede bøker søkbare
Konvertere håndskrevne skanninger til datamaskinlesbar tekst
Gjør dokumentene mer brukbare av leserprogrammer som hjelper synshemmede brukere
Bevare historiske dokumenter og aviser, samtidig som de gjøres søkbare
Datautvinning og overføring til regnskapsprogrammer (Eksempel: Kvitteringer og fakturaer)
Indeksere dokumenter for bruk av søkemotorer
Anerkjennelse av førerkortplater ved hjelp av fartkamera og rødt lyskamera programvare
Talesynteseapparater for folk som ikke kan snakke - teoretisk fysiker, Stephen Hawking, er kanskje den mest kjente brukeren av et talesynteseprogram

Hvorfor bruke OCR?

Hvorfor ikke bare ta et bilde, ikke sant? Fordi du ikke ville kunne redigere noe eller søke i teksten fordi det bare ville være et bilde. Skanne dokumentet og kjøre OCR-programvaren kan slå den filen til noe du kan redigere og kunne søke.

Historie om OCR

Mens den aller tidligste bruken av tekstgjenkjenningsdatoer til 1914, begynte den omfattende utviklingen og bruken av OCR-relaterte teknologier på alvor i 1950-tallet, spesielt med opprettelsen av svært forenklede skrifttyper som var enklere å konvertere til digitalt lesbar tekst. Den første av disse forenklede skrifttyper ble skapt av David Shepard og kjent som OCR-7B. OCR-7B er fortsatt i bruk i dag i finansbransjen for standardfonten som brukes på kredittkort og debetkort. I 1960-tallet begynte posttjenestene i flere land å bruke OCR-teknologi til å øke hastigheten på post sortering, inkludert USA, Storbritannia, Canada og Tyskland. OCR er fortsatt kjerneteknologien som brukes til å sortere post for posttjenester rundt om i verden. I 2000 ble nøkkerkunnskap om grenser og evner for OCR-teknologi brukt til å utvikle CAPTCHA-programmene som ble brukt for å stoppe bots og spammere.

I løpet av tiårene har OCR vokst seg mer nøyaktig og mer sofistikert på grunn av fremskritt i relaterte teknologiområder som kunstig intelligens, maskinlæring og datasyn. I dag bruker OCR-programvare mønstergenkjenning, funksjonsdeteksjon og tekstutvinning for å transformere dokumenter raskere og mer nøyaktig enn noen gang før.