Hvordan fungerer OCR? Forklaret på en enkel og forståelig måte
I denne artikkelen forklarer vi hvordan OCR fungerer. OCR står for "Optical Character Recognition" og omtales ganske enkelt på tysk som tekstgjenkjenning. Dette betyr at en datamaskin kan gjenkjenne tekst på et skannet bilde ved hjelp av OCR og deretter konvertere den til et enkelt tekstdokument.
Slik fungerer OCR
Se for deg at du fikk en papirpresentasjon fra en kollega. Du vil nå redigere disse på PC-en fordi du ikke liker individuelle passasjer. Så skann det og gå til OCR-programmet. Nå skjer følgende:
- Programvaren gjør først en såkalt layoutanalyse. For å gjøre dette, ser hun på sideoppsettet og skiller bilder fra tekst. Hun noterer også deres plassering på siden. Deretter telles antall avsnitt og individuelle elementer som for eksempel sidetall lagres.
- Nå kommer den harde delen. Programvaren ser på de enkelte tekstblokkene og deler dem opp i setninger. Setningene blir deretter delt opp i enkeltord og ordene i bokstaver.
- OCR-programvaren inneholder mønstre med bokstaver og tegn. Programmet sammenligner nå de skannede bokstavene med disse mønstrene. Hvis de er 99% like, bestemmer algoritmen at det sannsynligvis må være den bokstaven. Det er veldig presist fordi det kan sammenligne mange mønstre på kort tid. På denne måten skiller han med suksess mellom en "8" og en "B".
- Så bokstavene og tegnene blir gradvis gjenkjent. Deretter kombineres de igjen som ord og settes tilbake på sin plass i setningen. Så snart programvaren er ferdig, lagres det hele i et normalt dokument, som du deretter kan redigere. Ferdig!
Vil du teste programvarekunnskapen din? Delta i vår store programvarequiz!