Hvordan konvertere et bilde til PDF ved hjelp av OCR
I denne opplæringen vil vi gå gjennom trinnene som trengs for å trekke ut rasterisert tekst innhold i en bildefil, for eksempel JPG eller PNG og konverter dette til ren, redigerbar tekst som deretter kan brukes innenfor populære dokumentformater som f.eks PDF og DOCX.
Hva er OCR?
OCR, eller Optical Character Recognition, er prosessen med å konvertere tekst lagret i et rasterbilde til tekst som kan redigeres i et tekstbasert dokument, for eksempel en DOCX-fil. OCR fungerer ved å analysere pikslene som er tilstede i bildefilen, på jakt etter pikselmønstre som ligner skrevne teksttegn. For en detaljert forklaring av OCR, se denne flotte artikkel det forklarer det godt.
Hva er galt med tekst som er lagret i en bildefil?
Bare bilderedigeringsprogramvare kan endre en tekstinneholdende bildefil, som kan bli kompleks hvis bildeformatet ikke støtter lag. På toppen av dette er teksten ikke søkbar i bildefilen, noe som gjør det vanskelig, om ikke umulig, å finne filer basert på et nøkkelordsøk. OCR er en ideell kandidat til å konvertere en bildefil, for eksempel en skanning av et fysisk dokument, til et dokumentformat hvis den primært inneholder tekst.
Velg verktøyet ditt
Nå som vi er klare til å begynne å konvertere noen bilder til et redigerbart dokumentformat, må du velge riktig verktøy som passer dine behov. Verktøyene våre kan konvertere til følgende tre dokumentfiltyper (lenker til disse verktøyene åpnes i en ny nettleserfane ):
Når du har valgt riktig verktøy, kan du velge hvilken type bilde du laster opp. Som standard, for JPG-filer, vil dette være det valgte kildefilformatet. Du kan endre dette ved å bruke filkildefiltypevelgeren på venstre side av verktøyet.
Velg filene dine
Med riktig verktøy og formater valgt, kan du klikke på "Last opp filer"-knappen for å velge bildefilene du vil konvertere. Du kan også dra og slippe opptil 50 filer på verktøyet hvis du foretrekker det. Du kan omorganisere de valgte filene ved å dra miniatyrbildene deres i verktøydisplayet. Hvert miniatyrbilde har også roteringsknapper til venstre og høyre slik at du kan orientere bildene dine riktig før de lastes opp.
Her er et eksempel på fletteverktøyet med fire JPG filer valgt og klare til å bli konvertert til en redigerbar PDF fil:
Til høyre for verktøyet er OCR- alternativet; som standard er dette ikke aktivert. Hvis filene dine ble sendt med dette alternativet deaktivert, ville dokumentet som skulle opprettes ganske enkelt inneholde innebygde kopier av bildefilene dine. For formålet med denne opplæringen og for å demonstrere ren tekstutvinningen som tilbys av OCR- innstillingen, bør dette være aktivert.
Når filene dine er valgt og eventuelle innstillinger endret, klikker du på "Merge"-knappen, og OCR-verktøyet vil konvertere bildefilene dine til ren, ren, redigerbar tekst.
Her er et eksempel på to filer som har blitt sendt til sammenslåingsverktøyet, det endelige bildet inneholder den vanlige redigerbare teksten som ble trukket ut fra det første bildet og lagret som et PDF dokument:
Legg til en kommentar
Ingen kommentarer
Vær den første til å kommentere denne artikkelen.