Hvordan konvertere et bilde til PDF ved hjelp av OCR

I denne opplæringen vil vi gå gjennom trinnene som trengs for å trekke ut rasterisert tekst innhold i en bildefil, for eksempel JPG eller PNG og konverter dette til ren, redigerbar tekst som deretter kan brukes innenfor populære dokumentformater som f.eks PDF og DOCX.

Hva er OCR?

OCR, eller Optical Character Recognition, er prosessen med å konvertere tekst lagret i et rasterbilde til tekst som kan redigeres i et tekstbasert dokument, for eksempel en DOCX-fil. OCR fungerer ved å analysere pikslene som er tilstede i bildefilen, på jakt etter pikselmønstre som ligner skrevne teksttegn. For en detaljert forklaring av OCR, se denne flotte artikkel det forklarer det godt.

Hva er galt med tekst som er lagret i en bildefil?

Bare bilderedigeringsprogramvare kan endre en tekstinneholdende bildefil, som kan bli kompleks hvis bildeformatet ikke støtter lag. På toppen av dette er teksten ikke søkbar i bildefilen, noe som gjør det vanskelig, om ikke umulig, å finne filer basert på et nøkkelordsøk. OCR er en ideell kandidat til å konvertere en bildefil, for eksempel en skanning av et fysisk dokument, til et dokumentformat hvis den primært inneholder tekst.

Velg verktøyet ditt

Nå som vi er klare til å begynne å konvertere noen bilder til et redigerbart dokumentformat, må du velge riktig verktøy som passer dine behov. Verktøyene våre kan konvertere til følgende tre dokumentfiltyper (lenker til disse verktøyene åpnes i en ny nettleserfane ):

Når du har valgt riktig verktøy, kan du velge hvilken type bilde du laster opp. Som standard, for JPG-filer, vil dette være det valgte kildefilformatet. Du kan endre dette ved å bruke filkildefiltypevelgeren på venstre side av verktøyet.

Velg filene dine

Med riktig verktøy og formater valgt, kan du klikke på "Last opp filer"-knappen for å velge bildefilene du vil konvertere. Du kan også dra og slippe opptil 50 filer på verktøyet hvis du foretrekker det. Du kan omorganisere de valgte filene ved å dra miniatyrbildene deres i verktøydisplayet. Hvert miniatyrbilde har også roteringsknapper til venstre og høyre slik at du kan orientere bildene dine riktig før de lastes opp.

Her er et eksempel på fletteverktøyet med fire JPG filer valgt og klare til å bli konvertert til en redigerbar PDF fil:

Til høyre for verktøyet er OCR- alternativet; som standard er dette ikke aktivert. Hvis filene dine ble sendt med dette alternativet deaktivert, ville dokumentet som skulle opprettes ganske enkelt inneholde innebygde kopier av bildefilene dine. For formålet med denne opplæringen og for å demonstrere ren tekstutvinningen som tilbys av OCR- innstillingen, bør dette være aktivert.

Når filene dine er valgt og eventuelle innstillinger endret, klikker du på "Merge"-knappen, og OCR-verktøyet vil konvertere bildefilene dine til ren, ren, redigerbar tekst.

Her er et eksempel på to filer som har blitt sendt til sammenslåingsverktøyet, det endelige bildet inneholder den vanlige redigerbare teksten som ble trukket ut fra det første bildet og lagret som et PDF dokument:

En skanning av et originalt papirdokument

Nok en skanning av et originalt papirdokument

Skanningen konvertert til ren tekst via OCR

Tilbakemelding

Avbryt Sende

Velg Spill

Hvis du venter på at filene dine skal konverteres, er det noen spill du kan spille her. Ingen nedlasting eller installasjon er nødvendig; alle spill åpnes i en ny nettleserfane.

Nedlastingen er utløpt

Nedlastningsfilene har utløpt; Vær så snill, prøv på nytt. Vi sletter filer som er konvertert med verktøyene våre etter 15 minutter, så last ned filene dine før de utløper.

Lukk

Velg Alternativer

Følgende felt er obligatoriske for å behandle bildet ditt.

Bredde (px)*

Høyde (px)*

Avbryt Fortsette

Filkonvertering

Lukk

Hvordan konvertere et bilde til PDF ved hjelp av OCR

Hva er OCR?

Hva er galt med tekst som er lagret i en bildefil?

Velg verktøyet ditt

Velg filene dine

Legg til en kommentar

Ingen kommentarer

SISTE VEILEDNINGER

tilbakemelding mottatt