Kép konvertálása PDF formátumba az OCR használatával

Ebben az oktatóanyagban végigvesszük a kibontásához szükséges lépéseket raszteres szöveg egy képfájlban található tartalom, mint pl JPG vagy PNG és konvertálja ezt sima, szerkeszthető szöveggé, amely aztán felhasználható olyan népszerű dokumentumformátumokban, mint pl PDF és DOCX.

Mi az az OCR?

Az OCR vagy az optikai karakterfelismerés az a folyamat, amely során a raszterképen tárolt szöveget szöveges dokumentumban, például DOCX-fájlban szerkeszthető szöveggé alakítják. Az OCR a képfájlban található pixelek elemzésével működik, és olyan képpontmintákat keres, amelyek az írott szöveg karaktereire hasonlítanak. Az OCR részletes magyarázatához lásd ezt a nagyszerűt cikk ez jól megmagyarázza.

Mi a baj a képfájlban tárolt szöveggel?

Csak a képszerkesztő szoftver tudja módosítani a szöveget tartalmazó képfájlt, amely bonyolulttá válhat, ha a képformátum nem támogatja a rétegeket. Ráadásul a szöveg nem kereshető a képfájlban, ami megnehezíti, ha nem lehetetlenné teszi a fájlok kulcsszavas keresés alapján történő megtalálását. Az OCR ideális választás egy képfájl (például egy fizikai dokumentum beolvasása) dokumentumformátummá konvertálására, ha az elsősorban szöveget tartalmaz.

Válassza ki az eszközt

Most, hogy készen állunk néhány kép szerkeszthető dokumentumformátummá konvertálására, ki kell választania az igényeinek megfelelő eszközt. Eszközeink a következő három dokumentumfájltípusra képesek konvertálni (az eszközökre mutató hivatkozások egy új böngészőlapon nyílnak meg ):

Miután kiválasztotta a megfelelő eszközt, kiválaszthatja a feltöltendő kép típusát. Alapértelmezés szerint JPG fájlok esetén ez lesz a kiválasztott forrásfájlformátum. Ezt az eszköz bal oldalán található fájlforrás fájltípus-választó segítségével módosíthatja.

Válassza ki a fájljait

A megfelelő eszköz és formátum kiválasztása után a "Fájlok feltöltése" gombra kattintva kiválaszthatja a konvertálandó képfájlokat. Ha úgy tetszik, akár 50 fájlt is áthúzhat az eszközre. A kiválasztott fájlokat átrendezheti úgy, hogy húzza a miniatűröket az eszköz kijelzőjén. Minden miniatűr balra és jobbra forgatható gombokkal rendelkezik, amelyek lehetővé teszik a képek helyes tájolását a feltöltés előtt.

Íme egy példa az Egyesítés eszközre, amelyben négy JPG fájl van kiválasztva, és készen áll a konvertálásra szerkeszthető PDF fájllá:

Az eszköz jobb oldalán található az OCR opció; alapértelmezés szerint ez nincs engedélyezve. Ha a fájlokat úgy küldte be, hogy ez az opció le van tiltva, akkor a létrehozandó dokumentum egyszerűen a képfájlok beágyazott másolatait tartalmazza. Ennek az oktatóanyagnak a céljaira és az OCR- beállítás által biztosított egyszerű szöveg-kivonás bemutatására ezt engedélyezni kell.

Miután kiválasztotta a fájlokat, és módosította a beállításokat, kattintson az "Egyesítés" gombra, és az OCR eszköz a képfájlokat tiszta, egyszerű, szerkeszthető szöveggé konvertálja.

Íme egy példa két fájlra, amelyeket elküldtek az Egyesítés eszközbe, a végső kép tartalmazza az egyszerű szerkeszthető szöveget, amelyet az első képből kinyertek és PDF dokumentumként mentettek el:

Egy eredeti papírdokumentum újabb beolvasása

A beolvasás egyszerű szöveggé alakult át OCR segítségével

Visszacsatolás

Megszünteti Küld

Válassza a Játék lehetőséget

Ha arra vár, hogy a fájlokat konvertálják, itt van néhány játék. Nincs szükség letöltésre vagy telepítésre; minden játék egy új böngészőlapon nyílik meg.

A letöltés lejárt

A letöltött fájlok lejártak; Kérlek próbáld újra. Az eszközeinkkel konvertált fájlokat 15 perc után töröljük, ezért kérjük, töltse le fájljait, mielőtt lejárnak.

Bezárás

Válassza az Opciók lehetőséget

A következő mezők kitöltése kötelező a kép feldolgozásához.

Szélesség (px)*

Magasság (px)*

Megszünteti Folytatni

Fájlkonverter

Bezárás

Kép konvertálása PDF formátumba az OCR használatával

Mi az az OCR?

Mi a baj a képfájlban tárolt szöveggel?

Válassza ki az eszközt

Válassza ki a fájljait

Hozzászólni

Nincs hozzászólás

LEGÚJABB OKTATÓANYAGOK

Visszajelzés érkezett