Kép konvertálása PDF formátumba az OCR használatával
Ebben az oktatóanyagban végigvesszük a kibontásához szükséges lépéseket raszteres szöveg egy képfájlban található tartalom, mint pl JPG vagy PNG és konvertálja ezt sima, szerkeszthető szöveggé, amely aztán felhasználható olyan népszerű dokumentumformátumokban, mint pl PDF és DOCX.
Mi az az OCR?
Az OCR vagy az optikai karakterfelismerés az a folyamat, amely során a raszterképen tárolt szöveget szöveges dokumentumban, például DOCX-fájlban szerkeszthető szöveggé alakítják. Az OCR a képfájlban található pixelek elemzésével működik, és olyan képpontmintákat keres, amelyek az írott szöveg karaktereire hasonlítanak. Az OCR részletes magyarázatához lásd ezt a nagyszerűt cikk ez jól megmagyarázza.
Mi a baj a képfájlban tárolt szöveggel?
Csak a képszerkesztő szoftver tudja módosítani a szöveget tartalmazó képfájlt, amely bonyolulttá válhat, ha a képformátum nem támogatja a rétegeket. Ráadásul a szöveg nem kereshető a képfájlban, ami megnehezíti, ha nem lehetetlenné teszi a fájlok kulcsszavas keresés alapján történő megtalálását. Az OCR ideális választás egy képfájl (például egy fizikai dokumentum beolvasása) dokumentumformátummá konvertálására, ha az elsősorban szöveget tartalmaz.
Válassza ki az eszközt
Most, hogy készen állunk néhány kép szerkeszthető dokumentumformátummá konvertálására, ki kell választania az igényeinek megfelelő eszközt. Eszközeink a következő három dokumentumfájltípusra képesek konvertálni (az eszközökre mutató hivatkozások egy új böngészőlapon nyílnak meg ):
Miután kiválasztotta a megfelelő eszközt, kiválaszthatja a feltöltendő kép típusát. Alapértelmezés szerint JPG fájlok esetén ez lesz a kiválasztott forrásfájlformátum. Ezt az eszköz bal oldalán található fájlforrás fájltípus-választó segítségével módosíthatja.
Válassza ki a fájljait
A megfelelő eszköz és formátum kiválasztása után a "Fájlok feltöltése" gombra kattintva kiválaszthatja a konvertálandó képfájlokat. Ha úgy tetszik, akár 50 fájlt is áthúzhat az eszközre. A kiválasztott fájlokat átrendezheti úgy, hogy húzza a miniatűröket az eszköz kijelzőjén. Minden miniatűr balra és jobbra forgatható gombokkal rendelkezik, amelyek lehetővé teszik a képek helyes tájolását a feltöltés előtt.
Íme egy példa az Egyesítés eszközre, amelyben négy JPG fájl van kiválasztva, és készen áll a konvertálásra szerkeszthető PDF fájllá:
Az eszköz jobb oldalán található az OCR opció; alapértelmezés szerint ez nincs engedélyezve. Ha a fájlokat úgy küldte be, hogy ez az opció le van tiltva, akkor a létrehozandó dokumentum egyszerűen a képfájlok beágyazott másolatait tartalmazza. Ennek az oktatóanyagnak a céljaira és az OCR- beállítás által biztosított egyszerű szöveg-kivonás bemutatására ezt engedélyezni kell.
Miután kiválasztotta a fájlokat, és módosította a beállításokat, kattintson az "Egyesítés" gombra, és az OCR eszköz a képfájlokat tiszta, egyszerű, szerkeszthető szöveggé konvertálja.
Íme egy példa két fájlra, amelyeket elküldtek az Egyesítés eszközbe, a végső kép tartalmazza az egyszerű szerkeszthető szöveget, amelyet az első képből kinyertek és PDF dokumentumként mentettek el:
Hozzászólni
Nincs hozzászólás
Legyen Ön az első, aki hozzászól ehhez a cikkhez.