Cum să convertiți o imagine în PDF utilizând OCR
În acest tutorial, vom parcurge pașii necesari pentru extragerea text rasterizat conținut conținut într-un fișier imagine, cum ar fi JPG sau PNG și convertiți-l în text simplu, editabil, care poate fi apoi utilizat în formate de document populare, cum ar fi PDF și DOCX.
Ce este OCR?
OCR, sau Recunoașterea optică a caracterelor, este procesul de conversie a textului stocat într-o imagine raster în text care poate fi editat într-un document bazat pe text, cum ar fi un fișier DOCX. OCR funcționează prin analiza pixelilor prezenți în fișierul imagine, căutând modele de pixeli care seamănă cu caracterele textului scris. Pentru o explicație detaliată a OCR, vă rugăm să vedeți acest minunat articol asta explica bine.
Ce este în neregulă cu textul stocat într-un fișier imagine?
Doar software-ul de editare a imaginilor poate modifica un fișier imagine care conține text, ceea ce poate deveni complex dacă formatul de imagine nu acceptă straturi. În plus, textul nu poate fi căutat în fișierul imagine, ceea ce face dificilă, dacă nu imposibilă, localizarea fișierelor pe baza unei căutări de cuvinte cheie. OCR este candidatul ideal pentru a converti un fișier imagine, cum ar fi scanarea unui document fizic, într-un format de document dacă acesta conține în principal text.
Selectați Instrumentul dvs
Acum că suntem gata să începem conversia unor imagini într-un format de document editabil, va trebui să alegeți instrumentul corect care se potrivește nevoilor dvs. Instrumentele noastre se pot converti în următoarele trei tipuri de fișiere de document (linkurile către aceste instrumente se vor deschide într-o filă nouă de browser ):
După ce ați selectat instrumentul corect, puteți selecta tipul de imagine pe care o încărcați. În mod implicit, pentru fișierele JPG, acesta va fi formatul de fișier sursă selectat. Puteți modifica acest lucru utilizând selectorul de tip de fișier sursă al fișierului situat în partea stângă a instrumentului.
Selectați fișierele dvs
Cu instrumentul și formatele corecte selectate, puteți face clic pe butonul „Încărcați fișiere” pentru a selecta fișierele de imagine de convertit. Puteți, de asemenea, să glisați și să plasați până la 50 de fișiere în instrument, dacă doriți. Puteți reordona fișierele selectate trăgând miniaturile acestora în afișajul instrumentului. Fiecare miniatură are, de asemenea, butoane de rotire la stânga și la dreapta pentru a vă permite să vă orientați corect imaginile înainte de încărcare.
Iată un exemplu de instrument Merge cu patru fișiere JPG selectate și gata pentru a fi convertite într-un fișier editabil PDF:
În partea dreaptă a instrumentului se află opțiunea OCR ; implicit, aceasta nu este activată. Dacă fișierele dvs. au fost trimise cu această opțiune dezactivată, documentul care ar fi creat ar conține pur și simplu copii încorporate ale fișierelor dvs. imagine. În scopul acestui tutorial și pentru a demonstra extragerea textului simplu oferită de setarea OCR, aceasta ar trebui să fie activată.
Odată ce fișierele dvs. au fost selectate și toate setările schimbate, faceți clic pe butonul „Îmbinare”, iar instrumentul OCR va converti fișierele dvs. de imagine în text curat, simplu și editabil.
Iată un exemplu de două fișiere care au fost trimise instrumentului Merge, imaginea finală conține textul simplu editabil care a fost extras din prima imagine și salvat ca document PDF:
Adauga un comentariu
Fara comentarii
Fii primul care comentează acest articol.