Paano I-convert ang isang Larawan sa PDF gamit ang OCR

Sa tutorial na ito, dadaan tayo sa mga hakbang na kailangan para i-extract ang rasterized na teksto nilalamang nilalaman sa loob ng isang file ng imahe, tulad ng JPG o PNG at i-convert ito sa payak, nae-edit na teksto na maaaring magamit sa loob ng mga sikat na format ng dokumento gaya ng PDF at DOCX.

Ano ang OCR?

Ang OCR, o Optical Character Recognition, ay ang proseso ng pag-convert ng text na nakaimbak sa loob ng isang raster image sa text na maaaring i-edit sa loob ng isang text-based na dokumento, tulad ng isang DOCX file. Gumagana ang OCR sa pamamagitan ng pagsusuri sa mga pixel na nasa loob ng file ng imahe, na naghahanap ng mga pattern ng pixel na kahawig ng mga nakasulat na character ng teksto. Para sa isang detalyadong paliwanag ng OCR, pakitingnan ang mahusay na ito artikulo na nagpapaliwanag ng mabuti.

Ano ang mali sa text na nakaimbak sa isang image file?

Tanging ang software sa pag-edit ng larawan ang makakapagpabago ng isang text-containing image file, na maaaring maging kumplikado kung ang format ng larawan ay hindi sumusuporta sa mga layer. Higit pa rito, ang teksto ay hindi mahahanap sa loob ng file ng imahe, na ginagawang mahirap, kung hindi imposible, upang mahanap ang mga file batay sa paghahanap ng keyword. Ang OCR ay isang mainam na kandidato upang i-convert ang isang file ng imahe, tulad ng isang pag-scan ng isang pisikal na dokumento, sa isang format ng dokumento kung ito ay pangunahing naglalaman ng teksto.

Piliin ang iyong Tool

Ngayon na handa na kaming simulan ang pag-convert ng ilang larawan sa isang nae-edit na format ng dokumento, kakailanganin mong piliin ang tamang tool na nababagay sa iyong mga pangangailangan. Maaaring mag-convert ang aming mga tool sa sumusunod na tatlong uri ng file ng dokumento (magbubukas ang mga link sa mga tool na ito sa bagong tab ng browser ):

Kapag napili mo na ang tamang tool, maaari mo nang piliin ang uri ng larawang ina-upload mo. Bilang default, para sa JPG na mga file, ito ang magiging napiling format ng source file. Maaari mong baguhin ito sa pamamagitan ng paggamit ng file source file type selector na matatagpuan sa kaliwang bahagi ng tool.

Piliin ang iyong mga File

Gamit ang tamang tool at mga format na napili, maaari mong i-click ang button na "Mag-upload ng Mga File" upang piliin ang iyong mga image file na iko-convert. Maaari ka ring mag-drag at mag-drop ng hanggang 50 file papunta sa tool kung gusto mo. Maaari mong muling ayusin ang mga napiling file sa pamamagitan ng pag-drag ng kanilang mga thumbnail sa loob ng tool display. Ang bawat thumbnail ay mayroon ding mga pakaliwa at pakanang pindutan upang payagan kang i-orient nang tama ang iyong mga larawan bago i-upload.

Narito ang isang halimbawa ng tool na Pagsamahin na may apat na JPG file na napili at handa nang i-convert sa isang nae-edit na PDF file:

Pagsamahin ang Tool sa Mga Napiling File

Sa kanang bahagi ng tool ay ang OCR na opsyon; bilang default, hindi ito pinagana. Kung isinumite ang iyong mga file nang hindi pinagana ang opsyong ito, ang dokumentong gagawin ay maglalaman lamang ng mga naka-embed na kopya ng iyong mga file ng imahe. Para sa mga layunin ng tutorial na ito at upang ipakita ang plain text extraction na ibinigay ng setting ng OCR, dapat itong paganahin.

Kapag napili na ang iyong mga file at nabago ang anumang mga setting, i-click ang button na "Pagsamahin", at iko-convert ng OCR tool ang iyong mga file ng imahe sa malinis, payak, nae-edit na teksto.

Narito ang isang halimbawa ng dalawang file na isinumite sa Merge tool, ang huling larawan ay naglalaman ng plain na nae-edit na text na kinuha mula sa unang larawan at na-save bilang isang PDF na dokumento: