Cara Menukar Imej kepada PDF menggunakan OCR
Dalam tutorial ini, kita akan melalui langkah-langkah yang diperlukan untuk mengekstrak teks rasterisasi kandungan yang terkandung dalam fail imej, seperti JPG atau PNG dan tukar ini kepada teks biasa yang boleh diedit yang kemudiannya boleh digunakan dalam format dokumen popular seperti PDF dan DOCX.
Apakah OCR?
OCR, atau Pengecaman Aksara Optik, ialah proses menukar teks yang disimpan dalam imej raster kepada teks yang boleh diedit dalam dokumen berasaskan teks, seperti fail DOCX. OCR berfungsi dengan menganalisis piksel yang terdapat dalam fail imej, mencari corak piksel yang menyerupai aksara teks bertulis. Untuk penjelasan terperinci tentang OCR, sila lihat hebat ini artikel yang menerangkannya dengan baik.
Apakah yang salah dengan teks yang disimpan dalam fail imej?
Hanya perisian penyuntingan imej boleh mengubah fail imej yang mengandungi teks, yang boleh menjadi rumit jika format imej tidak menyokong lapisan. Selain itu, teks tidak boleh dicari dalam fail imej, menjadikannya sukar, jika tidak mustahil, untuk mencari fail berdasarkan carian kata kunci. OCR ialah calon yang sesuai untuk menukar fail imej, seperti imbasan dokumen fizikal, kepada format dokumen jika ia mengandungi teks terutamanya.
Pilih Alat anda
Kini setelah kami bersedia untuk mula menukar beberapa imej kepada format dokumen boleh diedit, anda perlu memilih alat yang betul yang sesuai dengan keperluan anda. Alat kami boleh menukar kepada tiga jenis fail dokumen berikut (pautan ke alat ini akan dibuka dalam tab penyemak imbas baharu ):
Sebaik sahaja anda telah memilih alat yang betul, anda boleh memilih jenis imej yang anda muat naik. Secara lalai, untuk fail JPG, ini akan menjadi format fail sumber yang dipilih. Anda boleh menukar ini dengan menggunakan pemilih jenis fail sumber fail yang terletak di sebelah kiri alat.
Pilih Fail anda
Dengan alat dan format yang betul dipilih, anda boleh mengklik butang "Muat Naik Fail" untuk memilih fail imej anda untuk ditukar. Anda juga boleh menyeret dan melepaskan sehingga 50 fail ke alat jika anda mahu. Anda boleh menyusun semula fail yang dipilih dengan menyeret lakaran kenit mereka dalam paparan alat. Setiap lakaran kenit juga mempunyai butang putar ke kiri dan kanan untuk membolehkan anda mengorientasikan imej anda dengan betul sebelum memuat naik.
Berikut ialah contoh alat Gabung dengan empat JPG fail yang dipilih dan sedia untuk ditukar kepada fail PDF yang boleh diedit:
Di sebelah kanan alat ialah pilihan OCR ; secara lalai, ini tidak didayakan. Jika fail anda diserahkan dengan pilihan ini dilumpuhkan, dokumen yang akan dibuat hanya akan mengandungi salinan terbenam fail imej anda. Untuk tujuan tutorial ini dan untuk menunjukkan pengekstrakan teks biasa yang disediakan oleh tetapan OCR, ini harus didayakan.
Setelah fail anda telah dipilih dan sebarang tetapan ditukar, klik butang "Gabung", dan alat OCR akan menukar fail imej anda kepada teks yang bersih, biasa dan boleh diedit.
Berikut ialah contoh dua fail yang telah diserahkan kepada alat Gabung, imej akhir mengandungi teks boleh diedit biasa yang telah diekstrak daripada imej pertama dan disimpan sebagai dokumen PDF:
Tambah komen
Tiada komen
Jadilah yang pertama mengulas artikel ini.