Cara Mengonversi Gambar ke PDF menggunakan OCR
Dalam tutorial ini, kita akan melalui langkah-langkah yang diperlukan untuk mengekstrak teks raster konten yang terkandung dalam file gambar, seperti JPG atau PNG dan mengubahnya menjadi teks biasa yang dapat diedit yang kemudian dapat digunakan dalam format dokumen populer seperti PDF dan DOCX.
Apa itu OCR?
OCR, atau Pengenalan Karakter Optik, adalah proses mengubah teks yang disimpan dalam gambar raster menjadi teks yang dapat diedit dalam dokumen berbasis teks, seperti file DOCX. OCR bekerja dengan menganalisis piksel yang ada di dalam file gambar, mencari pola piksel yang menyerupai karakter teks tertulis. Untuk penjelasan rinci tentang OCR, silakan lihat ini bagus artikel itu menjelaskannya dengan baik.
Apa yang salah dengan teks yang disimpan dalam file gambar?
Hanya perangkat lunak pengedit gambar yang dapat mengubah file gambar yang berisi teks, yang dapat menjadi rumit jika format gambar tidak mendukung lapisan. Selain itu, teks tidak dapat dicari dalam file gambar, sehingga sulit, bahkan tidak mungkin, untuk menemukan file berdasarkan pencarian kata kunci. OCR adalah kandidat ideal untuk mengonversi file gambar, seperti pindaian dokumen fisik, ke format dokumen jika sebagian besar berisi teks.
Pilih Alat Anda
Sekarang kami siap untuk mulai mengonversi beberapa gambar ke format dokumen yang dapat diedit, Anda harus memilih alat yang tepat dan sesuai dengan kebutuhan Anda. Alat kami dapat mengonversi ke tiga jenis file dokumen berikut (tautan ke alat ini akan terbuka di tab browser baru ):
Setelah Anda memilih alat yang benar, Anda kemudian dapat memilih jenis gambar yang Anda unggah. Secara default, untuk file JPG, ini akan menjadi format file sumber yang dipilih. Anda dapat mengubahnya dengan menggunakan pemilih jenis file sumber file yang terletak di sisi kiri alat.
Pilih File Anda
Dengan memilih alat dan format yang benar, Anda dapat mengklik tombol "Unggah File" untuk memilih file gambar yang akan dikonversi. Anda juga dapat menarik dan melepas hingga 50 file ke alat ini jika Anda mau. Anda dapat mengurutkan ulang file yang dipilih dengan menyeret thumbnail-nya ke dalam tampilan alat. Setiap thumbnail juga memiliki tombol putar ke kiri dan kanan untuk memungkinkan Anda mengorientasikan gambar dengan benar sebelum diunggah.
Berikut adalah contoh alat Penggabungan dengan empat file JPG yang dipilih dan siap diubah menjadi file PDF yang dapat diedit:
Di sisi kanan alat terdapat opsi OCR ; secara default, ini tidak diaktifkan. Jika file Anda dikirimkan dengan opsi ini dinonaktifkan, dokumen yang akan dibuat hanya akan berisi salinan file gambar Anda yang tersemat. Untuk keperluan tutorial ini dan untuk mendemonstrasikan ekstraksi teks biasa yang disediakan oleh pengaturan OCR, ini harus diaktifkan.
Setelah file Anda dipilih dan pengaturan diubah, klik tombol "Gabung", dan alat OCR akan mengubah file gambar Anda menjadi teks yang bersih, polos, dan dapat diedit.
Berikut adalah contoh dua file yang telah dikirimkan ke alat Penggabungan, gambar akhir berisi teks biasa yang dapat diedit yang diekstraksi dari gambar pertama dan disimpan sebagai dokumen PDF:
Tambahkan komentar
Tidak ada komentar
Jadilah orang pertama yang mengomentari artikel ini.