Cara Mengonversi Gambar ke PDF menggunakan OCR

Dalam tutorial ini, kita akan melalui langkah-langkah yang diperlukan untuk mengekstrak teks raster konten yang terkandung dalam file gambar, seperti JPG atau PNG dan mengubahnya menjadi teks biasa yang dapat diedit yang kemudian dapat digunakan dalam format dokumen populer seperti PDF dan DOCX.

Apa itu OCR?

OCR, atau Pengenalan Karakter Optik, adalah proses mengubah teks yang disimpan dalam gambar raster menjadi teks yang dapat diedit dalam dokumen berbasis teks, seperti file DOCX. OCR bekerja dengan menganalisis piksel yang ada di dalam file gambar, mencari pola piksel yang menyerupai karakter teks tertulis. Untuk penjelasan rinci tentang OCR, silakan lihat ini bagus artikel itu menjelaskannya dengan baik.

Apa yang salah dengan teks yang disimpan dalam file gambar?

Hanya perangkat lunak pengedit gambar yang dapat mengubah file gambar yang berisi teks, yang dapat menjadi rumit jika format gambar tidak mendukung lapisan. Selain itu, teks tidak dapat dicari dalam file gambar, sehingga sulit, bahkan tidak mungkin, untuk menemukan file berdasarkan pencarian kata kunci. OCR adalah kandidat ideal untuk mengonversi file gambar, seperti pindaian dokumen fisik, ke format dokumen jika sebagian besar berisi teks.

Pilih Alat Anda

Sekarang kami siap untuk mulai mengonversi beberapa gambar ke format dokumen yang dapat diedit, Anda harus memilih alat yang tepat dan sesuai dengan kebutuhan Anda. Alat kami dapat mengonversi ke tiga jenis file dokumen berikut (tautan ke alat ini akan terbuka di tab browser baru ):

Setelah Anda memilih alat yang benar, Anda kemudian dapat memilih jenis gambar yang Anda unggah. Secara default, untuk file JPG, ini akan menjadi format file sumber yang dipilih. Anda dapat mengubahnya dengan menggunakan pemilih jenis file sumber file yang terletak di sisi kiri alat.

Pilih File Anda

Dengan memilih alat dan format yang benar, Anda dapat mengklik tombol "Unggah File" untuk memilih file gambar yang akan dikonversi. Anda juga dapat menarik dan melepas hingga 50 file ke alat ini jika Anda mau. Anda dapat mengurutkan ulang file yang dipilih dengan menyeret thumbnail-nya ke dalam tampilan alat. Setiap thumbnail juga memiliki tombol putar ke kiri dan kanan untuk memungkinkan Anda mengorientasikan gambar dengan benar sebelum diunggah.

Berikut adalah contoh alat Penggabungan dengan empat file JPG yang dipilih dan siap diubah menjadi file PDF yang dapat diedit:

Di sisi kanan alat terdapat opsi OCR ; secara default, ini tidak diaktifkan. Jika file Anda dikirimkan dengan opsi ini dinonaktifkan, dokumen yang akan dibuat hanya akan berisi salinan file gambar Anda yang tersemat. Untuk keperluan tutorial ini dan untuk mendemonstrasikan ekstraksi teks biasa yang disediakan oleh pengaturan OCR, ini harus diaktifkan.

Setelah file Anda dipilih dan pengaturan diubah, klik tombol "Gabung", dan alat OCR akan mengubah file gambar Anda menjadi teks yang bersih, polos, dan dapat diedit.

Berikut adalah contoh dua file yang telah dikirimkan ke alat Penggabungan, gambar akhir berisi teks biasa yang dapat diedit yang diekstraksi dari gambar pertama dan disimpan sebagai dokumen PDF:

Pemindaian lain dari dokumen kertas asli

Pemindaian diubah menjadi teks biasa melalui OCR

Masukan

Membatalkan Mengirim

Pilih Permainan

Jika Anda menunggu file Anda dikonversi, berikut beberapa permainan untuk dimainkan. Tidak diperlukan pengunduhan atau instalasi; semua game akan terbuka di tab browser baru.

Unduhan Telah Kedaluwarsa

File unduhan telah kedaluwarsa; silakan coba lagi. Kami menghapus file yang dikonversi menggunakan alat kami setelah 15 menit, jadi silakan unduh file Anda sebelum kedaluwarsa.

Menutup

Pilih Pilihan

Bidang berikut diperlukan untuk memproses gambar Anda.

Lebar (px)*

Tinggi (px)*

Membatalkan Melanjutkan

Konverter Berkas

Menutup

Cara Mengonversi Gambar ke PDF menggunakan OCR

Apa itu OCR?

Apa yang salah dengan teks yang disimpan dalam file gambar?

Pilih Alat Anda

Pilih File Anda

Tambahkan komentar

Tidak ada komentar

TUTORIAL TERBARU

Umpan Balik Diterima