OCR Kullanarak Bir Görüntüyü PDF'ya Dönüştürme
Bu derste, dosyayı çıkarmak için gereken adımları izleyeceğiz. rasterleştirilmiş metin bir görüntü dosyasında bulunan içerik, örneğin JPG veya PNG ve bunu daha sonra aşağıdakiler gibi popüler belge formatlarında kullanılabilecek düz, düzenlenebilir metne dönüştürün:PDF ve DOCX.
OCR nedir?
OCR veya Optik Karakter Tanıma, taramalı bir görüntüde saklanan metni, DOCX dosyası gibi metin tabanlı bir belgede düzenlenebilecek metne dönüştürme işlemidir. OCR, görüntü dosyasında bulunan pikselleri analiz ederek, yazılı metin karakterlerine benzeyen piksel desenlerini arayarak çalışır. OCR'nin ayrıntılı bir açıklaması için lütfen bu harika madde bu onu iyi açıklıyor.
Bir görüntü dosyasında saklanan metinde sorun nedir?
Metin içeren bir görüntü dosyasını yalnızca görüntü düzenleme yazılımı değiştirebilir; görüntü formatı katmanları desteklemiyorsa bu durum karmaşık hale gelebilir. Üstelik metin, görüntü dosyası içinde aranamaz, bu da anahtar kelime aramasına dayalı olarak dosyaların yerini bulmayı imkansız olmasa da zorlaştırır. OCR, fiziksel bir belgenin taranması gibi bir görüntü dosyasını, öncelikle metin içeriyorsa belge biçimine dönüştürmek için ideal bir adaydır.
Aracınızı seçin
Artık bazı görüntüleri düzenlenebilir bir belge biçimine dönüştürmeye başlamaya hazır olduğumuza göre, ihtiyaçlarınıza uygun doğru aracı seçmeniz gerekecek. Araçlarımız aşağıdaki üç belge dosyası türüne dönüştürebilir (bu araçlara bağlantılar yeni bir tarayıcı sekmesinde açılacaktır ):
Doğru aracı seçtikten sonra yüklediğiniz görselin türünü seçebilirsiniz. Varsayılan olarak, JPG dosyalar için seçilen kaynak dosya formatı bu olacaktır. Aracın sol tarafında bulunan dosya kaynağı dosya türü seçiciyi kullanarak bunu değiştirebilirsiniz.
Dosyalarınızı seçin
Doğru araç ve formatlar seçildiğinde, dönüştürülecek resim dosyalarınızı seçmek için "Dosyaları Yükle" düğmesini tıklayabilirsiniz. İsterseniz araca 50'ye kadar dosyayı da sürükleyip bırakabilirsiniz. Seçilen dosyaların küçük resimlerini araç ekranında sürükleyerek yeniden sıralayabilirsiniz. Her küçük resimde ayrıca yüklemeden önce görsellerinizi doğru şekilde yönlendirmenize olanak tanıyan sola ve sağa döndürme düğmeleri bulunur.
Dört JPG dosyanın seçili ve düzenlenebilir bir PDF dosyaya dönüştürülmeye hazır olduğu Birleştirme aracının bir örneğini burada bulabilirsiniz:
Aracın sağ tarafında OCR seçeneği bulunur; varsayılan olarak bu etkin değildir. Dosyalarınız bu seçenek devre dışı bırakılarak gönderildiyse, oluşturulacak belge yalnızca resim dosyalarınızın gömülü kopyalarını içerecektir. Bu eğitimin amaçları doğrultusunda ve OCR ayarı tarafından sağlanan düz metin çıkarma işlemini göstermek için bu etkinleştirilmelidir.
Dosyalarınız seçildikten ve ayarlar değiştirildikten sonra, "Birleştir" düğmesini tıklayın; OCR aracı, görüntü dosyalarınızı temiz, sade, düzenlenebilir metne dönüştürecektir.
Burada Birleştirme aracına gönderilen iki dosyanın bir örneği verilmiştir; son görüntü, ilk görüntüden çıkarılan ve PDF belgesi olarak kaydedilen düz düzenlenebilir metni içerir:
Yorum ekle
Yorum yok
Bu yazıya ilk yorum yapan siz olun.