Πώς να μετατρέψετε μια εικόνα σε PDF χρησιμοποιώντας OCR
Σε αυτό το σεμινάριο, θα περάσουμε από τα βήματα που απαιτούνται για την εξαγωγή του ραστεροποιημένο κείμενο περιεχόμενο που περιέχεται σε ένα αρχείο εικόνας, όπως π.χ JPG ή PNG και μετατρέψτε το σε απλό, επεξεργάσιμο κείμενο που μπορεί στη συνέχεια να χρησιμοποιηθεί σε δημοφιλείς μορφές εγγράφων όπως PDF και DOCX.
Τι είναι το OCR;
Το OCR ή Optical Character Recognition, είναι η διαδικασία μετατροπής κειμένου που είναι αποθηκευμένο σε μια εικόνα ράστερ σε κείμενο που μπορεί να επεξεργαστεί σε ένα έγγραφο που βασίζεται σε κείμενο, όπως ένα αρχείο DOCX. Το OCR λειτουργεί αναλύοντας τα εικονοστοιχεία που υπάρχουν στο αρχείο εικόνας, αναζητώντας μοτίβα εικονοστοιχείων που μοιάζουν με χαρακτήρες γραπτού κειμένου. Για μια λεπτομερή εξήγηση του OCR, δείτε αυτό το υπέροχο άρθρο αυτό το εξηγεί καλά.
Τι συμβαίνει με το κείμενο που είναι αποθηκευμένο σε ένα αρχείο εικόνας;
Μόνο το λογισμικό επεξεργασίας εικόνας μπορεί να αλλάξει ένα αρχείο εικόνας που περιέχει κείμενο, το οποίο μπορεί να γίνει πολύπλοκο εάν η μορφή εικόνας δεν υποστηρίζει επίπεδα. Επιπλέον, το κείμενο δεν μπορεί να αναζητηθεί μέσα στο αρχείο εικόνας, γεγονός που καθιστά δύσκολο, αν όχι αδύνατο, τον εντοπισμό αρχείων με βάση μια αναζήτηση λέξεων-κλειδιών. Το OCR είναι ιδανικός υποψήφιος για τη μετατροπή ενός αρχείου εικόνας, όπως η σάρωση ενός φυσικού εγγράφου, σε μορφή εγγράφου, εάν περιέχει κυρίως κείμενο.
Επιλέξτε το εργαλείο σας
Τώρα που είμαστε έτοιμοι να ξεκινήσουμε τη μετατροπή ορισμένων εικόνων σε μορφή εγγράφου με δυνατότητα επεξεργασίας, θα πρέπει να επιλέξετε το σωστό εργαλείο που ταιριάζει στις ανάγκες σας. Τα εργαλεία μας μπορούν να μετατραπούν στους ακόλουθους τρεις τύπους αρχείων εγγράφων (οι σύνδεσμοι προς αυτά τα εργαλεία θα ανοίξουν σε μια νέα καρτέλα του προγράμματος περιήγησης ):
Αφού επιλέξετε το σωστό εργαλείο, μπορείτε στη συνέχεια να επιλέξετε τον τύπο της εικόνας που ανεβάζετε. Από προεπιλογή, για αρχεία JPG, αυτή θα είναι η επιλεγμένη μορφή αρχείου πηγής. Μπορείτε να το αλλάξετε χρησιμοποιώντας τον επιλογέα τύπου αρχείου προέλευσης αρχείου που βρίσκεται στην αριστερή πλευρά του εργαλείου.
Επιλέξτε τα Αρχεία σας
Με επιλεγμένο το σωστό εργαλείο και τις σωστές μορφές, μπορείτε να κάνετε κλικ στο κουμπί "Μεταφόρτωση αρχείων" για να επιλέξετε τα αρχεία εικόνας που θέλετε να μετατρέψετε. Μπορείτε επίσης να σύρετε και να αποθέσετε έως και 50 αρχεία στο εργαλείο, εάν προτιμάτε. Μπορείτε να αναδιατάξετε τα επιλεγμένα αρχεία σύροντας τις μικρογραφίες τους στην οθόνη του εργαλείου. Κάθε μικρογραφία έχει επίσης περιστρεφόμενα κουμπιά αριστερά και δεξιά για να σας επιτρέπουν να προσανατολίζετε σωστά τις εικόνες σας πριν τις ανεβάσετε.
Ακολουθεί ένα παράδειγμα του εργαλείου Συγχώνευση με τέσσερα JPG αρχεία επιλεγμένα και έτοιμα για μετατροπή σε επεξεργάσιμο αρχείο PDF:
Στη δεξιά πλευρά του εργαλείου βρίσκεται η επιλογή OCR. από προεπιλογή, αυτό δεν είναι ενεργοποιημένο. Εάν τα αρχεία σας υποβλήθηκαν με αυτή την επιλογή απενεργοποιημένη, το έγγραφο που θα δημιουργηθεί θα περιέχει απλώς ενσωματωμένα αντίγραφα των αρχείων εικόνας σας. Για τους σκοπούς αυτού του σεμιναρίου και για την επίδειξη της εξαγωγής απλού κειμένου που παρέχεται από τη ρύθμιση OCR, αυτό θα πρέπει να είναι ενεργοποιημένο.
Μόλις επιλεγούν τα αρχεία σας και αλλάξουν τυχόν ρυθμίσεις, κάντε κλικ στο κουμπί "Συγχώνευση" και το εργαλείο OCR θα μετατρέψει τα αρχεία εικόνας σας σε καθαρό, απλό, επεξεργάσιμο κείμενο.
Ακολουθεί ένα παράδειγμα δύο αρχείων που έχουν υποβληθεί στο εργαλείο συγχώνευσης, η τελική εικόνα περιέχει το απλό επεξεργάσιμο κείμενο που εξήχθη από την πρώτη εικόνα και αποθηκεύτηκε ως έγγραφο PDF:
Πρόσθεσε ένα σχόλιο
Χωρίς σχόλια
Γίνε ο πρώτος που θα σχολιάσει αυτό το άρθρο.