Come convertire un'immagine in PDF utilizzando l'OCR
In questo tutorial, eseguiremo i passaggi necessari per estrarre il file testo rasterizzato contenuto contenuto in un file immagine, come ad esempio JPG O PNG e convertirlo in testo semplice e modificabile che può quindi essere utilizzato nei formati di documenti più diffusi come PDF e DOCX.
Cos'è l'OCR?
L'OCR, o riconoscimento ottico dei caratteri, è il processo di conversione del testo memorizzato in un'immagine raster in testo che può essere modificato all'interno di un documento basato su testo, come un file DOCX. L'OCR funziona analizzando i pixel presenti nel file immagine, cercando modelli di pixel che assomiglino a caratteri di testo scritto. Per una spiegazione dettagliata dell'OCR, vedere questo fantastico articolo questo lo spiega bene.
Cosa c'è di sbagliato nel testo memorizzato in un file immagine?
Solo il software di editing delle immagini può alterare un file immagine contenente testo, il che può diventare complesso se il formato dell'immagine non supporta i livelli. Oltre a ciò, il testo non è ricercabile all'interno del file immagine, rendendo difficile, se non impossibile, individuare i file in base a una ricerca per parola chiave. L'OCR è un candidato ideale per convertire un file immagine, come la scansione di un documento fisico, in un formato documento se contiene principalmente testo.
Seleziona il tuo strumento
Ora che siamo pronti per iniziare a convertire alcune immagini in un formato di documento modificabile, dovrai scegliere lo strumento corretto adatto alle tue esigenze. I nostri strumenti possono convertire nei seguenti tre tipi di file di documenti (i collegamenti a questi strumenti si apriranno in una nuova scheda del browser ):
Dopo aver selezionato lo strumento corretto, puoi selezionare il tipo di immagine che stai caricando. Per impostazione predefinita, per i file JPG, questo sarà il formato file di origine selezionato. Puoi modificarlo utilizzando il selettore del tipo di file di origine del file situato sul lato sinistro dello strumento.
Seleziona i tuoi file
Con lo strumento e i formati corretti selezionati, puoi fare clic sul pulsante "Carica file" per selezionare i file di immagine da convertire. Se preferisci, puoi anche trascinare e rilasciare fino a 50 file nello strumento. È possibile riordinare i file selezionati trascinando le relative miniature all'interno della visualizzazione dello strumento. Ogni miniatura dispone inoltre di pulsanti di rotazione sinistra e destra per consentirti di orientare correttamente le immagini prima del caricamento.
Ecco un esempio dello strumento Unisci con quattro file JPG selezionati e pronti per essere convertiti in un file PDF modificabile:
Sul lato destro dello strumento c'è l'opzione OCR ; per impostazione predefinita, questo non è abilitato. Se i tuoi file fossero stati inviati con questa opzione disabilitata, il documento che verrebbe creato conterrebbe semplicemente copie incorporate dei tuoi file di immagine. Ai fini di questo tutorial e per dimostrare l'estrazione del testo semplice fornita dall'impostazione OCR, questa dovrebbe essere abilitata.
Una volta selezionati i file e modificate le impostazioni, fai clic sul pulsante "Unisci" e lo strumento OCR convertirà i file immagine in testo pulito, semplice e modificabile.
Ecco un esempio di due file che sono stati inviati allo strumento Unisci, l'immagine finale contiene il semplice testo modificabile che è stato estratto dalla prima immagine e salvato come documento PDF:
Aggiungi un commento
Non ci sono commenti
Sii il primo a commentare questo articolo.