教學評論最新教學

如何使用 OCR 將影像轉換為 PDF

在本教程中,我們將完成提取所需的步驟光柵化文字圖像檔案中包含的內容,例如JPG或者PNG並將其轉換為純文本、可編輯文本,然後可以在流行的文檔格式中使用,例如PDF和 DOCX。

什麼是光學字元辨識?

OCR(即光學字元辨識)是將光柵影像中儲存的文字轉換為可在基於文字的文件(例如 DOCX 檔案)中編輯的文字的過程。 OCR 的工作原理是分析圖像檔案中存在的像素,尋找類似於書面文字字元的像素模式。關於OCR的詳細解釋,請看這個很棒的文章這很好地解釋了這一點。

儲存在圖像檔案中的文字有什麼問題?

只有圖像編輯軟體可以更改包含文字的圖像文件,如果圖像格式不支援圖層,則可能會變得複雜。最重要的是,文字在圖像文件中不可搜索,這使得基於關鍵字搜索來定位文件變得困難(如果不是不可能的話)。如果影像檔案主要包含文本,OCR 是將影像檔案(例如實體文件的掃描件)轉換為文件格式的理想選擇。

選擇您的工具

現在我們已準備好開始將一些圖像轉換為可編輯的文檔格式,您將需要選擇適合您需求的正確工具。我們的工具可以轉換為以下三種文件文件類型(這些工具的連結將在新的瀏覽器標籤中開啟):

選擇正確的工具後,您就可以選擇要上傳的圖像類型。預設情況下,對於 JPG 文件,這將是選定的來源文件格式。您可以使用位於工具左側的檔案來源檔案類型選擇器來變更此設定。

選擇您的文件

選擇正確的工具和格式後,您可以點擊「上傳檔案」按鈕來選擇要轉換的映像檔。如果您願意,也可以將最多 50 個檔案拖放到該工具上。您可以透過在工具顯示中拖曳縮圖來重新排序所選檔案。每個縮圖還具有左右旋轉按鈕,以便您在上傳之前正確定位圖像。

以下是合併工具的範例,其中選擇了四個 JPG 檔案並準備將其轉換為可編輯的 PDF 檔案:

合併工具與選取的文件

工具右側是OCR選項;預設情況下,此功能未啟用。如果您在提交文件時停用此選項,則建立的文件將僅包含圖像文件的嵌入副本。出於本教學的目的並示範OCR設定提供的純文字擷取,應啟用此功能。

選擇檔案並更改任何設定後,按一下「合併」按鈕,OCR 工具會將您的圖像檔案轉換為乾淨、純文字、可編輯的文字。

以下是已提交到合併工具的兩個文件的範例,最終圖像包含從第一個圖像中提取並保存為 PDF 文件的純可編輯文字:

原始紙本文件的掃描件
原始紙本文件的另一次掃描
掃描件透過 OCR 轉換為純文字

新增評論

暫無評論

成為第一個評論這篇文章的人。

© 2024 圖像到Stl。將您的 PNG 和 JPG 檔案轉換為 3D STL 檔案。

Your files are ready to download!