如何使用 OCR 將影像轉換為 PDF

在本教程中，我們將完成提取所需的步驟光柵化文字圖像檔案中包含的內容，例如JPG或者PNG並將其轉換為純文本、可編輯文本，然後可以在流行的文檔格式中使用，例如PDF和 DOCX。

什麼是光學字元辨識？

OCR（即光學字元辨識）是將光柵影像中儲存的文字轉換為可在基於文字的文件（例如 DOCX 檔案）中編輯的文字的過程。 OCR 的工作原理是分析圖像檔案中存在的像素，尋找類似於書面文字字元的像素模式。關於OCR的詳細解釋，請看這個很棒的文章這很好地解釋了這一點。

只有圖像編輯軟體可以更改包含文字的圖像文件，如果圖像格式不支援圖層，則可能會變得複雜。最重要的是，文字在圖像文件中不可搜索，這使得基於關鍵字搜索來定位文件變得困難（如果不是不可能的話）。如果影像檔案主要包含文本，OCR 是將影像檔案（例如實體文件的掃描件）轉換為文件格式的理想選擇。

現在我們已準備好開始將一些圖像轉換為可編輯的文檔格式，您將需要選擇適合您需求的正確工具。我們的工具可以轉換為以下三種文件文件類型（這些工具的連結將在新的瀏覽器標籤中開啟）：

選擇正確的工具後，您就可以選擇要上傳的圖像類型。預設情況下，對於 JPG 文件，這將是選定的來源文件格式。您可以使用位於工具左側的檔案來源檔案類型選擇器來變更此設定。

選擇正確的工具和格式後，您可以點擊「上傳檔案」按鈕來選擇要轉換的映像檔。如果您願意，也可以將最多 50 個檔案拖放到該工具上。您可以透過在工具顯示中拖曳縮圖來重新排序所選檔案。每個縮圖還具有左右旋轉按鈕，以便您在上傳之前正確定位圖像。

以下是合併工具的範例，其中選擇了四個 JPG 檔案並準備將其轉換為可編輯的 PDF 檔案：

工具右側是OCR選項；預設情況下，此功能未啟用。如果您在提交文件時停用此選項，則建立的文件將僅包含圖像文件的嵌入副本。出於本教學的目的並示範OCR設定提供的純文字擷取，應啟用此功能。

選擇檔案並更改任何設定後，按一下「合併」按鈕，OCR 工具會將您的圖像檔案轉換為乾淨、純文字、可編輯的文字。

以下是已提交到合併工具的兩個文件的範例，最終圖像包含從第一個圖像中提取並保存為 PDF 文件的純可編輯文字：

回饋

選擇遊戲

如果您正在等待檔案轉換，可以玩以下一些遊戲。無需下載或安裝；所有遊戲都將在新的瀏覽器標籤中開啟。

下載已過期

下載的文件已過期；請再試一次。我們會在 15 分鐘後刪除使用我們的工具轉換的文件，因此請在文件過期之前下載它們。

選擇選項

為了處理您的圖像，需要以下欄位。

寬度（像素）*

高度（像素）*

文件轉換器