在Mac電腦上使用OCR光學文字識別功能
UPDF 的 OCR 功能可讓您將 PDF 文件的掃描文字轉換為可搜尋和可編輯的內容。透過此功能,還可以編輯跨圖像的數據,使文件對使用者俱有互動性。
官網的搭載 Apple 芯片的 UPDF 具有OCR功能,不過,搭載Intel芯片的Mac版本和Mac App Store版本尚未發布OCR功能。
接下來,我們將指導您使用 UPDF 的 OCR 功能。或者,有興趣的用戶可以觀看此綜合影片指南以了解更多資訊:
如何下載並安裝 OCR
開啟文件後,導覽至右側工具列上的「使用 OCR 識別文字」按鈕。
如果您是第一次使用此功能,則必須將其下載為 UPDF 外掛程式。點擊彈出視窗中的“安裝”按鈕繼續該過程。
您將自動重定向到下一個窗口,該窗口將顯示該功能的安裝進度。在使用該功能之前,請先在您的 Windows 裝置上成功安裝功能。
如何 OCR PDF
安裝後,關閉視窗並導航至相同按鈕以透過 UPDF 存取 OCR 工具。當它打開時,它將為您提供兩種不同的文件類型選項,包括“可搜尋 PDF”和“僅圖像 PDF”。
- 可搜尋的 PDF:透過選擇此選項,它將掃描的 PDF 文件轉換為可搜尋和可編輯的文件。
- 僅圖像 PDF:選擇此選項時,它將將可搜尋和可編輯的文檔轉換為基於圖像的 PDF 文檔,該文檔既不可搜尋也不可編輯。
文件類型:可搜尋 PDF
如果您選擇“可搜尋 PDF”,它會將掃描的 PDF 文件轉換為可編輯和可搜尋的文件。
佈局
要進行此設置,您必須先使用下拉式選單中的可用選項確定正確的「佈局」。設定流程佈局時,您將獲得三個不同的選項:
- 僅文字和圖片:識別的文字和圖像將保存在將建立的 PDF 文件中。創建的文件也更小,並且可能具有與原始文件不同的視覺結構。
- 頁面上的文字圖像:此模式負責保留執行 OCR 的來源文件中的背景圖像和插圖。這些文件較大;但是,它們在視覺上可能與原件有所不同。
- 頁面影像下的文字:在此模式下,保留 PDF 影像;然而,識別的文本被放置在圖像下方的不可見層下。此文件類型與原始 PDF 文件完全相同。
點擊“齒輪”圖示以存取您可以為文件定義的更多佈局設定。在這裡,您可以指定是否要“保留圖片”,同時在“低”、“平衡”或“高”之間進行選擇,以保存比原始文件更小的文件,並具有值得稱讚的圖像和圖片質量。
文件語言、影像解析度和頁面範圍:
使用下拉式選單中的 38 種不同語言選項定義適當的文件語言。這為 UPDF 提供了更好的基礎來準確識別文件中的文字。
您也可以使用“影像解析度”選項為影像指定適當的解析度設定。處理“頁面範圍”並點擊“執行 OCR”以使用定義的設定在檔案中執行 OCR。
文件類型:純圖像 PDF
如果您繼續使用“僅限圖像 PDF”,它會將您的可搜尋和可編輯文件轉換為既不可搜尋也不可編輯的基於圖像的 PDF 文件。
- 透過選擇「低」、「平衡」或「高」的任何可用選項,在「保持圖片」部分下設定影像品質。
- 決定是否要使用 MRC 壓縮影像。
- 提供適當的“頁面範圍”並按一下“執行 OCR”以對文件執行操作。選擇資料夾,您將立即獲得掃描的 PDF 文件。
Windows • macOS • iOS • Android 100% 安全性