PDF 不允許任何人編輯資料,從而保持了資料完整性。除非使用 PDF 編輯器,否則我們無法直接編輯PDF文件。然而,有時您需要從 PDF 文件中獲取文字並在其他地方編輯/使用它。在這種情況下,在 Windows 上將 PDF 轉換為 TXT 就變得非常重要。在這裡,我們將向您展示如何在 Windows 上將 PDF 轉換為TXT的 3 種方法。
第 1 部分:使用 UPDF 在 Windows 上將 PDF 轉換為文字
在 Windows 作業係統的電腦上將 PDF 文件轉換為TXT的最佳方法是使用UDPF。 UPDF 是一款進階 PDF 編輯和閱讀工具,具有許多功能可滿足您的要求。在將 PDF 轉換 TXT 時,UPDF 支援 2 種轉換模式:普通 PDF 和掃描 PDF 的轉換。
Windows • macOS • iOS • Android 100% 安全性
1.在Windows上將普通PDF轉換為TXT
在Windows上將普通PDF轉換為TXT非常簡單,只需要以下3個步驟。
1. 在UPDF中開啟PDF文件
按“Windows”鍵,輸入“UPDF”,然後按 Enter 將其打開,或者您可以找到桌面捷徑並雙擊它以在電腦上開啟 UPDF。現在使用「開啟檔案」選項,您將進入需要找到 PDF 檔案的瀏覽視窗。找到它後,點擊選擇並點擊下面的“打開”按鈕,然後它將在 UPDF 中開啟該 PDF 文件。
2. 轉存為TXT
前往UPDF介面的右側面板,點選「轉存PDF」按鈕,它將向您顯示多個轉存的格式,例如 Word、Excel、PowerPoint、HTML 等,我們選擇轉存格式為TXT。
3. 保存文件
接下來,我們選擇檔案儲存位置並根據需要重新命名該檔案。最後,按一下“儲存”,UPDF 會將 PDF 文件轉換的TXT檔案儲存在該位置。
Windows • macOS • iOS • Android 100% 安全性
2. 在 Windows 上將掃描的 PDF 轉換為TXT
有的PDF文件是掃描件,文件裡面的文字是不能複製和修改的。面對這種PDF文件,我們需要先執行OCR,然後再將OCR處理完成後的PDF文件轉換為TXT文件。
1. 在UPDF應用程式中開啟PDF文檔
UPDF 開啟後,選擇「開啟檔案」選項,開啟瀏覽視窗。在這裡,您可以導航到要開啟的 PDF 文件的位置。
找到所需的 PDF 後,按一下將其選中,然後按下面的「開啟」按鈕。然後,UPDF 將繼續開啟並顯示所選的 PDF 文件。
2. 執行OCR
點擊右側選單中的“使用 OCR 識別文字”按鈕。它將打開設定 OCR 設定的選項。我們將遵循本例中的預設選項,然後按一下「執行 OCR」按鈕。現在,在瀏覽視窗中,選擇用於儲存 OCR 檔案的目標資料夾,然後按一下「儲存」。您也可以在儲存之前重新命名該文件,以便 OCR 文件將以新名稱儲存。
3. 將 OCR 轉換後的檔案轉存為TXT
現在在 UPDF 中開啟新分頁並選擇“開啟檔案”,將您帶到瀏覽視窗。在這裡,您可以導航到 OCR PDF 文件的位置。找到 PDF 後,按一下將其選中,然後按下面的「開啟」按鈕。然後,UPDF 將繼續開啟並顯示所選的 PDF 文件。
在 UPDF 的右側面板中,按一下「轉存 PDF」。從可用選項中選擇文本,將開啟另一個彈出視窗。
4. 確認輸出格式並儲存
按一下「轉存」按鈕開啟瀏覽窗口,選擇檔案儲存位置,並根據需要重新命名檔案。點擊“儲存”,UPDF 將儲存最近從 OCR PDF 文件轉換的TXT檔案。現在您已成功從掃描的 PDF 文件中提取文字。
Windows • macOS • iOS • Android 100% 安全性
第 2 部分:在 Windows 上使用 Microsoft Word 將 PDF 變更為 TXT
將 PDF 轉換為T XT 的另一種方法是藉助 Microsoft Word。雖然它是一個處理 docx 檔案的工具,但它包含開啟 PDF 文件的功能,當您這樣做時,PDF 中的內容會轉換為純文字。但是,只有當 PDF 不附帶格式化內容時,此方法才是不錯的選擇,因為 MS Word 無法保持相同的格式。
無論如何,使用此方法的過程非常簡單,僅在 MS Word 上執行以下步驟:
1.使用Word開啟PDF
右鍵單擊 PDF 文件圖標,然後單擊“打開方式”選項。如果清單顯示Word,請按一下它,否則按一下「選擇其他應用程式」。按一下“確定”,電腦可能會警告您並要求您確認需要按“是/確定”來確認的轉換。
2.另存為TXT
現在點擊「Ctrl、Shift 和 S」按鈕進入「另存為」畫面。開啟“儲存類型”下拉清單並選擇“.txt”檔案副檔名。點擊“儲存”,從 PDF 轉換的文字將儲存在 TXT 檔案中。
第 3 部分:在 Windows 上使用命令列將 PDF 轉換為 TXT
我們將在這裡討論的最後一種方法是使用命令列。我們在這裡使用 CMD,但要使此方法發揮作用,必須在 PC 上安裝命令列工具,因為這些工具不是內建的。幸運的是,Xpdf 免費提供了“pdftotext”命令列實用程序,我們將透過以下步驟在此方法中使用它:
1.下載Xpdf命令列工具
造訪XpdfReader 網站並下載適用於 Windows PC 的命令列工具。
2. 建立一個資料夾來提取該工具。
同時按下「Control」、「Shift」和「N」鍵建立一個新資料夾。將下載的 zip 檔案和要轉換為文字的 PDF 檔案放入該資料夾中。右鍵單擊該文件並選擇“在此處提取”以將其提取。
3. 進入進階系統設定。
按下“Windows和X”鍵並選擇“系統”。
4. 新增的環境變數
在“系統變數”下找到“路徑”,然後按一下將其選取,它會變成藍色。現在按一下“編輯”,點擊它並選擇“bin32”或“bin64”,按一下所有設定視窗上的「確定」將其關閉。
5. 使用命令提示字元將 PDF 轉換為 TXT
按下「Windows」鍵,輸入 CMD,然後按 Enter 鍵將其開啟。開啟包含實用工具和 PDF 文件的資料夾,然後從網址列複製其路徑。例如,在我們的範例中,路徑是「C:\Users\ASUS\Desktop\pdf files」。在命令提示字元中鍵入“cd C:\Users\ASUS\Desktop\pdf files”,並將我們的路徑替換為您的路徑。按回車鍵。現在輸入「pdftotext file1.pdf」並按下回車鍵。將“file1”替換為您的檔案名稱。如果 CMD 視窗未顯示任何錯誤訊息,則關閉 CMD 視窗並啟動新的命令列。
6.開啟一個新的TXT文件來檢查
打開包含 PDF 檔案的資料夾,您將看到一個同名的 TXT 檔案,您可以打開這兩個文件並驗證方法是否成功。
總結
將 PDF 轉換為 TXT 的第一個方法是複製PDF文件裡面的文字到新的空白的TXT文件中,對於小文檔來說這是可行的,但對於較大的文檔來說,這種方法的效率很低。我們上面討論的方法非常有用,無論您用哪個方法,都會變得非常容易。
但除了 UPDF 之外,上面討論的大多數方法都不可以將掃描的 PDF 文件轉換為 TXT。因此,如果您想要一個始終可以滿足您的要求,且功效可以超出預期的工具,那麼 UPDF 是正確的選擇。它附帶額外的 PDF 編輯和共享功能,幫助您解決處理PDF文件的各種需求。
Windows • macOS • iOS • Android 100% 安全性