Riconosci PDF con OCR su Windows
La funzione OCR di UPDF consente di convertire il testo acquisito da un documento PDF in contenuti ricercabili e modificabili. Il testo acquisito dalle immagini può anche essere modificato dopo aver utilizzato questa funzione che rende il documento interattivo per gli utenti.
1. Come scaricare e installare OCR
Dopo aver aperto il documento, fai clic sul pulsante "Riconoscimento testo con OCR" sulla destra.
If you are using this feature for the first time, you will have to download it as a plugin across UPDF. Continue with the process by clicking on the "Download" button across the pop-up window.
You will be automatically redirected to the next window, where the progress of the installation of the feature will be displayed. Let the feature install successfully across your Windows device before using it.
2. Come Scansionare dei PDF con l'OCR
In seguito all'installazione, chiudi la finestra e fai clic sullo stesso pulsante per accedere allo strumento OCR attraverso UPDF. Durante l'apertura, ti saranno fornite due diverse opzioni di Tipo di documento, che includono "PDF ricercabile" e "PDF solo immagine."
- PDF ricercabile: selezionando questa opzione, i documenti PDF acquisiti verranno convertiti in documenti ricercabili e modificabili.
- PDF solo immagine: selezionando questa opzione, i documenti ricercabili e modificabili verranno convertiti in documenti PDF basati su immagini che non sono né ricercabili né modificabili.
2.1 Tipo di documento: PDF ricercabile
Se scegli "PDF ricercabile", i tuoi documenti PDF acquisiti verranno convertiti in documenti modificabili e ricercabili.
Layout:
Per prepararsi è necessario prima scegliere un corretto "Layout" con le opzioni disponibili nel menu a discesa. Avrai tre diverse opzioni nella configurazione del layout del processo:
- Solo testo e immagini: il testo e le immagini riconosciuti verranno salvati attraverso il documento PDF che verrà creato. Il file che viene creato è di dimensioni più piccole, e la sua struttura visiva potrebbe differire dal file originale.
- Testo sull'immagine della pagina: questa modalità è utilizzata per il mantenimento delle immagini di sfondo e delle illustrazioni presenti nel documento di origine attraverso il quale viene eseguito l'OCR. Questi file sono di dimensione maggiore; tuttavia, possono differire visivamente da quelli originali.
- Testo sotto l'immagine della pagina: Per questa modalità, le immagini del PDF vengono mantenute; tuttavia, il testo riconosciuto viene posto ad un livello invisibile sotto le immagini. Questo tipo di file è identico al file PDF originale.
Fare clic sull'icona a forma di ingranaggio per accedere a più impostazioni di layout che è possibile definire per il file. Qui è possibile specificare, se si desidera, "Mantieni immagini", mentre si determina la qualità tra "Basso", "Equilibrato", o "Alto" per salvare un file con una dimensione inferiore rispetto all'originale in una qualità d'immagine migliore.
Lingua del documento, risoluzione dell'immagine e intervallo di pagine:
Definisci una corretta "lingua del documento" scegliendo fra 38 lingue diverse attraverso il menu a discesa. Questo fornisce a UPDF una base migliore per riconoscere accuratamente il testo nel documento.
È inoltre possibile specificare impostazioni di risoluzione adeguate per le immagini con l'opzione "Risoluzione immagine". Modifica l'Intervallo di pagine e fai clic su "Esegui OCR" per eseguire la scansione OCR sul file con le impostazioni definite.
2.2 Tipo di documento: PDF solo immagine
Se scegli di utilizzare l'opzione "Solo immagine PDF", convertirai i documenti ricercabili e modificabili in un documento PDF basato su immagine che non è né ricercabile né modificabile.
- Configura la qualità dell'immagine nella sezione "Mantieni immagini" selezionando una delle opzioni disponibili: "Basso, Bilanciato o Alto".
- Decidi se modificare le immagini utilizzando la compressione MRC.
- Fornisci un adeguato "Intervallo di pagine" e fai clic su "Esegui OCR" per eseguire la scansione del documento. Seleziona la cartella e otterrai immediatamente un documento PDF digitalizzato.