OCR PDF
La fonction OCR d'UPDF permet de convertir le texte numérisé d'un document PDF en contenu consultable et modifiable. Les données contenues dans les images peuvent également être modifiées grâce à cette fonction, ce qui rend le document interactif pour les utilisateurs.
- 1. Comment télécharger et installer la fonction OCR
- 2. Comment faire la reconnaissance optique de caractères des PDF
1. Comment télécharger et installer la reconnaissance optique de caractères
Lorsque vous ouvrez le document concerné, naviguez jusqu'au bouton "Reconnaître le texte à l'aide de l'OCR" sur la droite.

Si vous utilisez cette fonctionnalité pour la première fois, vous devrez la télécharger comme un plugin dans UPDF. Poursuivez le processus en cliquant sur le bouton "Télécharger" dans la fenêtre qui s'ouvre.

Vous serez automatiquement redirigé vers la fenêtre suivante, qui affichera la progression de l'installation de la fonctionnalité. Laissez la fonctionnalité s'installer sur votre appareil Windows avant de l'utiliser.

2. Comment effectuer un OCR des PDF
Une fois que cette installation est terminée, fermez la fenêtre et naviguez vers le même bouton pour accéder à l'outil OCR via UPDF. Dès son ouverture, il vous proposera deux options différentes de type de document, à savoir "PDF interrogeable" et "PDF image seulement".
- PDF interrogeable : En choisissant cette option, l'outil convertit les documents PDF numérisés en documents consultables et modifiables.
- PDF avec image seulement : En sélectionnant cette option, vous convertissez vos documents consultables et modifiables en un document PDF graphique qui n'est ni consultable ni modifiable.
2.1 Type de document : PDF consultable
Si vous choisissez "PDF consultable", il convertira vos documents PDF numérisés en documents modifiables et consultables.
Mise en page :
Pour configurer cette fonction, vous devez d'abord choisir une "mise en page" appropriée à l'aide des options disponibles dans le menu déroulant. Vous disposez de trois options différentes pour définir la mise en page du document :
- Texte et images uniquement : Le texte et les images reconnus seront enregistrés dans le document PDF qui sera créé. Le fichier créé est également de plus petite taille et sa structure visuelle peut être différente de celle du fichier original.
- Texte sur l'image de la page : Ce mode permet de conserver les images d'arrière-plan et les illustrations présentes dans le document source sur lequel l'OCR est effectuée. Ces fichiers sont plus volumineux, mais leur structure visuelle peut différer de celle du fichier d'origine.
- Texte sous l'image de la page : Dans ce mode, les images PDF sont conservées, mais le texte reconnu est placé dans une couche invisible sous les images. Ce type de fichier est tout à fait identique au fichier PDF original.

Cliquez sur l'icône "Engrenage" pour accéder à d'autres paramètres de mise en page que vous pouvez configurer pour votre fichier. Vous pouvez indiquer dans cette zone si vous souhaitez "Conserver les images", tout en déterminant la qualité entre "Faible", "Équilibré" ou "Élevé" pour enregistrer un fichier de taille inférieure à l'original avec une qualité d'image et de photo remarquable.

Langue du document, résolution d'image et intervalle de pages :
Définissez la "langue du document" qui convient en choisissant parmi 38 langues différentes dans le menu déroulant. UPDF dispose ainsi d'une meilleure base pour reconnaître le texte avec précision dans le document.

Vous pouvez également définir des paramètres de résolution appropriés pour les images avec l'option "Résolution de l'image". Travaillez sur la "Fourchette de pages " et cliquez sur "Exécuter l'OCR " pour exécuter l'OCR sur le document avec les paramètres définis.

2.2 Type de document : PDF image seulement
Si vous optez pour "PDF image seulement", vos documents consultables et modifiables seront convertis en un document PDF image qui ne sera ni consultable ni modifiable.
- Réglez la qualité de l'image dans la section "Conserver les images" en sélectionnant l'une des options disponibles "Faible, Équilibré ou Élevé".

- Décidez si vous souhaitez compresser vos images en utilisant la méthode MRC.

- Indiquez une "fourchette de pages " puis cliquez sur "Exécuter l'OCR" pour effectuer les opérations sur le document. Sélectionnez le dossier et vous obtiendrez immédiatement un document PDF numérisé.
