user guide
Centre d'aide UPDF

Obtenir plus d’infos concernant UPDF

help center
UPDF pour Windows
UPDF pour Mac
UPDF pour iOS
UPDF pour Android

OCR PDF

La fonction OCR d'UPDF permet de convertir le texte numérisé d'un document PDF en contenu consultable et modifiable. Les données contenues dans les images peuvent également être modifiées grâce à cette fonction, ce qui rend le document interactif pour les utilisateurs.

1. Comment télécharger et installer la reconnaissance optique de caractères

Lorsque vous ouvrez le document concerné, naviguez jusqu'au bouton "Reconnaître le texte à l'aide de l'OCR" sur la droite.

Cliquer sur l’icone OCR

Si vous utilisez cette fonctionnalité pour la première fois, vous devrez la télécharger comme un plugin dans UPDF. Poursuivez le processus en cliquant sur le bouton "Télécharger" dans la fenêtre qui s'ouvre.

Télécharger la function OCR

Vous serez automatiquement redirigé vers la fenêtre suivante, qui affichera la progression de l'installation de la fonctionnalité. Laissez la fonctionnalité s'installer sur votre appareil Windows avant de l'utiliser.

progression du téléchargement

2. Comment effectuer un OCR des PDF

Une fois que cette installation est terminée, fermez la fenêtre et naviguez vers le même bouton pour accéder à l'outil OCR via UPDF. Dès son ouverture, il vous proposera deux options différentes de type de document, à savoir "PDF interrogeable" et "PDF image seulement".

  • PDF interrogeable : En choisissant cette option, l'outil convertit les documents PDF numérisés en documents consultables et modifiables.
  • PDF avec image seulement : En sélectionnant cette option, vous convertissez vos documents consultables et modifiables en un document PDF graphique qui n'est ni consultable ni modifiable.

2.1 Type de document : PDF consultable

Si vous choisissez "PDF consultable", il convertira vos documents PDF numérisés en documents modifiables et consultables.

Mise en page :

Pour configurer cette fonction, vous devez d'abord choisir une "mise en page" appropriée à l'aide des options disponibles dans le menu déroulant. Vous disposez de trois options différentes pour définir la mise en page du document :

  • Texte et images uniquement : Le texte et les images reconnus seront enregistrés dans le document PDF qui sera créé. Le fichier créé est également de plus petite taille et sa structure visuelle peut être différente de celle du fichier original.
  • Texte sur l'image de la page : Ce mode permet de conserver les images d'arrière-plan et les illustrations présentes dans le document source sur lequel l'OCR est effectuée. Ces fichiers sont plus volumineux, mais leur structure visuelle peut différer de celle du fichier d'origine.
  • Texte sous l'image de la page : Dans ce mode, les images PDF sont conservées, mais le texte reconnu est placé dans une couche invisible sous les images. Ce type de fichier est tout à fait identique au fichier PDF original.
Configuration de la mise en page de l’OCR

Cliquez sur l'icône "Engrenage" pour accéder à d'autres paramètres de mise en page que vous pouvez configurer pour votre fichier. Vous pouvez indiquer dans cette zone si vous souhaitez "Conserver les images", tout en déterminant la qualité entre "Faible", "Équilibré" ou "Élevé" pour enregistrer un fichier de taille inférieure à l'original avec une qualité d'image et de photo remarquable.

Configuration mise en page

Langue du document, résolution d'image et intervalle de pages :

Définissez la "langue du document" qui convient en choisissant parmi 38 langues différentes dans le menu déroulant. UPDF dispose ainsi d'une meilleure base pour reconnaître le texte avec précision dans le document.

Sélectionner la langue du document

Vous pouvez également définir des paramètres de résolution appropriés pour les images avec l'option "Résolution de l'image". Travaillez sur la "Fourchette de pages " et cliquez sur "Exécuter l'OCR " pour exécuter l'OCR sur le document avec les paramètres définis.

Sélectionner la résolution de l’image

2.2 Type de document : PDF image seulement

Si vous optez pour "PDF image seulement", vos documents consultables et modifiables seront convertis en un document PDF image qui ne sera ni consultable ni modifiable.

  • Réglez la qualité de l'image dans la section "Conserver les images" en sélectionnant l'une des options disponibles "Faible, Équilibré ou Élevé".
Sélectionner la qualité de l’image
  • Décidez si vous souhaitez compresser vos images en utilisant la méthode MRC.
Compresser une image en utilisant MRC
  • Indiquez une "fourchette de pages " puis cliquez sur "Exécuter l'OCR" pour effectuer les opérations sur le document. Sélectionnez le dossier et vous obtiendrez immédiatement un document PDF numérisé.
Réaliser un OCR