OCR PDFs

Mit der OCR-Funktion von UPDF können Sie den gescannten Text eines PDF-Dokuments in durchsuchbare und bearbeitbare Inhalte umwandeln. Auch Text auf Bildern kann nach der Verwendung dieser Funktion bearbeitet werden, wodurch das Dokument für die Benutzer interaktiv wird. Klicken Sie auf die Schaltfläche unten und folgen Sie der Text- oder Videoanleitung zur OCR von PDFs.

Windows • macOS • iOS • Android 100% sicher

1. Herunterladen und Installieren von OCR
2. OCR in PDF-Dateien durchführen

1. Herunterladen und Installieren von OCR

Wenn Sie das entsprechende Dokument öffnen, navigieren Sie zur Schaltfläche „Text mit OCR erkennen“ auf der rechten Seite.

Wenn Sie diese Funktion zum ersten Mal verwenden, müssen Sie sie als Plugin über UPDF herunterladen. Fahren Sie mit dem Prozess fort, indem Sie auf die Schaltfläche „Download“ im Pop-up-Fenster klicken.

Sie werden automatisch zum nächsten Fenster weitergeleitet, in dem der Fortschritt der Installation der Funktion angezeigt wird. Lassen Sie die Funktion erfolgreich auf Ihrem Windows-Gerät installieren, bevor Sie sie verwenden.

2. OCR in PDF-Dateien durchführen

Schließen Sie nach der Installation das Fenster und navigieren Sie zur gleichen Schaltfläche für den Zugriff auf das OCR-Tool über UPDF. Beim Öffnen werden Ihnen zwei verschiedene Optionen für den Dokumenttyp angeboten, darunter „Durchsuchbare PDF“ und „Nur-Bild-PDF“.

Durchsuchbare PDF: Wenn Sie diese Option wählen, werden gescannte PDF-Dokumente in durchsuchbare und bearbeitbare Dokumente umgewandelt.
Reine Bild-PDF: Wenn Sie diese Option wählen, werden Ihre durchsuchbaren und bearbeitbaren Dokumente in ein bildbasiertes PDF-Dokument umgewandelt, das weder durchsuchbar noch bearbeitbar ist.

2.1 Dokumenttyp: Suchbares PDF

Wenn Sie sich für „Durchsuchbare PDF“ entscheiden, werden Ihre gescannten PDF-Dokumente in bearbeitbare und durchsuchbare Dokumente umgewandelt.

Layout:

Um dies einzurichten, müssen Sie sich zunächst für ein geeignetes „Layout“ mit den im Dropdown-Menü verfügbaren Optionen entscheiden.

Sie haben drei verschiedene Möglichkeiten, das Layout des Prozesses einzurichten:

Nur Text und Bilder: Der erkannte Text und die Bilder werden in dem erstellten PDF-Dokument gespeichert. Die erstellte Datei ist außerdem kleiner und ihre visuelle Struktur kann von der Originaldatei abweichen.

Text über dem Seitenbild: In diesem Modus werden die Hintergrundbilder und Illustrationen des Quelldokuments, über das die OCR durchgeführt wird, beibehalten. Diese Dateien sind größer, können sich aber visuell von den Originaldateien unterscheiden.

Text unter dem Seitenbild: Bei diesem Modus werden die PDF-Bilder beibehalten, der erkannte Text wird jedoch auf einer unsichtbaren Ebene unter den Bildern platziert. Dieser Dateityp ist mit der ursprünglichen PDF-Datei völlig identisch.

Klicken Sie auf das „Zahnrad“-Symbol, um auf weitere Layout-Einstellungen zuzugreifen, die Sie für Ihre Datei festlegen können. Hier können Sie angeben, ob Sie „Bilder beibehalten“ möchten, während Sie die Qualität zwischen „Niedrig“, „Ausgeglichen“ oder „Hoch“ festlegen, um eine Datei mit einer geringeren Größe als das Original mit lobenswerter Bild- und Abbildungsqualität zu speichern.

Dokumentsprache, Bildauflösung und Seitenbereich:

Definieren Sie eine eigene „Dokumentsprache“ mit der Option von 38 verschiedenen Sprachen über das Dropdown-Menü. Dies bietet UPDF eine bessere Grundlage für die genaue Erkennung von Text im gesamten Dokument.

Mit der Option „Bildauflösung“ können Sie auch die richtige Auflösung für die Bilder festlegen. Bearbeiten Sie den „Seitenbereich“ und klicken Sie auf „OCR durchführen“, um die OCR in der Datei mit den festgelegten Einstellungen auszuführen.

2.2. Document Type: Nur Bild PDF

Wenn Sie die Option „Nur Bild-PDF“ wählen, werden Ihre durchsuchbaren und bearbeitbaren Dokumente in ein bildbasiertes PDF-Dokument umgewandelt, das weder durchsuchbar noch bearbeitbar ist.

Stellen Sie die Bildqualität im Abschnitt „Bilder behalten“ ein, indem Sie eine der verfügbaren Optionen „Niedrig, Ausgeglichen oder Hoch“ auswählen.

Entscheiden Sie, ob Sie Ihre Bilder mit MRC komprimieren möchten. Mit diesem Modus können Sie die Dateigröße ohne Qualitätsverlust verringern.

Geben Sie einen geeigneten „Seitenbereich“ an und klicken Sie auf „OCR durchführen“, um die Aktionen am Dokument durchzuführen. Wählen Sie den Ordner und Sie erhalten sofort ein gescanntes PDF-Dokument.

Sie können die OCR-Funktion in der kostenlosen Testversion kostenlos testen. Aber Sie können die OCR-PDFs nur ausprobieren und nicht speichern, kopieren und bearbeiten. Um alle Funktionen zu erhalten, die Sie benötigen, können Sie auf die Pro-Version upgraden.