خاصية OCR لملفات PDF
تتيح لك ميزة OCR المقدمة من UPDF تحويل النص في مستندات PDF الممسوحة ضوئياً الى محتوى قابل للبحث والتحرير. يمكن ايضاً تحرير وتعديل بيانات الصور بعد استخدام هذه الميزة, بشكل يجعل المستند جذاب للمستخدمين.
1.كيفية تحميل وتثبيت ميزة OCR
بمجرد فتح مستند معين, انتقل إلى زر " التعرف على النص باستخدام OCR" الموجود في الجهة اليمنى.
إذا كنت تستخدم هذه الميزة لأول مرة, يجب عليك تحميلها كإضافة عبر UPDF. استمر في العملية من خلال النقر على زر "التحميل" عبر نافذة الانبثاق .
سيتم إعادة توجيهك بشكل تلقائي إلى النافذة التالية, حيث يتم عرض تقدم عملية تثبيت الميزة. اسمح ان يتم تثبيت الميزة بنجاح في جهاز Windows الخاص بك قبل استخدامها.
2. كيفية استخدام ميزة OCR في ملفات PDF
بمجرد تثبيت الميزة, قم بإغلاق النافذة ثم انتقل إلى نفس الزر للوصول إلى أداة OCR في UPDF. بمجرد ان تفتح , سيوفر لك خيارين مختلفين لنوع المستند, وذلك يشمل:" PDF قابل للبحث" و " PDF صورة فقط" .
- PDF قابل للبحث: عند تحديد هذا الخيار, سيتم تحويل مستندات PDF إلى مستندات قابلة للبحث والتحرير.
- PDF صورة فقط: عند تحديد هذا الخيار, سيتم تحويل مستندات PDF القابلة للبحث والتحرير إلى مستند PDF مرتكز على صورة , وهذا يعني ان المستند سيكون غير قابل للبحث او التحرير.
2.1 نوع المستند: PDF قابل للبحث
إذا قمت باختيار " PDF قابل للبحث" , سيتم تحويل مستندات PDF الممسوحة ضوئياً إلى مستندات قابلة للبحث والتحرير.
التخطيط:
لضبط هذا الوضع, يجب عليك أولاً تحديد تخطيط مناسبة من القائمة المنسدلة . ستجد ثلاثة خيارات مختلفة لإعدادات ضبط التخطيط:
- نص وصورة فقط: سيتم حفظ النص والصور المُتعرف عليها عبر مستند PDF الذي سيتم إنشاءه لاحقاً. سيكون الملف الذي سيتم انشاءه صغير الحجم, و ستكون البنية البصرية متفاوتة عن الملف الأصلي.
- نص فوق صورة الصفحة: هذا الوضع مسؤول عن الاحتفاظ بصور الخلفية الرسوم التوضيحية عبر مصدر المستند الذي يتم تنفيذ التعرف الضوئي (OCR) خلاله. هذه الملفات أكبر في الحجم, ومع ذلك فإنها قد تتفاوت بصرياً عن الملف الأصلي.
- نص تحت صورة الصفحة: في هذا الوضع, الصور في PDF محفوظة, ومع ذلك سيتم وضع النص المتعرف عليه في اسفل طبقة مخفية تحت الصور. هذا النوع من الملف يتماثل بشكل قليل مع الملف الأصلي.
انقر على ايقونة "معدات" (" الترس") للوصول إلى المزيد من إعدادات التخطيط التي يمكنك تحديدها من اجل الملف الخاص بك.
هنا يمكنك تحديد إذا كنت تريد " الاحتفاظ بالصور" , مع تحديد الجودة بين " منخفضة" , " متوازنة" , او " عالية" لحفظ الملف بحجم اصغر من الملف الأصلي وايضاً حفظ الصور بجودة جديرة بالثناء.
لغة المستند, دقة الصورة, و نطاق الصفحة:
قم بتحديد " لغة المستند" من بين 38 لغة مختلفة من خلال القائمة المنسدلة . هذا يوفر ل UPDF اساساً افضل للتعرف على النص بدقة عبر المستند.(هذه الميزة غير مدعومة باللغة العربية في الوقت الحالي).
يمكنك ايضاً تحديد إعدادات دقة أفضل للصور باستخدام خيار " دقة الصورة". اعمل على " نطاق الصفحة" ثم انقر على " تنفيذ OCR" لإجراء عملية التعرف الضوئي (OCR) عبر الملف مع الإعدادات المحددة.
2.2. نوع الملف: PDF صورة فقط
إذا قمت بالمتابعة مع "PDF صورة فقط", سيتم تحويل مستندات PDF القابلة للبحث والتحرير إلى مستند PDF مرتكز على صورة , وهذا يعني ان المستند سيكون غير قابل للبحث او التحرير.
- قم بضبط جودة الصورة من قسم " الاحتفاظ بالصور" من خلال تحديد الخيارات المُتاحة :" منخفضة" , " متوازنة", " عالية".
- حدد إذا كنت تريد ضغط الصور الخاصة بك باستخدام MRC.
- قم بتوفير " نطاق صفحة" مناسب ثم انقر على " تنفيذ OCR" لتنفيذ العمليات في المستند. حدد المجلد وستحصل على مستند PDF ممسوح ضوئياً على الفور.