Skip to content
جميع الأدوات

PDF إلى نص

استخراج النص من PDF

1رفع
2ضبط الإعدادات
3معالجة

Drop file here

PDF, Word, Excel, PowerPoint, images up to 25 MB

الميزات الرئيسية

  • يستخرج النص مباشرةً من طبقة محتوى PDF، يُعيد بناء ترتيب القراءة الصحيح للتخطيطات متعددة الأعمدة، يُحافظ على هيكل الفقرات وتباعدها، يتعامل مع الجداول مع حدود الصفوف والأعمدة، يدعم ملفات PDF تصل إلى مئات الصفحات، يُخرج ملف TXT نظيفاً للتنزيل، معاينة النص المستخرج في المتصفح قبل التنزيل، نسخ النص مباشرةً من لوحة المعاينة، يعمل مع ملفات PDF المحمية بكلمة مرور إذا قدّمت كلمة المرور، لا حساب أو تسجيل مطلوب، حذف فوري للملفات بعد المعالجة، تشفير TLS لجميع الرفعات، يعمل في جميع المتصفحات الحديثة

حالات الاستخدام

  • نسخ محتوى تقرير للصقه في محرر مستندات، استخراج بنود عقد للمراجعة القانونية في محرر نصوص، سحب بيانات من فواتير PDF إلى سير عمل جداول بيانات، استخراج نص ورقة بحثية لأدوات إدارة الاستشهادات، تغذية محتوى PDF في أدوات الترجمة أو التعريب، بناء فهرس نصي قابل للبحث من مكتبة ملفات PDF، استخراج وصف المنتجات من كتالوجات PDF للموردين، إعداد محتوى PDF كمدخل لأدوات تلخيص الذكاء الاصطناعي أو التحليل

كيفية الاستخدام

  1. 1ارفع ملف PDF بالنقر على منطقة الرفع أو سحب الملف من مدير الملفات.
  2. 2حدد تفضيلات المخرج — نص عادي أو نص منسَّق مع الحفاظ على تباعد الفقرات.
  3. 3انقر استخراج وانتظر بينما تعالج الأداة طبقة النص في المستند.
  4. 4راجع النص المستخرج في لوحة المعاينة. تحقق من صحة ترتيب الأعمدة وهيكل الفقرات.
  5. 5نزّل ملف TXT أو انسخ النص مباشرةً من المعاينة إلى حافظتك.

تفتح ملف PDF، تحاول نسخ فقرة، فتحصل على لا شيء أو فوضى من الأحرف مع فواصل أسطر عشوائية في منتصف الجمل. يحدث هذا مع ملفات PDF المصدَّرة من تطبيقات التصميم، أو المستندات الممسوحة ضوئياً التي مرّت بتعرّف ضوئي رديء، أو الملفات ذات التخطيطات متعددة الأعمدة المعقدة. النص موجود بصرياً — يمكنك قراءته — لكنك لا تستطيع تحديده بشكل نظيف. يقرأ مستخرج PDF إلى نص في dokk.ai طبقة محتوى النص المضمّنة فعلياً في ملف PDF، لا لقطة شاشة. بالنسبة لملفات PDF النصية المعيارية، هذا يعني استخراج كل حرف وكلمة وفقرة بالضبط كما هي منظّمة — بما فيها ترتيب القراءة للتخطيطات متعددة الأعمدة وحدود خلايا الجداول وعناصر القائمة والحواشي. تُعالج التخطيطات الكثيفة الأعمدة — كالأوراق الأكاديمية ومقالات النمط الصحفي والكتيبات متعددة الأعمدة — بخطوة تحليل تخطيط تحدد مناطق النص وتُعيد بناء ترتيب القراءة بشكل صحيح. النص المستخرج متاح كملف TXT قابل للتنزيل ويمكن نسخه مباشرةً من لوحة المعاينة.

الأسئلة الشائعة

الأمان والخصوصية

يُرفع ملف PDF عبر اتصال TLS مشفّر ويُحذف من خوادمنا فور استخراج النص. لا نقرأ محتوى مستندك ولا نُفهرسه ولا نخزّنه. لا تسجيل مطلوب.