PDF ते मजकूर
PDF मधून मजकूर काढा
Drop file here
PDF, Word, Excel, PowerPoint, images up to 25 MB
मुख्य वैशिष्ट्ये
- PDF सामग्री स्तरातून थेट मजकूर काढतो
- बहु-स्तंभ मांडणींसाठी योग्य वाचण्याचा क्रम पुनर्रचना करतो
- परिच्छेद संरचना आणि अंतर जपतो
- पंक्ती आणि स्तंभ सीमांसह तक्ते हाताळतो
- शेकडो पृष्ठांपर्यंत PDF चे समर्थन करतो
- डाउनलोडसाठी स्वच्छ TXT फाइल आउटपुट करतो
- डाउनलोड करण्यापूर्वी ब्राउझरमध्ये काढलेल्या मजकुराचे पूर्वावलोकन
- पूर्वावलोकन पॅनेलमधून थेट मजकूर कॉपी करा
- जटिल नेस्टेड मजकूर संरचनांसह PDF वर प्रक्रिया करतो
- सजावटीचे किंवा गैर-अर्थपूर्ण मजकूर घटक ओळखतो आणि वगळतो
- पासवर्ड-संरक्षित PDF सह कार्य करतो जर तुम्ही पासवर्ड प्रदान करता
- खाते किंवा नोंदणी आवश्यक नाही
- प्रक्रियेनंतर फाइल्स लगेच हटवल्या जातात
- सर्व अपलोडसाठी TLS एन्क्रिप्शन
- सर्व आधुनिक ब्राउझरमध्ये कार्य करतो
वापराचे प्रसंग
- दस्तऐवज संपादकात पेस्ट करण्यासाठी अहवाल सामग्री कॉपी करणे
- मजकूर संपादकात कायदेशीर पुनरावलोकनासाठी करार खंड काढणे
- स्प्रेडशीट कार्यप्रवाहात PDF चलनांमधून डेटा काढणे
- उद्धरण व्यवस्थापन साधनांसाठी संशोधन पेपर मजकूर काढणे
- भाषांतर किंवा स्थानिकीकरण साधनांमध्ये PDF सामग्री फीड करणे
- PDF फाइल्सच्या संग्रहातून शोधण्यायोग्य मजकूर निर्देशांक तयार करणे
- पुरवठादार PDF कॅटलॉगमधून उत्पादन वर्णने काढणे
- AI सारांश किंवा विश्लेषण साधनांमध्ये इनपुटसाठी PDF सामग्री तयार करणे
कसे वापरावे
- 1अपलोड क्षेत्रावर क्लिक करून किंवा फाइल व्यवस्थापकातून फाइल ड्रॅग करून तुमचा PDF अपलोड करा.
- 2तुमच्या आउटपुट प्राधान्यक्रम निवडा — सादा मजकूर किंवा परिच्छेद अंतर जपलेला स्वरूपित मजकूर.
- 3काढा वर क्लिक करा आणि साधन दस्तऐवजाचा मजकूर स्तर प्रक्रिया करत असताना प्रतीक्षा करा.
- 4पूर्वावलोकन पॅनेलमध्ये काढलेला मजकूर पुनरावलोकन करा. स्तंभ क्रम आणि परिच्छेद संरचना योग्य आहेत का ते तपासा.
- 5TXT फाइल डाउनलोड करा किंवा पूर्वावलोकनातून थेट तुमच्या क्लिपबोर्डवर मजकूर कॉपी करा.
तुम्ही PDF उघडता, एखादा परिच्छेद कॉपी करण्याचा प्रयत्न करता आणि एकतर काहीच मिळत नाही किंवा वाक्यांच्या मध्येच यादृच्छिक ओळ ब्रेकसह अक्षरांची गोंधळलेली गर्दी मिळते. हे डिझाइन अनुप्रयोगांमधून निर्यात केलेल्या PDF, खराब OCR प्रक्रियेतून गेलेल्या स्कॅन केलेल्या दस्तऐवजांसह किंवा जटिल बहु-स्तंभ मांडणी असलेल्या फाइल्ससह होते. मजकूर दृष्यदृष्ट्या तिथे आहे — तुम्ही तो वाचू शकता — परंतु तुम्ही तो इतक्या स्वच्छपणे निवडू शकत नाही की कुठेही उपयुक्त ठिकाणी पेस्ट करता येईल. dokk.ai चा PDF ते मजकूर काढणारा स्क्रीन कॅप्चर नाही तर PDF फाइलमध्ये एम्बेड केलेला वास्तविक मजकूर सामग्री स्तर वाचतो. मानक मजकूर-आधारित PDF साठी, याचा अर्थ प्रत्येक अक्षर, शब्द आणि परिच्छेद अगदी त्याच प्रमाणे काढला जातो जसा संरचित आहे — बहु-स्तंभ मांडणींसाठी वाचण्याचा क्रम, तक्त्याच्या सेलच्या सीमा, यादी आयटम आणि तळटीपा यांसह. काढणे परिच्छेद अंतर जपते जेणेकरून आउटपुट ऑफिस संपादकामध्ये, ईमेलमध्ये किंवा सामग्री व्यवस्थापन प्रणालीमध्ये मॅन्युअल साफसफाईशिवाय पेस्ट करण्यास तयार असतो. स्तंभ-जड मांडणी — जसे की शैक्षणिक कागदपत्रे, वृत्तपत्र-शैलीचे लेख आणि बहु-स्तंभ माहितीपत्रके — मजकूर क्षेत्रे ओळखणाऱ्या आणि वाचण्याच्या क्रमाची योग्यरित्या पुनर्रचना करणाऱ्या मांडणी विश्लेषण चरणाने हाताळल्या जातात. या चरणाशिवाय, भोळेपणाने काढलेला दोन-स्तंभ PDF दोन्ही स्तंभांमधून प्रतिच्छेदन मजकूर तयार करतो, जो वाचनीय नाही. काढणारा स्तंभ अवकाशीयरित्या ओळखतो आणि त्यांना योग्य क्रमाने आउटपुट करतो, प्रथम डावा स्तंभ. स्कॅन केलेल्या PDF किंवा प्रतिमा-आधारित दस्तऐवजांसाठी जेथे कोणताही मजकूर स्तर अस्तित्वात नाही, मानक काढणाऱ्या साधनाने मजकूर उपस्थित नसल्याचे योग्यरित्या सांगेल. अशा प्रकरणांमध्ये, dokk.ai चे OCR साधन प्रथम वापरावे — ते ऑप्टिकल कॅरेक्टर रेकग्निशनद्वारे स्कॅन केलेल्या पृष्ठांवर प्रक्रिया करते आणि एक शोधण्यायोग्य मजकूर स्तर तयार करते जे नंतर काढले किंवा कॉपी केले जाऊ शकते. PDF ते Word साधन हा एक पर्याय आहे जेव्हा तुम्हाला सादे मजकूर ऐवजी अंदाजे मांडणी जपणाऱ्या संपादन करण्यायोग्य DOCX स्वरूपात काढलेली सामग्री हवी असते. काढलेला मजकूर डाउनलोड करण्यायोग्य TXT फाइल म्हणून उपलब्ध आहे आणि पूर्वावलोकन पॅनेलमधून थेट कॉपी देखील केला जाऊ शकतो. हे काढलेली सामग्री भाषांतर साधनांमध्ये, AI पाइपलाइनमध्ये, शोध निर्देशांकांमध्ये किंवा सामग्री विश्लेषण स्क्रिप्टमध्ये पास करणे सरळ करते. प्रतिमा काढणे साधन एकाच दस्तऐवजातून मजकूर आणि दृश्य सामग्री दोन्ही हवे असल्यास त्याच PDF मधून एम्बेड केलेले ग्राफिक्स बाहेर काढण्याचे पूरक कार्य हाताळते.
वारंवार विचारले जाणारे प्रश्न
सुरक्षा आणि गोपनीयता
तुमचा PDF एन्क्रिप्टेड TLS कनेक्शनद्वारे अपलोड केला जातो आणि मजकूर काढल्यानंतर लगेच आमच्या सर्व्हरवरून हटवला जातो. आम्ही तुमच्या दस्तऐवज सामग्री वाचत नाही, अनुक्रमित करत नाही किंवा संग्रहित करत नाही. नोंदणी आवश्यक नाही.