PDF से Excel
टेबल .xlsx में निकालें
Drop file here
PDF, Word, Excel, PowerPoint, images up to 25 MB
मुख्य विशेषताएं
- PDF तालिकाओं को संपादन योग्य XLSX स्प्रेडशीट में परिवर्तित करता है
- संरचनात्मक तालिका पहचान पंक्तियां और कॉलम संरक्षित करती है
- बहु-पंक्ति और मर्ज की गई सेल हेडर संभालना
- संख्यात्मक फ़ॉर्मेटिंग पहचान (मुद्रा
- प्रतिशत
- दशमलव)
- अलग XLSX शीट को निर्यात की गई कई तालिकाएं
- मुद्रित तालिकाओं वाली स्कैन PDF के लिए OCR
- 40+ OCR भाषाओं का समर्थन
- रेखाओं और छायादार हेडर वाली तालिकाएं संभालता है
- 100 MB तक की फ़ाइलें प्रोसेस करता है
- आमतौर पर 20 सेकंड से कम में पूर्ण
- आउटपुट फ़ाइलों पर कोई वॉटरमार्क नहीं
- खाता या साइन-अप आवश्यक नहीं
- मोबाइल ब्राउज़र पर काम करता है
- प्रसंस्करण के बाद स्वचालित फ़ाइल विलोपन
- सभी तालिकाओं को एकल शीट में निर्यात करने का विकल्प
उपयोग के मामले
- विश्लेषण और चार्टिंग के लिए PDF वार्षिक रिपोर्ट से Excel में वित्तीय डेटा निकालना
- आगे की प्रक्रिया के लिए सरकारी सांख्यिकीय तालिका PDF को XLSX में परिवर्तित करना
- स्प्रेडशीट में आपूर्तिकर्ता की PDF मूल्य सूची से इन्वेंटरी डेटा निकालना
- लेखा समाधान के लिए PDF इनवॉइस के बैच से इनवॉइस लाइन आइटम निकालना
- डेटा विश्लेषण के लिए OCR के माध्यम से स्कैन मुद्रित रिपोर्ट तालिका को Excel में परिवर्तित करना
- Excel के माध्यम से पुराने PDF एक्सपोर्ट से आधुनिक डेटाबेस में डेटा स्थानांतरण
- सांख्यिकीय विश्लेषण के लिए PDF सारांश रिपोर्ट से Excel में सर्वेक्षण परिणाम निकालना
- प्रतिस्पर्धी विश्लेषण के लिए PDF उत्पाद तुलना तालिका को Excel में परिवर्तित करना
- GPA गणना के लिए PDF शैक्षणिक प्रतिलेख से Excel में ग्रेड तालिकाएं निकालना
- प्रवृत्ति चार्टिंग के लिए PDF प्रदर्शन रिपोर्ट से समय-श्रृंखला डेटा निकालना
कैसे इस्तेमाल करें
- 1'PDF अपलोड करें' क्लिक करें या अपनी फ़ाइल खींचें और छोड़ें। तालिकाओं वाली PDF — टेक्स्ट-आधारित और स्कैन दोनों — 100 MB तक समर्थित हैं।
- 2यदि आपकी PDF स्कैन की गई है, तो तालिका सामग्री के लिए OCR सटीकता अनुकूलित करने के लिए दस्तावेज़ की भाषा चुनें।
- 3'Excel में परिवर्तित करें' क्लिक करें। इंजन दस्तावेज़ में सभी तालिकाओं का पता लगाता है और उन्हें स्प्रेडशीट संरचना से मैप करता है।
- 4प्रसंस्करण की प्रतीक्षा करें, आमतौर पर 20 सेकंड से कम। प्रत्येक पता लगाई गई तालिका आउटपुट XLSX में एक अलग शीट पर रखी जाती है।
- 5XLSX फ़ाइल डाउनलोड करें और Microsoft Excel, LibreOffice Calc या Google Sheets में खोलें। सत्र समाप्त होने के बाद आपकी अपलोड की गई फ़ाइलें स्वचालित रूप से हटा दी जाती हैं।
PDF तालिकाओं के साथ काम करना कुख्यात रूप से कठिन है। आप डेटा को सॉर्ट नहीं कर सकते, फ़ॉर्मूले नहीं चला सकते, या पहले सामग्री को स्प्रेडशीट में निकाले बिना संख्याएं अपडेट नहीं कर सकते। PDF व्यूअर से कॉपी-पेस्ट करने से अक्सर कोशिकाएं मर्ज हो जाती हैं, कॉलम गलत संरेखित हो जाते हैं, या दशमलव बिंदु छूट जाते हैं — विशेष रूप से वित्तीय रिपोर्टों, डेटा एक्सपोर्ट और सरकारी सांख्यिकीय तालिकाओं में। तालिका संरचना को समझने वाला एक समर्पित PDF से Excel कनवर्टर ही एकमात्र विश्वसनीय समाधान है। Dokk.ai का PDF से Excel कनवर्टर एक संरचनात्मक विश्लेषण इंजन का उपयोग करता है जो PDF लेआउट के भीतर तालिका सीमाओं, कॉलम संरेखण और पंक्ति समूहन का पता लगाता है। तालिका कोशिकाओं को स्वतंत्र रूप से स्थित टेक्स्ट खंडों के रूप में मानने के बजाय, यह ग्रिड संरचना को पुनः निर्मित करता है और प्रत्येक सेल को आउटपुट XLSX में सही पंक्ति और कॉलम से मैप करता है। बहु-पंक्ति हेडर, मर्ज की गई कोशिकाएं और संख्यात्मक फ़ॉर्मेटिंग (मुद्रा प्रतीक, प्रतिशत चिह्न, दशमलव विभाजक) का पता लगाया जाता है और जहां संभव हो संबंधित Excel सेल प्रकारों पर लागू किया जाता है। फोटोग्राफ की गई या मुद्रित तालिकाओं वाली स्कैन PDF के लिए, तालिका निष्कर्षण से पहले OCR स्वचालित रूप से लागू किया जाता है। OCR इंजन 40 से अधिक भाषाओं का समर्थन करता है और रेखाओं, छायादार कॉलम हेडर और वैकल्पिक पंक्ति रंगों वाली तालिकाओं को संभालता है। 150 DPI या उससे अधिक पर स्कैन गुणवत्ता विश्वसनीय निष्कर्षण उत्पन्न करती है; कम रिज़ॉल्यूशन स्कैन के लिए कुछ कोशिकाओं के मैन्युअल सुधार की आवश्यकता हो सकती है। टूल दस्तावेज़ में मिली सभी तालिकाओं को अलग Excel शीट में निकालता है — प्रति तालिका एक शीट — इसलिए पांच तालिकाओं वाली PDF पांच-शीट XLSX वर्कबुक उत्पन्न करती है। आप सभी तालिकाओं को एकल शीट में निकालने का भी विकल्प चुन सकते हैं, प्रत्येक तालिका को खाली पंक्तियों से अलग करके। मानक दस्तावेज़ों के लिए प्रसंस्करण आमतौर पर 20 सेकंड से कम में पूर्ण होता है। तालिकाओं और गद्य टेक्स्ट दोनों वाले दस्तावेज़ों के लिए, dokk.ai पर PDF से Word टूल एक बेहतर शुरुआती बिंदु हो सकता है, क्योंकि यह तालिकाओं के साथ-साथ पूर्ण दस्तावेज़ संरचना संरक्षित करता है। स्कैन की गई PDF के लिए जहां केवल टेक्स्ट सामग्री चाहिए और तालिका संरचना गौण है, OCR टूल साफ सादा-टेक्स्ट आउटपुट उत्पन्न करता है।
अक्सर पूछे जाने वाले सवाल
सुरक्षा और गोपनीयता
सभी अपलोड TLS 1.3 से एन्क्रिप्टेड हैं। फ़ाइलें अलग-थलग सत्रों में प्रोसेस की जाती हैं और आपका डाउनलोड सत्र समाप्त होने के बाद, आमतौर पर 30 मिनट के भीतर, हमारे सर्वर से स्थायी रूप से हटा दी जाती हैं। Dokk.ai दस्तावेज़ सामग्री नहीं पढ़ता, इंडेक्स नहीं करता या संरक्षित नहीं रखता। कोई खाता आवश्यक नहीं है और सत्र के लिए आवश्यक से परे कोई व्यक्तिगत डेटा एकत्र नहीं किया जाता। सेवा GDPR-अनुपालक है।