Skip to content
सबै उपकरणहरू

पाठद्वारा विभाजन

पृष्ठबीच पाठ परिवर्तन हुँदा विभाजन गर्नुस्

1अपलोड गर्नुहोस्
2कन्फिगर गर्नुहोस्
3प्रशोधन गर्नुहोस्

Drop file here

PDF, Word, Excel, PowerPoint, images up to 25 MB

मुख्य विशेषताहरू

  • निर्दिष्ट किवर्ड वा वाक्यांश भएका प्रत्येक पृष्ठमा PDF विभाजन गर्छ
  • पूर्वनिर्धारित रूपमा केस-असंवेदनशील पाठ मिलान
  • परिवर्तनशील चिन्हहरूका लागि वैकल्पिक नियमित अभिव्यक्ति ढाँचा समर्थन
  • पूर्व वा अनुगामी आउटपुट फाइलमा किवर्ड पृष्ठ समावेश वा बहिष्कार गर्ने विकल्प
  • मूल पाठ PDF र OCR-प्रक्रिया स्क्यान कागजातसँग काम गर्छ
  • क्रमिक नम्बर गरिएका फाइलहरू वा ZIP अभिलेख आउटपुट गर्छ
  • सयौं विभाजन बिन्दु भएका PDF सम्हाल्छ
  • छवि
  • फन्ट र एनोटेशनसहित सबै सामग्री सुरक्षित राख्छ
  • सुरक्षित TLS अपलोड र 60 मिनेटभित्र स्वचालित मेटाइ

प्रयोगका अवसरहरू

  • ब्याच बिल निर्यातलाई व्यक्तिगत बिल PDF मा विभाजन गर्नु
  • प्रत्येक 'फारम ID' विभाजक पृष्ठमा थोक फारम स्क्यान तोड्नु
  • प्रत्येक 'मिति:' शीर्षकमा दैनिक रिपोर्ट बन्डल विभाजन गर्नु
  • मेल-मर्ज निर्यातबाट व्यक्तिगत बिरामी पत्रहरू निकाल्नु
  • प्रत्येक 'प्रदर्शनी' चिन्हमा कानूनी प्रतिलिपि तोड्नु
  • प्रत्येक 'मोड्युल' शीर्षकमा प्रशिक्षण पुस्तिका विभाजन गर्नु
  • प्रत्येक विद्यार्थीको नाममा मर्ज गरिएको परीक्षा परिणाम PDF तोड्नु

कसरी प्रयोग गर्ने

  1. 1विभाजन बिन्दुको रूपमा प्रयोग गर्न चाहनुभएका दोहोरिने पाठ चिन्ह भएको PDF अपलोड गर्नुस्।
  2. 2विभाजन गर्ने किवर्ड वा वाक्यांश प्रविष्ट गर्नुस्। अक्षर ठूलो-सानो फरक भएमा केस-असंवेदनशील मिलान सक्षम गर्नुस्, वा परिवर्तनशील ढाँचाका लागि नियमित अभिव्यक्ति प्रविष्ट गर्नुस्।
  3. 3किवर्ड भएको पृष्ठले अर्को आउटपुट फाइल सुरु गर्छ वा अघिल्लो समाप्त गर्छ भनी छनोट गर्नुस् — यसले विभाजक पृष्ठहरू कहाँ पर्छन् निर्धारण गर्छ।
  4. 4प्रक्रिया गर्नुस् क्लिक गर्नुहोस्। dokk.ai ले प्रत्येक पृष्ठ स्क्यान गर्छ, सबै मिलान पहिचान गर्छ, र प्रत्येक घटनामा कागजात विभाजन गर्छ।
  5. 5व्यक्तिगत विभाजित फाइलहरू वा ZIP अभिलेख डाउनलोड गर्नुस्। फाइलहरू क्रमबद्ध नामाकरण गरिन्छन् र प्रत्येक किवर्ड घटनाहरू बीचको एउटा खण्डसँग मेल खान्छ।

जब PDF एउटा ब्याच निर्यात हो जसमा धेरै कागजात एकसाथ जोडिएका छन् — एउटै फाइलमा सयौं बिलहरू, एक दिनको स्क्यान गरिएका फारमहरू, वा स्वचालित रूपमा तयार रिपोर्ट जहाँ प्रत्येक खण्ड ज्ञात शीर्षकबाट सुरु हुन्छ — यसलाई निश्चित किवर्डद्वारा विभाजन गर्नु हात्ले पृष्ठ दायरा पहिचान गर्नुभन्दा धेरै छिटो छ। पाठअनुसार विभाजन उपकरणले तपाईंले निर्दिष्ट गरेको वाक्यांश खोज्दै प्रत्येक पृष्ठ स्क्यान गर्छ र त्यो वाक्यांश देखा पर्दा नयाँ आउटपुट फाइल बनाउँछ, प्रभावकारी रूपमा कागजातको आफ्नै सामग्री विभाजन नक्साको रूपमा प्रयोग गर्दै। यो उपकरणले देय खाता स्वचालन, फारम प्रक्रिया पाइपलाइन, र थोक कागजात वितरण कार्यप्रवाह पूरा गर्छ। लेखा प्रणालीले 500 बिलहरू एकल PDF को रूपमा निर्यात गर्छ; पाठअनुसार विभाजनले प्रत्येक विभाजक पृष्ठमा 'बिल नम्बर' फेला पार्छ र 500 व्यक्तिगत बिल फाइलहरू उत्पादन गर्छ। चिकित्सा अभिलेख प्रणालीले बिरामी पत्रहरूको ब्याच बनाउँछ; उपकरण 'प्रिय बिरामी' मा विभाजन गरेर प्रति बिरामी एउटा पत्र उत्पादन गर्छ। किवर्ड पृष्ठ आफैं आउटपुट फाइलमा समावेश गर्ने वा त्याग्ने रोज्न सकिन्छ — अर्थपूर्ण सामग्री नभएका विभाजक पृष्ठहरूका लागि उपयोगी। केस-असंवेदनशील मिलान सुनिश्चित गर्छ कि स्वचालित कागजातमा अक्षर ठूलो-सानोको भिन्नताबारे चिन्ता गर्नु पर्दैन। नियमित अभिव्यक्ति ढाँचाहरू उन्नत प्रयोग प्रकरणहरूमा समर्थित छन्। पाठअनुसार विभाजनले औपचारिक रूपरेखा नभएका तर लगातार पाठ चिन्हहरू भएका कागजातका लागि बुकमार्कअनुसार विभाजनको पूरकको काम गर्छ। दुवै भएमा, बुकमार्कहरू सामान्यतया बढी भरपर्दो हुन्छन् किनभने ती संरचनात्मक हुन्, सामग्री-आधारित होइन। अधिकतम लचिलोपनका लागि दुवै दृष्टिकोण मिलाउनुस्: अध्याय स्तरमा बुकमार्कद्वारा विभाजन गर्नुस्, त्यसपछि व्यक्तिगत अभिलेख अलग गर्न अध्यायभित्र पाठद्वारा विभाजन गर्नुस्। सबै फाइल प्रक्रिया dokk.ai को सुरक्षित पूर्वाधारमा हुन्छ। फाइलहरू 60 मिनेटभित्र मेटाइन्छन् र मेशिन लर्निङका लागि कहिल्यै प्रयोग गरिँदैन वा तेस्रो पक्षसँग साझा गरिँदैन।

बारम्बार सोधिने प्रश्नहरू

सुरक्षा र गोपनीयता

कागजात पाठ विभाजन किवर्ड खोज्न मात्र स्क्यान गरिन्छ र भण्डारण वा अनुक्रमणिका गरिँदैन। सबै फाइलहरू TLS मार्फत स्थानान्तरण गरिन्छन् र प्रक्रियाको 60 मिनेटभित्र मेटाइन्छन्। dokk.ai GDPR अनुपालन छ र तालिम वा विश्लेषणका लागि कागजात सामग्री कहिल्यै प्रयोग गर्दैन।