Διαχωρισμός ανά κείμενο
Διαχωρισμός όταν αλλάζει κείμενο μεταξύ σελίδων
Drop file here
PDF, Word, Excel, PowerPoint, images up to 25 MB
Βασικά χαρακτηριστικά
- Διαιρεί το PDF σε κάθε σελίδα που περιέχει καθορισμένη λέξη-κλειδί ή φράση
- Αντιστοίχιση κειμένου χωρίς διάκριση πεζών-κεφαλαίων από προεπιλογή
- Προαιρετική υποστήριξη μοτίβων κανονικών εκφράσεων για μεταβλητές ετικέτες
- Επιλογή συμπερίληψης ή εξαίρεσης σελίδας με λέξη-κλειδί από προηγούμενο ή επόμενο αρχείο αποτελέσματος
- Λειτουργεί με εγγενή κείμενο PDF και έγγραφα επεξεργασμένα μέσω OCR
- Δημιουργεί διαδοχικά αριθμημένα αρχεία ή αρχείο ZIP
- Υποστηρίζει PDF με εκατοντάδες σημεία διαίρεσης
- Διατηρεί όλο το περιεχόμενο συμπεριλαμβανομένων εικόνων
- γραμματοσειρών και σχολίων
- Ασφαλής μεταφορά TLS και αυτόματη διαγραφή εντός 60 λεπτών
Περιπτώσεις χρήσης
- Διαίρεση μαζικής εξαγωγής τιμολογίων σε ξεχωριστά αρχεία PDF τιμολογίων
- Διαίρεση μαζικής σάρωσης φορμών σε κάθε σελίδα που διαχωρίζει αναγνωριστικό φόρμας
- Διαίρεση ημερήσιου πακέτου αναφορών σε κάθε κεφαλίδα Ημερομηνία:
- Εξαγωγή μεμονωμένων επιστολών πελατών από εξαγωγή συγχώνευσης αλληλογραφίας
- Διαίρεση νομικής μεταγραφής σε κάθε ετικέτα ΠΑΡΑΡΤΗΜΑ
- Διαίρεση εγχειριδίου εκπαίδευσης σε κάθε κεφαλίδα Ενότητα
- Διαίρεση συνδυασμένου αρχείου αποτελεσμάτων εξέτασης σε κάθε όνομα φοιτητή
Πώς να χρησιμοποιήσετε
- 1Μεταφορτώστε το PDF που περιέχει επαναλαμβανόμενες ετικέτες κειμένου τις οποίες θέλετε να χρησιμοποιήσετε ως σημεία διαίρεσης.
- 2Εισαγάγετε τη λέξη-κλειδί ή φράση για διαίρεση. Ενεργοποιήστε αντιστοίχιση χωρίς διάκριση πεζών-κεφαλαίων αν η ορθογραφία ποικίλλει, ή εισαγάγετε κανονική έκφραση για μεταβλητά μοτίβα.
- 3Επιλέξτε αν η σελίδα με τη λέξη-κλειδί ξεκινά το επόμενο αρχείο αποτελέσματος ή τελειώνει το προηγούμενο — αυτό καθορίζει πού καταλήγουν οι σελίδες διαχωριστή.
- 4Κάντε κλικ στο Επεξεργασία. Το Dokk.ai σαρώνει κάθε σελίδα, εντοπίζει όλες τις αντιστοιχίες και διαιρεί το έγγραφο σε κάθε εμφάνιση.
- 5Κατεβάστε μεμονωμένα τα διαιρεμένα αρχεία ή αρχείο ZIP. Τα αρχεία ονομάζονται διαδοχικά και κάθε ένα αντιστοιχεί σε μία ενότητα μεταξύ εμφανίσεων λέξεων-κλειδιών.
Οι μαζικές εξαγωγές PDF από συστήματα ERP, συστήματα τιμολόγησης και λογισμικό διαχείρισης φορμών περιέχουν συχνά εκατοντάδες ή χιλιάδες έγγραφα σε ένα αρχείο, διαχωρισμένα από συνεπείς λέξεις-κλειδιά ή φράσεις. Η χειροκίνητη εισαγωγή εύρων σελίδων θα έπαιρνε ώρες. Το εργαλείο Διαίρεση PDF κατά Κείμενο του dokk.ai σαρώνει κάθε σελίδα για τη λέξη-κλειδί ή το μοτίβο κανονικής έκφρασης και διαιρεί αυτόματα το έγγραφο σε κάθε εμφάνιση. Υποστηρίζεται αντιστοίχιση χωρίς διάκριση πεζών-κεφαλαίων από προεπιλογή και προαιρετικά μοτίβα κανονικών εκφράσεων για μεταβλητές ετικέτες — π.χ. Τιμολόγιο #d+ για οποιοδήποτε αριθμό τιμολογίου. Μπορείτε να ρυθμίσετε αν η σελίδα που περιέχει τη λέξη-κλειδί γίνεται η πρώτη σελίδα του επόμενου αρχείου αποτελέσματος ή η τελευταία σελίδα του προηγούμενου. Αυτό το εργαλείο συμπληρώνει την αυτοματοποίηση λογιστικής, την επεξεργασία φορμών και τη μαζική διανομή εγγράφων. Το λογιστικό σύστημα εξάγει 500 τιμολόγια ως ένα PDF — αυτό το εργαλείο αναγνωρίζει τις ετικέτες διαίρεσης και δημιουργεί 500 ξεχωριστά αρχεία. Μπορείτε να επιλέξετε αν η σελίδα με τη λέξη-κλειδί συμπεριλαμβάνεται στο αρχείο αποτελέσματος ή απορρίπτεται. Η διάκριση πεζών-κεφαλαίων δεν εφαρμόζεται. Η Διαίρεση κατά Κείμενο συμπληρώνει τη Διαίρεση κατά Σελιδοδείκτες για έγγραφα χωρίς επίσημη δομή αλλά με συνεπείς ετικέτες κειμένου. Όλα τα αρχεία επεξεργάζονται σε ασφαλή υποδομή dokk.ai. Διαγράφονται εντός 60 λεπτών. Ποτέ δεν χρησιμοποιούνται για εκμάθηση μηχανής.
Συχνές ερωτήσεις
Ασφάλεια και απόρρητο
Το κείμενο του εγγράφου σαρώνεται μόνο για εύρεση της λέξης-κλειδί διαίρεσης και δεν αποθηκεύεται ούτε ευρετηριάζεται. Όλα τα αρχεία μεταφέρονται μέσω TLS και διαγράφονται εντός 60 λεπτών από την επεξεργασία. Το Dokk.ai συμμορφώνεται με το GDPR και ποτέ δεν χρησιμοποιεί το περιεχόμενο εγγράφων για εκπαίδευση ή ανάλυση.