Skip to content
ყველა ინსტრუმენტი

ტექსტის მიხედვით გაყოფა

გაყოფა, როცა ტექსტი იცვლება გვერდებს შორის

1ატვირთვა
2კონფიგურაცია
3დამუშავება

Drop file here

PDF, Word, Excel, PowerPoint, images up to 25 MB

ძირითადი ფუნქციები

  • PDF-ს ყოფს თითოეულ გვერდზე
  • რომელიც მითითებულ საკვანძო სიტყვას ან ფრაზას შეიცავს
  • ტექსტის დამთხვევა რეგისტრის გათვალისწინების გარეშე ნაგულისხმევად
  • სურვილისამებრ რეგულარული გამოხატულებების შაბლონის მხარდაჭერა ცვლადი მარკერებისთვის
  • არჩევანი — საკვანძო სიტყვის გვერდი წინა ან შემდეგ გამომავალ ფაილში ჩართოთ ან გამოასხვათ
  • მუშაობს ნატიური ტექსტური PDF-ებითა და OCR-ით დამუშავებული სკანირებული დოკუმენტებით
  • გამოაქვს თანმიმდევრულად დანომრილი ფაილები ან ZIP-ის არქივი
  • ასობით გაყოფის წერტილის მქონე PDF-ებს ამუშავებს
  • ყველა კონტენტს ინარჩუნებს გამოსახულებების
  • შრიფტებისა და ანოტაციების ჩათვლით
  • ბრაუზერზე დაფუძნებული
  • ინსტალაცია საჭირო არ არის
  • TLS ატვირთვა და ავტომატური წაშლა 60 წუთში

გამოყენების შემთხვევები

  • ინვოისების სერიული ექსპორტის ინდივიდუალურ ინვოისის PDF-ებად გაყოფა
  • ფორმების მასობრივი სკანის თითოეულ "ფორმის ID" გამყოფ გვერდზე დაყოფა
  • ყოველდღიური ანგარიშების პაკეტის თითოეულ "თარიღი:" სათაურზე გაყოფა
  • ინდივიდუალური პაციენტის წერილების მეილ-მერჯის ექსპორტიდან გამოძირება
  • სამართლებრივი ტრანსკრიპტის თითოეულ "EXHIBIT" მარკერზე დაყოფა
  • სასწავლო სახელმძღვანელოს თითოეულ "მოდული" სათაურზე გაყოფა
  • ინდივიდუალური გადაზიდვის ჩანაწერების სამეურნეო მანიფესტის PDF-დან გამოყოფა
  • სკანირებული საბანკო ამონაწერების პაკეტის თითოეულ ანგარიშის ნომერზე გაყოფა
  • შეერთებული ტესტების შედეგების PDF-ის თითოეული სტუდენტის სახელზე დაყოფა
  • ინდივიდუალური პოლიტიკის სადაზღვევო დოკუმენტების კომბინირებული პაკეტიდან გამოძირება

როგორ გამოიყენო

  1. 1ატვირთეთ PDF, რომელიც შეიცავს გამეორებულ ტექსტურ მარკერებს, რომლებიც გაყოფის წერტილებად გსურთ გამოიყენოთ.
  2. 2შეიყვანეთ გაყოფის საკვანძო სიტყვა ან ფრაზა. ჩართეთ რეგისტრის მიმართ შეუმჩნეველი დამთხვევა, თუ კაპიტალიზაცია იცვლება, ან შეიყვანეთ რეგულარული გამოხატულება ცვლადი შაბლონებისთვის.
  3. 3აირჩიეთ, საკვანძო სიტყვის შემცველი გვერდი შემდეგ გამომავალ ფაილს იწყებს თუ წინა ამთავრებს — ეს განსაზღვრავს, სად მოხვდება გამყოფი გვერდები.
  4. 4დააჭირეთ დამუშავებას. dokk.ai სკანირებს თითოეულ გვერდს, პოულობს ყველა დამთხვევას და დოკუმენტს ყოველ გამოჩენაზე ყოფს.
  5. 5ჩამოტვირთეთ ინდივიდუალური გაყოფილი ფაილები ან ZIP-ის არქივი. ფაილები თანმიმდევრულად არის დასახელებული და თითოეული საკვანძო სიტყვის გამოჩენებს შორის ერთ სექციას შეესაბამება.

როდესაც PDF ერთ ფაილში გაერთიანებული მრავალი დოკუმენტის სერიული ექსპორტია — ასობით ინვოისი, ერთი დღის დასკანერებული ფორმები, ან ავტომატურად გენერირებული ანგარიში, სადაც თითოეული სექცია ცნობილი სათაურით იწყება — ფიქსირებული საკვანძო სიტყვით გაყოფა გვერდების დიაპაზონების ხელით განსაზღვრაზე გაცილებით სწრაფია. ტექსტის მიხედვით გაყოფა სკანირებს თითოეულ გვერდს თქვენს მიერ მითითებული ფრაზის საძიებლად და ყოველ გამოჩენაზე ახალ გამომავალ ფაილს ქმნის, ეფექტურად იყენებს რა დოკუმენტის კონტენტს, როგორც გაყოფის რუქას. ეს ის ხელსაწყოა, რომელიც გადასახდელების ავტომატიზაციას, ფორმების დამუშავების მილსადენებს და დოკუმენტების მასობრივი გავრცელების სამუშაო ნაკადებს ასრულებს. სააღრიცხვო სისტემა 500 ინვოისს ერთ PDF-ად ექსპორტავს — ტექსტის მიხედვით გაყოფა თითოეულ გამყოფ გვერდზე "INVOICE NUMBER"-ს პოულობს და 500 ინდივიდუალურ ინვოისის ფაილს ქმნის. სამედიცინო ჩანაწერების სისტემა პაციენტის წერილებს ჯგუფავს — ხელსაწყო "Dear Patient"-ზე ყოფს, რათა თითოეული პაციენტისთვის ერთი წერილი შეიქმნას. სამეურნეო კომპანია ყოველდღიურ მანიფესტებს იღებს, სადაც თითოეული გადაზიდვა "SHIPMENT ID" შემცველი შტრიხკოდის ეტიკეტით იწყება — ხელსაწყო თითოეულ გადაზიდვას საკუთარ ფაილად გამოყოფს შემდგომი დამუშავებისთვის. შეგიძლიათ აირჩიოთ, საკვანძო სიტყვის გვერდი გამომავალ ფაილში ჩაირთოს თუ ამოღებული იყოს — სასარგებლოა გამყოფი გვერდებისთვის, რომლებსაც საკუთარი მნიშვნელოვანი კონტენტი არ გააჩნია. რეგისტრის მიმართ შეუმჩნეველი დამთხვევა უზრუნველყოფს, რომ ავტომატურად გენერირებულ დოკუმენტებში კაპიტალიზაციის ვარიაციები არ გაიწუხებს. რეგულარული გამოხატულებების შაბლონები მხარდაჭერილია გაფართოებული გამოყენების შემთხვევებისთვის, სადაც გაყოფის მარკერი ცვლადია, მაგალითად Invoice #\d+ ნებისმიერი ინვოისის ნომრის შესაბამისი. ტექსტის მიხედვით გაყოფა სანიშნეებით გაყოფას ავსებს იმ დოკუმენტებისთვის, რომლებსაც ფორმალური სტრუქტურა არ გააჩნია, მაგრამ თანმიმდევრული ტექსტური მარკერები აქვს. თუ თქვენს დოკუმენტებს ორივე გააჩნია, სანიშნეები ჩვეულებრივ უფრო სანდოა, ვინაიდან სტრუქტურული და კი არა კონტენტზე დაფუძნებულია. მაქსიმალური მოქნილობისთვის ორი მიდგომა შეუთავსეთ: სანიშნეებით გაყოფა თავების დონეზე, შემდეგ ტექსტის მიხედვით გაყოფა თავებში ინდივიდუალური ჩანაწერების გამოსაყოფად. ყველა ფაილის დამუშავება dokk.ai-ის უსაფრთხო ინფრასტრუქტურაზე ხდება. ფაილები 60 წუთში იშლება და არასოდეს გამოიყენება მანქანური სწავლებისთვის ან მესამე მხარეებთან გაზიარებისთვის. გამომავალი ფაილები სტანდარტული PDF-ებია, რომლებიც ყველა მკითხველთან, პრინტერთან და დოკუმენტების მართვის სისტემასთან თავსებადია.

ხშირად დასმული კითხვები

უსაფრთხოება და კონფიდენციალობა

დოკუმენტის ტექსტი მხოლოდ გაყოფის საკვანძო სიტყვის საძიებლად სკანირდება და არ ინახება და არ ინდექსდება. ყველა ფაილი TLS-ით გადაიცემა და დამუშავებიდან 60 წუთში იშლება. dokk.ai GDPR-თან შესაბამისია და არასოდეს იყენებს დოკუმენტის კონტენტს სწავლებისთვის ან ანალიტიკისთვის.