Skip to content
Всички инструменти

Подели по тексту

Подели кад се текст мења између страница

1Качване
2Конфигуриране
3Обработка

Drop file here

PDF, Word, Excel, PowerPoint, images up to 25 MB

Ключови функции

  • Разделя PDF при всяка страница
  • съдържаща зададена ключова дума или фраза
  • Съпоставяне на текст без отчитане на главни/малки букви по подразбиране
  • Незадължителна поддръжка на шаблони с регулярни изрази за променливи маркери
  • Избор дали да се включи или изключи страницата с ключовата дума от предишния или следващия изходен файл
  • Работи с PDF с нативен текст и документи
  • обработени с OCR
  • Генерира последователно номерирани файлове или ZIP архив
  • Поддържа PDF с стотици точки на разделяне
  • Запазва цялото съдържание включително изображения
  • шрифтове и анотации
  • Защитено прехвърляне чрез TLS и автоматично изтриване в рамките на 60 минути

Приложения

  • Разделяне на групов експорт на фактури на отделни PDF файлове с фактури
  • Разделяне на групово сканиране на формуляри при всяка разделителна страница с ID на формуляр
  • Разделяне на дневен пакет от отчети при всяко заглавие Дата:
  • Извличане на отделни писма до клиенти от експорт при обединяване на поща
  • Разделяне на правен протокол при всеки маркер ДОКАЗАТЕЛСТВО
  • Разделяне на ръководство за обучение при всяко заглавие Модул
  • Разделяне на обединен изходен файл от тест при всяко студентско име

Как да използвате

  1. 1Качете PDF файла, съдържащ повтарящи се текстови маркери, които искате да използвате като точки на разделяне.
  2. 2Въведете ключовата дума или фраза за разделяне. Включете съпоставяне без отчитане на главни/малки букви, ако изписването варира, или въведете регулярен израз за променливи шаблони.
  3. 3Изберете дали страницата, съдържаща ключовата дума, започва следващия изходен файл или завършва предишния — това определя къде попадат разделителните страници.
  4. 4Щракнете върху Обработи. Dokk.ai сканира всяка страница, идентифицира всички съвпадения и разделя документа при всяко появяване.
  5. 5Изтеглете отделните разделени файлове или ZIP архив. Файловете са наименувани последователно и всеки съответства на една секция между появяванията на ключовата дума.

Групови PDF експорти от ERP системи, системи за фактуриране и софтуер за управление на формуляри често съдържат стотици или хиляди документи в един файл, разделени с последователни ключови думи или фрази. Ръчното въвеждане на диапазони от страници би отнело часове. Инструментът на dokk.ai за разделяне на PDF по текст сканира всяка страница за вашата ключова дума или шаблон на регулярен израз и автоматично разделя документа при всяко появяване. По подразбиране се поддържа съпоставяне без отчитане на главни/малки букви, а за по-напреднали случаи са налични незадължителни шаблони на регулярни изрази за променливи маркери — например Фактура #\d+ за произволен номер на фактура. Можете да конфигурирате дали страницата, съдържаща ключовата дума, става първа страница на следващия изходен файл или последна страница на предишния. Този инструмент допълва автоматизацията на счетоводството, обработката на формуляри и масовото разпространение на документи. Счетоводна система експортира 500 фактури като един PDF — инструментът разпознава маркерите за разделяне и създава 500 отделни файла. Можете да изберете дали страницата с ключовата дума да бъде включена в изходния файл или отхвърлена. Главните и малките букви не се различават. Разделянето по текст допълва Разделянето по отметки за документи без формална структура, но с последователни текстови маркери. Всички файлове се обработват на защитената инфраструктура на dokk.ai. Изтриват се в рамките на 60 минути. Никога не се използват за машинно обучение.

Често задавани въпроси

Сигурност и поверителност

Текстът на документа се сканира само за намиране на ключовата дума за разделяне и не се съхранява или индексира. Всички файлове се прехвърлят чрез TLS и се изтриват в рамките на 60 минути след обработката. Dokk.ai е в съответствие с GDPR и никога не използва съдържанието на документи за обучение или анализи.