Skip to content
Сите алатки

Подели по тексту

Подели кад се текст мења између страница

1Прикачи
2Конфигурирај
3Обработи

Drop file here

PDF, Word, Excel, PowerPoint, images up to 25 MB

Клучни карактеристики

  • Го дели PDF-от на секоја страница која содржи наведен клучен збор или фраза
  • Совпаѓање на текст без разликување на мали и главни букви по стандард
  • Опционална поддршка за образец на регуларен израз за променливи маркери
  • Избор за вклучување или исклучување на страницата со клучниот збор во претходната или следната излезна датотека
  • Работи со нативни текстуални PDF-ови и скенирани документи обработени со OCR
  • Создава последователно нумерирани датотеки или ZIP-архива
  • Ракува со PDF-ови со стотици точки на делење
  • Ги зачувува сите содржини вклучително слики
  • фонтови и прибелешки
  • Безбедно прикачување преку TLS и автоматско бришење во рок од 60 минути

Случаи на употреба

  • Делење на пакетен извоз на фактури на поединечни PDF-ови со фактури
  • Делење на масовно скенирање на формулари на секоја страница-разделувач со „Идентификатор на формулар"
  • Делење на дневен пакет со извештаи на секоја глава „Датум:"
  • Извлекување на поединечни писма за пациенти од извоз на циркуларна пошта
  • Делење на правен транскрипт на секој маркер „ИЗЛОЖБА"
  • Делење на прирачник за обука на секоја глава „Модул"
  • Делење на споен PDF со резултати од тестови на секое студентско име

Како да се користи

  1. 1Прикачете го PDF-от кој содржи повторувачки текстуални маркери кои сакате да ги користите како точки на делење.
  2. 2Внесете го клучниот збор или фразата за делење. Овозможете совпаѓање без разликување на мали и главни букви ако употребата на главни букви варира, или внесете регуларен израз за променливи обрасци.
  3. 3Изберете дали страницата која го содржи клучниот збор ја започнува следната излезна датотека или ја завршува претходната — ова одредува каде се наоѓаат страниците-разделувачи.
  4. 4Кликнете Обработи. dokk.ai ги скенира сите страни, ги идентификува сите совпаѓања и го дели документот на секое појавување.
  5. 5Преземете ги поединечните поделени датотеки или ZIP-архивата. Датотеките се именувани последователно и секоја одговара на еден дел помеѓу појавувањата на клучните зборови.

Кога PDF-от е пакетен извоз кој содржи повеќе документи поврзани заедно — стотици фактури во една датотека, дневен сет на скенирани формулари, или автоматски генериран извештај каде секој дел започнува со познат наслов — неговото делење по фиксна клучна зборна форма е многу побрзо отколку рачното идентификување на опсезите на страни. Подели по текст ја скенира секоја страница за фраза која ја наведувате и создава нова излезна датотека секогаш кога се појавува таа фраза, ефективно користејќи ја содржината на самиот документ како негова карта за делење. Ова е алатката која ги комплетира автоматизацијата на сметките, процесните цевки за обработка на формулари и работните текови за масовна дистрибуција на документи. Сметководствен систем извезува 500 фактури како еден PDF; Подели по текст го наоѓа „БРОЈ НА ФАКТУРА" на секоја страница-разделувач и создава 500 поединечни датотеки со фактури. Систем за медицински досиеа ги групира писмата за пациенти; алатката дели на „Почитуван пациент" за да произведе по едно писмо по пациент. Логистичка компанија прима дневни манифести каде секоја пратка започнува со баркод-налепница која содржи „ИДЕНТИФИКАТОР НА ПРАТКА"; алатката ја изолира секоја пратка во своја датотека за понатамошна обработка. Можете да изберете дали самата страница со клучниот збор е вклучена во излезната датотека или е отфрлена — корисно за страниците-разделувачи кои сами по себе не содржат значајна содржина. Совпаѓањето без разликување на мали и главни букви осигурува дека не треба да се грижите за варијации во употребата на главни букви во автоматски генерираните документи. Обрасците на регуларни изрази се поддржани за напредни случаи на употреба каде маркерот за делење е променлив, како „Фактура #\d+" кој одговара на кој-годе број на фактура. Подели по текст ја надополнува Подели по обележувачи за документи кои немаат формален преглед туку имаат конзистентни текстуални маркери. Ако вашите документи имаат обете, обележувачите обично се поуздани бидејќи се структурни, а не засновани на содржина. За максимална флексибилност, комбинирајте ги двата пристапи: делете по обележувачи на ниво на поглавје, потоа делете по текст во рамките на поглавјата за изолирање на поединечни записи. Целата обработка на датотеки се одвива на безбедната инфраструктура на dokk.ai. Датотеките се бришат во рок од 60 минути и никогаш не се користат за машинско учење или споделување со трети страни. Излезните датотеки се стандардни PDF-ови компатибилни со секој читач, печатач и систем за управување со документи.

Најчесто поставувани прашања

Безбедност и приватност

Текстот на документот се скенира само за наоѓање на клучниот збор за делење и не се складира ниту индексира. Сите датотеки се пренесуваат преку TLS и се бришат во рок од 60 минути по обработката. dokk.ai е усогласен со GDPR и никогаш не ги користи содржините на документите за обука или аналитика.