Разделить по тексту
Разделять при изменении текста между страницами
Drop file here
PDF, Word, Excel, PowerPoint, images up to 25 MB
Ключевые возможности
- Разделение по любому заданному тексту или фразе. Поддержка регулярных выражений для сложных шаблонов. Опция включения или исключения страницы-разделителя. Автоматическое именование файлов по содержимому. Поддержка Unicode и кириллических разделителей. Пакетное скачивание всех частей в ZIP-архиве.
Сценарии использования
- Разбивка объединённого PDF по текстовым разделителям. Автоматизация разделения документов в рабочих процессах. Извлечение глав из книг с текстовыми заголовками. Разделение сканов пакетных документов по штрихкодам или меткам. Обработка PDF-отчётов с повторяющимися разделами.
Как использовать
- 1Загрузите PDF в dokk.ai.
- 2Введите текст-разделитель — слово, фразу или регулярное выражение.
- 3Выберите, включать ли страницу с разделителем в результирующий файл.
- 4Нажмите «Разделить» и дождитесь обработки.
- 5Скачайте все части в ZIP-архиве или по отдельности.
Разделение PDF по текстовому разделителю позволяет автоматически разбивать документы на части по ключевому слову или фразе — например, «Глава», «Раздел» или «---». Это незаменимый инструмент для объединённых PDF, созданных из нескольких источников: достаточно вставить разделительный текст при слиянии, а затем использовать этот инструмент для восстановления отдельных файлов. dokk.ai сканирует каждую страницу в поисках заданного текста и создаёт новый файл при каждом совпадении. Страница с разделителем может быть включена в результат или исключена — на ваш выбор. Имена файлов берутся из текста, следующего за разделителем. Этот инструмент завершает автоматизацию обработки счетов, конвейеры обработки форм и рабочие процессы массовой рассылки документов. Бухгалтерская система экспортирует 500 счетов одним файлом — инструмент разрезает их по ключевому тексту, создавая отдельный PDF для каждого. Вы можете выбрать, включать ли саму страницу-разделитель в выходной файл или отбрасывать её — полезно для страниц-разделителей, не несущих смыслового содержания. Поддерживается поиск без учёта регистра и регулярные выражения. Разделение по тексту дополняет «Разделение по закладкам» для документов, в которых нет формальной структуры, но есть повторяющиеся текстовые маркеры. Если документ имеет и то, и другое, закладки обычно предпочтительнее как более надёжный метод. Вся обработка выполняется на защищённой инфраструктуре dokk.ai. Файлы удаляются в течение 60 минут и никогда не используются для машинного обучения.
Часто задаваемые вопросы
Безопасность и конфиденциальность
Все файлы обрабатываются в изолированной среде и удаляются после завершения сессии.