Dividi per testo
Dividi quando il testo cambia tra le pagine
Drop file here
PDF, Word, Excel, PowerPoint, images up to 25 MB
Funzionalità principali
- Divide il PDF a ogni pagina contenente una parola chiave o frase specificata
- Corrispondenza del testo senza distinzione tra maiuscole e minuscole per impostazione predefinita
- Supporto opzionale per pattern di espressioni regolari per marcatori variabili
- Scelta di includere o escludere la pagina della parola chiave nel file di output precedente o seguente
- Funziona con PDF di testo nativo e documenti scansionati elaborati con OCR
- Output di file numerati sequenzialmente o archivio ZIP
- Gestisce PDF con centinaia di punti di divisione
- Preserva tutto il contenuto incluse immagini
- caratteri e annotazioni
- Basato su browser senza installazione richiesta
- Caricamento TLS sicuro ed eliminazione automatica entro 60 minuti
Casi d'uso
- Divisione di un'esportazione batch di fatture in singoli PDF di fattura
- Suddivisione di una scansione massiva di moduli a ogni pagina separatrice 'ID modulo'
- Divisione di un bundle di report giornaliero a ogni intestazione 'Data:'
- Estrazione di singole lettere per i pazienti da un'esportazione di stampa unione
- Suddivisione di una trascrizione legale a ogni marcatore 'DOCUMENTO'
- Divisione di un manuale di formazione a ogni intestazione 'Modulo'
- Isolamento di singoli record di spedizione da un PDF di manifesto logistico
- Divisione di un batch di estratti conto bancari scansionati a ogni numero di conto
- Suddivisione di un PDF di risultati dei test uniti a ogni nome di studente
- Estrazione di singole polizze da un batch di documenti assicurativi combinati
Come si usa
- 1Carichi il PDF che contiene marcatori di testo ripetuti da utilizzare come punti di divisione.
- 2Inserisca la parola chiave o la frase su cui dividere. Abiliti la corrispondenza senza distinzione tra maiuscole e minuscole se la capitalizzazione varia, o inserisca un'espressione regolare per pattern variabili.
- 3Scelga se la pagina contenente la parola chiave avvia il file di output successivo o termina quello precedente — questo determina dove atterrano le pagine separatrici.
- 4Faccia clic su Elabora. Dokk.ai esegue la scansione di ogni pagina, identifica tutte le corrispondenze e divide il documento a ogni occorrenza.
- 5Scarichi i singoli file divisi o un archivio ZIP. I file sono denominati sequenzialmente e ciascuno corrisponde a una sezione tra le occorrenze della parola chiave.
Quando un PDF è un'esportazione batch contenente più documenti concatenati insieme — centinaia di fatture in un unico file, un giorno di moduli scansionati, o un report generato automaticamente dove ogni sezione inizia con un'intestazione nota — dividerlo per una parola chiave fissa è molto più veloce dell'identificazione manuale degli intervalli di pagine. Dividi per testo esegue la scansione di ogni pagina per una frase specificata e crea un nuovo file di output ogni volta che quella frase appare, utilizzando efficacemente il contenuto del documento stesso come mappa di divisione. Questo è lo strumento che completa l'automazione della contabilità fornitori, le pipeline di elaborazione moduli e i flussi di lavoro di distribuzione documenti massivi. Un sistema contabile esporta 500 fatture come un unico PDF; Dividi per testo trova 'NUMERO FATTURA' su ogni pagina separatrice e produce 500 file di fatture individuali. È possibile scegliere se la pagina con la parola chiave sia inclusa nel file di output o eliminata — utile per le pagine separatrici che non portano contenuto significativo proprio. La corrispondenza senza distinzione tra maiuscole e minuscole garantisce di non dover preoccuparsi delle variazioni di capitalizzazione. I pattern di espressioni regolari sono supportati per casi d'uso avanzati. Tutti i file vengono eliminati entro 60 minuti e non vengono mai utilizzati per l'apprendimento automatico o condivisi con terze parti.
Domande frequenti
Sicurezza e privacy
Il testo del documento viene scansionato solo per trovare la parola chiave di divisione e non viene memorizzato o indicizzato. Tutti i file vengono trasferiti tramite TLS ed eliminati entro 60 minuti dall'elaborazione. Dokk.ai è conforme al GDPR e non utilizza mai il contenuto del documento per l'addestramento o l'analisi.