Podział wg tekstu
Podziel gdy tekst zmienia się między stronami
Drop file here
PDF, Word, Excel, PowerPoint, images up to 25 MB
Pagrindinės funkcijos
- Dalina PDF kiekviename puslapyje
- kuriame yra nurodytas raktinis žodis arba fraziė
- Didžiųjų ir mažųjų raidių nejautrus teksto atitikimas pagal nutylėjimą
- Pasirinktinis reguliariojo reiškinio šablonų palaikymas kintamiesiems žymenims
- Pasirinkimas įtraukti arba pašalinti raktinio žodžio puslapį iš ankstesnio ar kito išvesties failo
- Veikia su natyviais tekstiniais PDF ir OCR apdorotais nuskaitytais dokumentais
- Generuoja iš eilės sunumeruotus failus arba ZIP archyvą
- Tvarko PDF su šimtais skaidymo taškų
- Išsaugo visą turinį įskaitant vaizdus
- šriftus ir anotacijas
- Saugus TLS perdavimas ir automatinis trynimas per 60 minučių
Naudojimo atvejai
- Masinio sąskaitų faktūrų eksporto skaidymas į atskirus sąskaitų PDF failus
- Masinio formų nuskaitymo skaidymas prie kiekvieno formos ID atskiriamąjų puslapio
- Dienos ataskaitų paketo skaidymas prie kiekvieno antraštės „Data:“
- Atskirų klientų laiškų ištraukimas iš pašto sujungimo eksporto
- Teisinio protokolo skaidymas prie kiekvieno žymens EKSPONATAS
- Mokymo vadovo skaidymas prie kiekvienos antraštės „Modulis“
- Sujungto testo rezultatų failo skaidymas prie kiekvieno studento pavardės
Kaip naudoti
- 1Įkelkite PDF, kuriame yra pasikartojantys tekstiniai žymenys, kuriuos norite naudoti kaip skaidymo taškus.
- 2Įveskite raktinį žodį arba frazię skaidymui. Įjunkite didžiųjų ir mažųjų raidių nejautrų atitikimas, jei rašyba skiriasi, arba įveskite reguliarųjį reiškinį kintamiesiems šablonams.
- 3Pasirinkite, ar puslapis su raktiniu žodžiu pradeda kitą išvesties failą, ar baigia ankstesnį — tai lemia, kur atsiduria atskiriamųjų puslapių grupė.
- 4Spustelėkite „Apdoroti“. Dokk.ai nuskaito kiekvieną puslapį, identifikuoja visus atitikmenis ir dalija dokumentą kiekvienoje vietoje.
- 5Atsisiųskite atskirus padalintus failus arba ZIP archyvą. Failai sunumeruojami iš eilės ir kiekvienas atitinka vieną sekciją tarp raktinių žodžių pasitaikymų.
Masiniai PDF eksportai iš ERP sistemų, sąskaitų faktūrų sistemų ir formų valdymo programinės įrangos dažnai turi šimtus ar tūkstančius dokumentų viename faile, atskirto nuosekliais raktiniais žodžiais ar frazių. Rankinis puslapių diapazonų įvedimas užimų valandas. Dokk.ai įrankis „Skaidyti PDF pagal tekstą“ nuskaito kiekvieną puslapį ieškodamas jūsų raktinio žodžio ar reguliariojo reiškinio šablono ir automatiškai dalija dokumentą kiekvieną kartą, kai jis pasirodo. Palaikomas didžiųjų ir mažųjų raidių nejautrus atitikimas pagal nutylėjimą ir pasirinktiniai reguliariojo reiškinio šablonai kintamiesiems žymenims — pvz., Sąskaita #\d+ bet kokiam sąskaitos numeriui. Galite konfigurūoti, ar puslapyje su raktiniu žodžiu esantis puslapis tampa kito išvesties failo pirmuoju puslapiu, ar ankstesnio paskutiniu. Šis įrankis papildo buhalterijos automatizavimą, formų apdorojimą ir masinį dokumentų paskirstymą. Buhalterinė sistema eksportuoja 500 sąskaitų kaip vieną PDF — šis įrankis atpažįsta skaidymo žymenis ir sukuria 500 atskirų failų. Galite pasirinkti, ar puslapis su raktiniu žodžiu turi būti įtrauktas į išvesties failą, ar atmestas. Didžiosios ir mažosios raidės neskiriamos. Skaidymas pagal tekstą papildo skaidymą pagal žymes dokumentams be formalios struktūros, bet su nuosekliais tekstiniais žymenimis. Visi failai apdorojami saugioje dokk.ai infrastruktūroje. Ištrinami per 60 minučių. Niekada nenaudojami mašininio mokymosi tikslais.
Dažniausiai užduodami klausimai
Saugumas ir privatumas
Dokumento tekstas nuskaičiuojamas tik skaidymo raktinio žodžio paiškai ir nėra saugomas ar indeksuojamas. Visi failai perduodami per TLS ir ištrinami per 60 minučių po apdorojimo. Dokk.ai atitinka BDAR ir niekada nenaudoja dokumentų turinio mokymui ar analizėi.