I-split ayon sa Teksto
I-split kapag nagbabago ang teksto sa pagitan ng mga pahina
Drop file here
PDF, Word, Excel, PowerPoint, images up to 25 MB
Mga pangunahing feature
- Hinahati ang PDF sa bawat pahina na naglalaman ng tinukoy na keyword o parirala
- Case-insensitive na paghahanap ng teksto bilang default
- Opsyonal na suporta sa regular expression pattern para sa mga variable na marker
- Pumili kung isasama o ibubukod ang pahina ng keyword mula sa nauna o susunod na output file
- Gumagana sa native text PDF at OCR-processed na dokumento
- Naglilikha ng sunud-sunod na may bilang na mga file o ZIP archive
- Sinusuportahan ang PDF na may daan-daang split point
- Pinapanatili ang lahat ng nilalaman kabilang ang mga imahe
- font
- at anotasyon
- Secure na TLS upload at awtomatikong pagtanggal sa loob ng 60 minuto
Mga use case
- Paghahati ng bulk invoice export sa mga indibidwal na PDF na invoice
- Paghahati ng bulk na pag-scan ng form sa bawat pahina ng separator ng form ID
- Paghahati ng pang-araw-araw na report packet sa bawat header na Petsa:
- Pagkuha ng mga indibidwal na liham ng kliyente mula sa mail-merge export
- Paghahati ng legal na transcript sa bawat EXHIBIT marker
- Paghahati ng training manual sa bawat header na Module
- Paghahati ng pinagsama-samang output file ng pagsusulit sa bawat pangalan ng estudyante
Paano gamitin
- 1I-upload ang PDF na naglalaman ng paulit-ulit na mga text marker na gusto mong gamitin bilang mga split point.
- 2Ilagay ang keyword o parirala na paghahatiin. I-enable ang case-insensitive na paghahanap kung nagkakaiba ang spelling, o ilagay ang regular expression para sa mga variable na pattern.
- 3Piliin kung ang pahina na naglalaman ng keyword ay magsisimula ng susunod na output file o nagtatapos ng nauna — tinutukoy nito kung saan mapupunta ang mga separator na pahina.
- 4I-click ang I-proseso. Nini-scan ng dokk.ai ang bawat pahina, inuukoy ang lahat ng match, at hinahati ang dokumento sa bawat paglitaw.
- 5I-download ang mga indibidwal na split file o ZIP archive. Ang mga file ay sunud-sunod na pinangalanan, at ang bawat isa ay tumutugma sa isang seksyon sa pagitan ng mga paglitaw ng keyword.
Ang mga bulk na export ng PDF mula sa mga ERP system, billing system, at form management software ay kadalasang naglalaman ng daan-daan o libu-libong dokumento sa isang file, na pinaghiwalay ng magkakatulad na mga keyword o parirala. Ang manu-manong pag-type ng mga saklaw ng pahina ay aabutin ng maraming oras. Ang tool na Hatiin ang PDF ayon sa Teksto ng dokk.ai ay nag-i-scan ng bawat pahina para sa iyong keyword o regular expression pattern at awtomatikong hinahati ang dokumento sa bawat paglitaw. Sinusuportahan ang case-insensitive na paghahanap bilang default at opsyonal na regular expression pattern para sa mga variable na marker — hal. Invoice #\d+ para sa anumang numero ng invoice. Maaari mong i-configure kung ang pahinang naglalaman ng keyword ay magiging unang pahina ng susunod na output file o ang huling pahina ng nauna. Sinasaklaw ng tool na ito ang accounting automation, form processing, at bulk na pamamahagi ng dokumento. Ang sistema ng accounting ay nag-e-export ng 500 invoice bilang isang PDF — kinikilala ng tool na ito ang mga split marker at lumilikha ng 500 magkakahiwalay na file. Maaari mong piliin kung isasama ang pahina na may keyword sa output file o itatapon ito. Hindi case-sensitive ang paghahanap bilang default. Pinupunan ng Hatiin ayon sa Teksto ang Hatiin ayon sa Bookmark para sa mga dokumento na walang pormal na istruktura ngunit may magkakatulad na text marker. Lahat ng file ay pinoproseso sa secure na imprastraktura ng dokk.ai. Tinatanggal sa loob ng 60 minuto. Hindi kailanman ginagamit para sa machine learning.
Mga madalas na tanong
Seguridad at privacy
Ang teksto ng dokumento ay ini-scan lamang upang mahanap ang split keyword at hindi iniimbak o ina-index. Lahat ng file ay inililipat sa pamamagitan ng TLS at tinatanggal sa loob ng 60 minuto matapos maproseso. Sumusunod ang dokk.ai sa GDPR at hindi kailanman gumagamit ng nilalaman ng dokumento para sa pagsasanay o analytics.