Pisah mengikut Teks
Pisah apabila teks berubah antara halaman
Drop file here
PDF, Word, Excel, PowerPoint, images up to 25 MB
Ciri-ciri utama
- Memisah PDF pada setiap halaman yang mengandungi kata kunci atau frasa yang ditentukan
- Padanan teks tidak sensitif huruf besar-kecil secara lalai
- Sokongan corak ungkapan biasa pilihan untuk penanda berubah-ubah
- Pilihan untuk menyertakan atau mengecualikan halaman kata kunci dalam fail output sebelum atau selepas
- Berfungsi dengan PDF teks asli dan dokumen imbasan yang diproses OCR
- Mengeluarkan fail bernombor berurutan atau arkib ZIP
- Mengendalikan PDF dengan ratusan titik pemisahan
- Mengekalkan semua kandungan termasuk imej
- fon dan anotasi
- Muat naik TLS selamat dan pemadaman automatik dalam masa 60 minit
Kes penggunaan
- Memisah eksport invois pukal kepada PDF invois individu
- Membahagikan imbasan borang pukal pada setiap halaman pemisah ID Borang
- Memisah berkas laporan harian pada setiap pengepala 'Tarikh:'
- Mengekstrak surat pelanggan individu daripada eksport gabung mel
- Membahagikan transkrip guaman pada setiap penanda 'PAMERAN'
- Memisah manual latihan pada setiap pengepala 'Modul'
- Membahagikan fail keputusan ujian yang digabungkan pada setiap nama pelajar
Cara menggunakan
- 1Muat naik PDF yang mengandungi penanda teks berulang yang ingin anda gunakan sebagai titik pemisahan.
- 2Masukkan kata kunci atau frasa untuk dipisahkan. Aktifkan padanan tidak sensitif huruf besar-kecil jika ejaan berbeza-beza, atau masukkan ungkapan biasa untuk corak berubah-ubah.
- 3Pilih sama ada halaman yang mengandungi kata kunci memulakan fail output seterusnya atau mengakhiri fail sebelumnya — ini menentukan di mana halaman pemisah diletakkan.
- 4Klik Proses. dokk.ai mengimbas setiap halaman, mengenal pasti semua padanan dan memisah dokumen pada setiap kemunculan.
- 5Muat turun fail yang dipisahkan secara individu atau arkib ZIP. Fail dinamakan secara berurutan dan setiap satu berkaitan dengan satu bahagian antara kemunculan kata kunci.
Eksport PDF pukal daripada sistem ERP, perisian pengebilan dan perisian pengurusan borang sering mengandungi ratusan atau ribuan dokumen dalam satu fail, dipisahkan oleh kata kunci atau frasa yang konsisten. Menaip julat halaman secara manual akan mengambil masa berjam-jam. Alat Pisah PDF mengikut Teks dokk.ai mengimbas setiap halaman untuk kata kunci atau corak ungkapan biasa anda dan membahagikan dokumen secara automatik pada setiap kemunculan. Padanan tidak sensitif huruf besar-kecil secara lalai dan corak ungkapan biasa pilihan untuk penanda berubah-ubah disokong — contoh, Invoice #\d+ untuk sebarang nombor invois. Anda boleh mengkonfigurasi sama ada halaman yang mengandungi kata kunci menjadi halaman pertama fail output seterusnya atau halaman terakhir fail sebelumnya. Alat ini melengkapkan automasi akaun belum bayar, saluran paip pemprosesan borang dan pengedaran dokumen pukal. Sistem perakaunan mengeksport 500 invois sebagai satu PDF — alat ini mengenal pasti penanda pemisahan dan mencipta 500 fail individu. Anda boleh memilih sama ada halaman kata kunci disertakan dalam fail output atau diabaikan. Kes huruf tidak dibezakan. Pisah mengikut Teks melengkapkan Pisah mengikut Penanda Buku untuk dokumen yang tidak mempunyai struktur formal tetapi mempunyai penanda teks yang konsisten. Semua fail diproses pada infrastruktur selamat dokk.ai. Dipadamkan dalam masa 60 minit. Tidak pernah digunakan untuk pembelajaran mesin.
Soalan lazim
Keselamatan dan privasi
Teks dokumen hanya diimbas untuk mencari kata kunci pemisahan dan tidak disimpan atau diindeks. Semua fail dipindahkan melalui TLS dan dipadamkan dalam masa 60 minit selepas pemprosesan. dokk.ai mematuhi GDPR dan tidak pernah menggunakan kandungan dokumen untuk latihan atau analitik.