Skip to content
เครื่องมือทั้งหมด

แยกตามข้อความ

แยกเมื่อข้อความเปลี่ยนระหว่างหน้า

1อัปโหลด
2ตั้งค่า
3ประมวลผล

Drop file here

PDF, Word, Excel, PowerPoint, images up to 25 MB

คุณสมบัติหลัก

  • แยก PDF ที่ทุกหน้าที่มีคีย์เวิร์ดหรือวลีที่ระบุ
  • การจับคู่ข้อความแบบไม่คำนึงถึงตัวพิมพ์ใหญ่เล็กโดยค่าเริ่มต้น
  • รองรับรูปแบบนิพจน์ปกติเพิ่มเติมสำหรับเครื่องหมายที่แปรผัน
  • ตัวเลือกรวมหรือยกเว้นหน้าคีย์เวิร์ดในไฟล์ผลลัพธ์ก่อนหน้าหรือถัดไป
  • ใช้งานได้กับ PDF ข้อความดั้งเดิมและเอกสารที่ประมวลผลด้วย OCR
  • ส่งออกไฟล์ที่เรียงลำดับหรือไฟล์ ZIP
  • รองรับ PDF ที่มีจุดแยกหลายร้อยจุด
  • เก็บรักษาเนื้อหาทั้งหมดรวมถึงรูปภาพ แบบอักษร และคำอธิบาย
  • ทำงานบนเบราว์เซอร์โดยไม่ต้องติดตั้ง
  • การอัปโหลดที่ปลอดภัยด้วย TLS และลบอัตโนมัติภายใน 60 นาที

กรณีการใช้งาน

  • แยกการส่งออกใบแจ้งหนี้แบบกลุ่มเป็น PDF ใบแจ้งหนี้แต่ละใบ
  • แบ่งการสแกนแบบฟอร์มจำนวนมากที่แต่ละหน้าตัวคั่น 'รหัสแบบฟอร์ม'
  • แยกชุดรายงานประจำวันที่แต่ละหัวข้อ 'วันที่:'
  • ดึงจดหมายผู้ป่วยแต่ละรายจากการส่งออก mail-merge
  • แบ่งบันทึกการพิจารณาคดีที่แต่ละเครื่องหมาย 'หลักฐาน'
  • แยกคู่มือการฝึกอบรมที่แต่ละหัวข้อ 'โมดูล'
  • แยกระเบียนการจัดส่งแต่ละรายการจาก PDF รายการสินค้าโลจิสติกส์
  • แยกชุดใบแจ้งยอดธนาคารที่สแกนที่แต่ละหมายเลขบัญชี
  • แบ่ง PDF ผลการทดสอบที่รวมกันที่แต่ละชื่อนักเรียน
  • ดึงกรมธรรม์แต่ละฉบับจากชุดเอกสารประกันภัยที่รวมกัน

วิธีใช้งาน

  1. 1อัปโหลด PDF ที่มีเครื่องหมายข้อความซ้ำๆ ที่คุณต้องการใช้เป็นจุดแยก
  2. 2ป้อนคีย์เวิร์ดหรือวลีที่จะแยก เปิดใช้งานการจับคู่แบบไม่คำนึงถึงตัวพิมพ์ใหญ่เล็กหากรูปแบบตัวพิมพ์แตกต่างกัน หรือป้อนนิพจน์ปกติสำหรับรูปแบบที่แปรผัน
  3. 3เลือกว่าหน้าที่มีคีย์เวิร์ดจะเริ่มต้นไฟล์ผลลัพธ์ถัดไปหรือสิ้นสุดไฟล์ก่อนหน้า ซึ่งกำหนดตำแหน่งที่หน้าตัวคั่นจะอยู่
  4. 4คลิกประมวลผล dokk.ai สแกนทุกหน้า ระบุการจับคู่ทั้งหมด และแยกเอกสารที่แต่ละครั้งที่ปรากฏ
  5. 5ดาวน์โหลดไฟล์ที่แยกแต่ละไฟล์หรือไฟล์ ZIP ไฟล์จะถูกตั้งชื่อตามลำดับและแต่ละไฟล์สอดคล้องกับส่วนหนึ่งระหว่างการปรากฏของคีย์เวิร์ด

เมื่อ PDF เป็นการส่งออกแบบกลุ่มที่มีเอกสารหลายฉบับต่อกัน — ใบแจ้งหนี้หลายร้อยใบในไฟล์เดียว แบบฟอร์มสแกนของทั้งวัน หรือรายงานที่สร้างอัตโนมัติซึ่งแต่ละส่วนเริ่มต้นด้วยหัวข้อที่รู้จัก — การแยกด้วยคีย์เวิร์ดคงที่เร็วกว่าการระบุช่วงหน้าด้วยตนเองมาก แยกตามข้อความสแกนแต่ละหน้าหาวลีที่คุณระบุและสร้างไฟล์ผลลัพธ์ใหม่ทุกครั้งที่วลีนั้นปรากฏ ซึ่งใช้เนื้อหาของเอกสารเองเป็นแผนผังการแยกอย่างมีประสิทธิภาพ นี่คือเครื่องมือที่ทำให้ระบบอัตโนมัติของบัญชีเจ้าหนี้ ไปป์ไลน์การประมวลผลแบบฟอร์ม และเวิร์กโฟลว์การแจกจ่ายเอกสารจำนวนมากสมบูรณ์ ระบบบัญชีส่งออกใบแจ้งหนี้ 500 ใบเป็น PDF เดียว แยกตามข้อความค้นหา 'หมายเลขใบแจ้งหนี้' บนแต่ละหน้าตัวคั่นและสร้างไฟล์ใบแจ้งหนี้แต่ละใบ 500 ไฟล์ ระบบบันทึกทางการแพทย์รวมจดหมายของผู้ป่วย เครื่องมือแยกที่ 'ผู้ป่วยที่รัก' เพื่อสร้างจดหมายหนึ่งฉบับต่อผู้ป่วยหนึ่งคน บริษัทโลจิสติกส์รับรายการสินค้าประจำวันที่แต่ละการส่งสินค้าเริ่มต้นด้วยป้ายบาร์โค้ดที่มี 'รหัสการจัดส่ง' เครื่องมือแยกแต่ละการจัดส่งเป็นไฟล์ของตัวเองสำหรับการประมวลผลต่อไป คุณสามารถเลือกว่าหน้าคีย์เวิร์ดเองจะรวมอยู่ในไฟล์ผลลัพธ์หรือทิ้งไป ซึ่งมีประโยชน์สำหรับหน้าตัวคั่นที่ไม่มีเนื้อหาที่มีความหมายของตัวเอง การจับคู่แบบไม่คำนึงถึงตัวพิมพ์ใหญ่เล็กทำให้คุณไม่ต้องกังวลเกี่ยวกับรูปแบบตัวพิมพ์ที่แตกต่างกันในเอกสารที่สร้างอัตโนมัติ รูปแบบนิพจน์ปกติได้รับการสนับสนุนสำหรับกรณีการใช้งานขั้นสูงที่เครื่องหมายการแยกมีความแปรผัน เช่น 'ใบแจ้งหนี้ #\d+' ที่จับคู่กับหมายเลขใบแจ้งหนี้ใดก็ได้ แยกตามข้อความเสริมการแยกตามบุ๊กมาร์กสำหรับเอกสารที่ขาดโครงร่างอย่างเป็นทางการแต่มีเครื่องหมายข้อความที่สอดคล้องกันแทน หากเอกสารของคุณมีทั้งสองอย่าง บุ๊กมาร์กมักน่าเชื่อถือมากกว่าเนื่องจากเป็นโครงสร้างแทนที่จะอิงตามเนื้อหา เพื่อความยืดหยุ่นสูงสุด รวมสองวิธีเข้าด้วยกัน แยกตามบุ๊กมาร์กในระดับบท จากนั้นแยกตามข้อความภายในบทเพื่อแยกระเบียนแต่ละรายการ การประมวลผลไฟล์ทั้งหมดเกิดขึ้นบนโครงสร้างพื้นฐานที่ปลอดภัยของ dokk.ai ไฟล์จะถูกลบภายใน 60 นาทีและไม่เคยถูกนำไปใช้สำหรับการเรียนรู้ของเครื่องหรือแชร์กับบุคคลที่สาม ไฟล์ผลลัพธ์เป็น PDF มาตรฐานที่เข้ากันได้กับทุกโปรแกรมอ่าน เครื่องพิมพ์ และระบบจัดการเอกสาร

คำถามที่พบบ่อย

ความปลอดภัยและความเป็นส่วนตัว

ข้อความในเอกสารจะถูกสแกนเพื่อค้นหาคีย์เวิร์ดการแยกเท่านั้นและไม่ถูกจัดเก็บหรือทำดัชนี ไฟล์ทั้งหมดถูกถ่ายโอนผ่าน TLS และลบภายใน 60 นาทีหลังการประมวลผล dokk.ai สอดคล้องกับ GDPR และไม่เคยนำเนื้อหาเอกสารไปใช้สำหรับการฝึกหรือการวิเคราะห์