פיצול לפי טקסט
פצל כשהטקסט משתנה בין עמודים
Drop file here
PDF, Word, Excel, PowerPoint, images up to 25 MB
תכונות מרכזיות
- מפצל PDF בכל עמוד המכיל מילת מפתח או ביטוי מצוין
- התאמת טקסט לא-רגישה לאותיות גדולות/קטנות כברירת מחדל
- תמיכת תבנית ביטוי רגולרי אופציונלית לסמנים משתנים
- בחירה לכלול או לא לכלול את עמוד מילת המפתח בקובץ הפלט הקודם או הבא
- עובד עם PDF טקסט מקורי ומסמכים סרוקים שעובדו ב-OCR
- מפיק קבצים ממוספרים ברצף או ארכיב ZIP
- מטפל ב-PDF עם מאות נקודות פיצול
- שומר על כל התוכן כולל תמונות
- גופנים והערות
- העלאת TLS מאובטחת ומחיקה אוטומטית תוך 60 דקות
מקרי שימוש
- פיצול ייצוא חשבוניות אצווה ל-PDF חשבוניות נפרדות
- חלוקת סריקת טפסים בכמות גדולה בכל עמוד מפריד 'מזהה טופס'
- פיצול חבילת דוחות יומיים בכל כותרת 'תאריך:'
- חילוץ מכתבי מטופלים בודדים מייצוא איחוד דיוור
- חלוקת תמלול משפטי בכל סמן 'נספח'
- פיצול מדריך הכשרה בכל כותרת 'מודול'
- פיצול PDF תוצאות מבחן ממוזג בשם כל תלמיד
איך להשתמש
- 1העלה את ה-PDF המכיל סמני טקסט חוזרים שברצונך להשתמש בהם כנקודות פיצול.
- 2הזן את מילת המפתח או הביטוי לפיצול עליו. הפעל התאמה לא-רגישה לאותיות אם הכתיב משתנה, או הזן ביטוי רגולרי לתבניות משתנות.
- 3בחר אם העמוד המכיל את מילת המפתח מתחיל את קובץ הפלט הבא או מסיים את הקודם — זה קובע היכן נוחתים עמודי המפריד.
- 4לחץ על עבד. dokk.ai סורק כל עמוד, מזהה את כל ההתאמות, ומפצל את המסמך בכל מופע.
- 5הורד את קבצי הפיצול הבודדים או ארכיב ZIP. הקבצים ממוספרים ברצף וכל אחד מתאים לסעיף אחד בין מופעי מילת המפתח.
כאשר PDF הוא ייצוא אצווה המכיל מסמכים מרובים שרוכבים יחד — מאות חשבוניות בקובץ אחד, יום של טפסים סרוקים, או דוח שנוצר אוטומטית שבו כל סעיף מתחיל בכותרת ידועה — פיצולו לפי מילת מפתח קבועה הרבה יותר מהיר מאשר זיהוי טווחי עמודים ידנית. פיצול לפי טקסט סורק כל עמוד לאיתור ביטוי שאתה מציין ויוצר קובץ פלט חדש בכל פעם שביטוי זה מופיע, תוך שימוש אפקטיבי בתוכן המסמך עצמו כמפת פיצול. זהו הכלי שמשלים אוטומציה של חשבונות לתשלום, תהליכי עיבוד טפסים וזרימות עבודה של הפצת מסמכים בכמות גדולה. מערכת חשבונאות מייצאת 500 חשבוניות כ-PDF אחד; פיצול לפי טקסט מוצא 'מספר חשבונית' בכל עמוד מפריד ומייצר 500 קבצי חשבונית נפרדים. מערכת תיעוד רפואי מאגדת מכתבי מטופלים; הכלי מפצל ב'מטופל יקר' כדי לייצר מכתב אחד למטופל. אתה יכול לבחור אם עמוד מילת המפתח עצמו נכלל בקובץ הפלט או נזרק — שימושי לעמודי מפריד שאין להם תוכן משמעותי משלהם. התאמה לא-רגישה לאותיות גדולות/קטנות מבטיחה שאינך צריך לדאוג לשינויים בכתיב האותיות במסמכים שנוצרו אוטומטית. תבניות ביטוי רגולרי נתמכות למקרי שימוש מתקדמים שבהם מחוון הפיצול משתנה, כגון 'חשבונית #\d+' שמתאים לכל מספר חשבונית. פיצול לפי טקסט משלים פיצול לפי סימניות עבור מסמכים שאין להם מתאר רשמי אך יש להם סמנים טקסטואליים עקביים במקום זאת. אם למסמכים שלך יש את שניהם, סימניות בדרך כלל אמינות יותר מאחר שהן מבניות ולא מבוססות תוכן. כל עיבוד הקבצים מתרחש על התשתית המאובטחת של dokk.ai. קבצים נמחקים תוך 60 דקות ולעולם לא משמשים ללמידת מכונה או משותפים עם צדדים שלישיים. קבצי הפלט הם PDF תקניים התואמים לכל קורא, מדפסת ומערכת ניהול מסמכים.
שאלות נפוצות
אבטחה ופרטיות
טקסט המסמך נסרק רק כדי למצוא את מילת המפתח לפיצול ואינו מאוחסן או מאונדקס. כל הקבצים מועברים דרך TLS ונמחקים תוך 60 דקות מהעיבוד. dokk.ai תואם GDPR ולעולם אינו משתמש בתוכן מסמכים לאימון או אנליטיקה.