Мәтін бойынша бөлу
Беттер арасындағы мәтін өзгергенде бөлу
Drop file here
PDF, Word, Excel, PowerPoint, images up to 25 MB
Негізгі мүмкіндіктер
- PDF-ті көрсетілген кілт сөзі немесе фразасы бар әр бетте бөледі
- мәтін сәйкестігі әдепкі бойынша регистрге сезімтал емес
- айнымалы маркерлер үшін қосымша тұрақты өрнек үлгісін қолдау
- алдыңғы немесе келесі шығыс файлға кілт сөз бетін қосуды немесе шығаруды таңдау
- жергілікті мәтіндік PDF-тер және OCR-өңделген сканерленген құжаттармен жұмыс
- реттілікпен нөмірленген файлдар немесе ZIP мұрағатын шығарады
- жүздеген бөлу нүктелері бар PDF-терді өңдейді
- суреттерді
- қаріптерді және аннотацияларды қоса барлық мазмұнды сақтайды
- орнатусыз браузерде жұмыс жасайды
- TLS арқылы қауіпсіз жүктеп салу және 60 минут ішінде автоматты жою
Қолдану жағдайлары
- Шот-фактуралардың топтық экспортын жеке шот-фактура PDF-теріне бөлу
- пішіндердің жаппай сканін әр "Пішін ID" бөлгіш бетінде бөлу
- күнделікті есеп бумасын әр "Күні:" тақырыбында бөлу
- пошта-біріктіру экспортынан жеке пациент хаттарын шығарып алу
- заңды транскриптті әр "EXHIBIT" маркерінде бөлу
- оқыту нұсқаулығын әр "Модуль" тақырыбында бөлу
- логистикалық манифест PDF-нен жеке тасымал жазбаларын оқшаулау
- сканерленген банк үзінді тізімін әр шот нөмірінде бөлу
- біріктірілген тест нәтижесі PDF-ін әр студент атында бөлу
- біріктірілген сақтандыру құжаттары бумасынан жеке полисті шығарып алу
Қалай пайдалану керек
- 1Бөлу нүктелері ретінде пайдаланғыңыз келетін қайталанатын мәтіндік маркерлері бар PDF-ті жүктеп беріңіз.
- 2Бөлуге арналған кілт сөзді немесе фразаны енгізіңіз. Бас әріп жазылуы өзгерсе регистрге сезімтал еместі қосыңыз немесе айнымалы үлгілер үшін тұрақты өрнек енгізіңіз.
- 3Кілт сөзі бар бет келесі шығыс файлды бастайтынын немесе алдыңғысын аяқтайтынын таңдаңыз — бұл бөлгіш беттердің қайда орналасатынын анықтайды.
- 4Өңдеу түймесін басыңыз. dokk.ai әр бетті сканерлейді, барлық сәйкестіктерді анықтайды және құжатты әр кездесуде бөледі.
- 5Жеке бөлінген файлдарды немесе ZIP мұрағатын жүктеп алыңыз. Файлдар реттілікпен аталады және әрқайсысы кілт сөз кездесулері арасындағы бір бөлімге сәйкес келеді.
PDF бірнеше құжаттың бір файлда біріктірілген топтық экспорты болғанда — жүздеген шот-фактура, бір күндік сканерленген пішіндер немесе белгілі тақырыппен басталатын белгілі бөлімдері бар автоматты жасалған есеп — оны бекітілген кілт сөз бойынша бөлу бет диапазондарын қолмен анықтаудан әлдеқайда жылдам. Мәтін бойынша бөлу әр бетті сіз көрсеткен фраза үшін сканерлейді және ол фраза кездескен сайын жаңа шығыс файл жасайды, тиімді түрде құжаттың өз мазмұнын бөлу картасы ретінде пайдаланады. Бұл кредиторлық берешекті автоматтандыруды, пішінді өңдеу желілерін және жаппай құжат тарату жұмыс ағындарын аяқтайтын құрал. Бухгалтерлік жүйе 500 шот-фактураны бір PDF ретінде экспорттайды — Мәтін бойынша бөлу әр бөлгіш бетте "INVOICE NUMBER" тауып, 500 жеке шот-фактура файлын шығарады. Медициналық жазбалар жүйесі пациент хаттарын топтастырады — құрал әр пациент үшін бір хат шығару үшін "Dear Patient" деп бөледі. Логистикалық компания "SHIPMENT ID" бар штрихкод жапсырмасымен басталатын тасымал жазбаларын алады — құрал кейінгі өңдеу үшін әр тасымалды өз файлына бөліп шығарады. Кілт сөз бетінің өзі шығыс файлға қосылатынын немесе алынып тасталатынын таңдауға болады — өздерінің мазмұны жоқ бөлгіш беттер үшін пайдалы. Регистрге сезімталдығы жоқ сәйкестік автоматты жасалған құжаттардағы бас әріп вариацияларын алаңдатпайтынын қамтамасыз етеді. Кілт сөз айнымалы болатын кеңейтілген жағдайлар үшін, мысалы кез келген шот-фактура нөміріне сәйкес Invoice #\d+ сияқты, тұрақты өрнек үлгілері қолданылады. Мәтін бойынша бөлу ресми контурасы жоқ, бірақ тұрақты мәтіндік маркерлері бар құжаттар үшін Бетбелгілер бойынша бөлуді толықтырады. Егер құжаттарыңызда екеуі де болса, бетбелгілер әдетте сенімдірек болады, себебі олар мазмұнға емес құрылымдыға негізделген. Максималды икемділік үшін екі тәсілді біріктіріңіз: тарау деңгейінде бетбелгілер бойынша бөліп, содан кейін жеке жазбаларды оқшаулау үшін тараулар ішінде мәтін бойынша бөліңіз. Барлық файлды өңдеу dokk.ai-дің қауіпсіз инфрақұрылымында жүреді. Файлдар 60 минут ішінде жойылады және машиналық оқыту үшін ешқашан пайдаланылмайды немесе үшінші тараптармен бөліспейді. Шығыс файлдар барлық оқырман, принтер және құжат-менеджмент жүйесімен үйлесімді стандартты PDF-тер.
Жиі қойылатын сұрақтар
Қауіпсіздік және құпиялылық
Құжат мәтіні тек бөлу кілт сөзін табу үшін сканерленеді, сақталмайды немесе индекстелмейді. Барлық файлдар TLS арқылы тасымалданады және өңделгеннен кейін 60 минут ішінде жойылады. dokk.ai GDPR талаптарына сай және оқыту немесе аналитика үшін құжат мазмұнын ешқашан пайдаланбайды.