Skip to content
ସମସ୍ତ ଉପକରଣ

ଟେକ୍ସଟ୍ ଅନୁସାରେ ବିଭାଜନ

ପୃଷ୍ଠା ମଧ୍ୟରେ ଟେକ୍ସଟ୍ ବଦଳିଲେ ବିଭାଜନ

1ଅପଲୋଡ
2ସଂରଚନା
3ପ୍ରକ୍ରିୟା

Drop file here

PDF, Word, Excel, PowerPoint, images up to 25 MB

ମୁଖ୍ୟ ବିଶେଷତ୍ୱ

  • ନିର୍ଦ୍ଧାରିତ ଶବ୍ଦ କିମ୍ବା ବାକ୍ୟାଂଶ ଥିବା ପ୍ରତ୍ୟେକ ପୃଷ୍ଠାରେ PDF ବିଭାଜନ କରେ
  • ଡିଫଲ୍ଟ ଭାବେ କେସ-ଅସଂବେଦନଶୀଳ ଟେକ୍ସଟ ମ୍ୟାଚିଂ
  • ପରିବର୍ତ୍ତନଶୀଳ ଚିହ୍ନ ପାଇଁ ଐଚ୍ଛିକ ରେଗୁଲାର ଏକ୍ସପ୍ରେସନ ପ୍ୟାଟର୍ନ ସମର୍ଥନ
  • ଶବ୍ଦ ଥିବା ପୃଷ୍ଠାକୁ ପୂର୍ବ ବା ପରବର୍ତ୍ତୀ ଆଉଟପୁଟ ଫାଇଲରେ ସାମିଲ ବା ବାଦ ଦେବାର ବିକଳ୍ପ
  • ମୂଳ ଟେକ୍ସଟ PDF ଏବଂ OCR-ପ୍ରକ୍ରିୟାକୃତ ସ୍କାନ ଡକୁମେଣ୍ଟ ସହ କାମ କରେ
  • କ୍ରମିକ ସଂଖ୍ୟାଯୁକ୍ତ ଫାଇଲ କିମ୍ବା ZIP ଆର୍କାଇଭ ଆଉଟପୁଟ
  • ଶହ ଶହ ବିଭାଜନ ବିନ୍ଦୁ ଥିବା PDF ସମ୍ଭାଳେ
  • ଚିତ୍ର ଫଣ୍ଟ ଏବଂ ଆନୋଟେସନ ସହ ସମସ୍ତ ବିଷୟବସ୍ତୁ ସଂରକ୍ଷଣ କରେ
  • ବ୍ରାଉଜର-ଆଧାରିତ ସ୍ଥାପନା ଆବଶ୍ୟକ ନାହିଁ
  • ସୁରକ୍ଷିତ TLS ଅପଲୋଡ ଏବଂ 60 ମିନିଟ ଭିତରେ ସ୍ୱୟଂଚାଳିତ ବିଲୋପ

ବ୍ୟବହାର ଉଦ୍ଦେଶ୍ୟ

  • ବ୍ୟାଚ ଇନଭଏସ ଏକ୍ସପୋର୍ଟକୁ ବ୍ୟକ୍ତିଗତ ଇନଭଏସ PDF ରେ ବିଭାଜନ
  • ପ୍ରତ୍ୟେକ 'ଫର୍ମ ID' ବିଭାଜକ ପୃଷ୍ଠାରେ ବହୁଳ ଫର୍ମ ସ୍କାନ ବିଭାଜନ
  • ପ୍ରତ୍ୟେକ 'ତାରିଖ:' ଶୀର୍ଷକରେ ଦୈନିକ ରିପୋର୍ଟ ବଣ୍ଡଲ ବିଭାଜନ
  • ମେଲ-ମର୍ଜ ଏକ୍ସପୋର୍ଟରୁ ବ୍ୟକ୍ତିଗତ ରୋଗୀ ପତ୍ର ବାହାର କରିବା
  • ପ୍ରତ୍ୟେକ 'ଏକ୍ସହିବିଟ' ଚିହ୍ନରେ ଆଇନ ଟ୍ରାନ୍ସକ୍ରିପ୍ଟ ବିଭାଜନ
  • ପ୍ରତ୍ୟେକ 'ମଡ୍ୟୁଲ' ଶୀର୍ଷକରେ ତାଲିମ ପୁସ୍ତିକା ବିଭାଜନ
  • ଲଜିଷ୍ଟିକ୍ସ ମ୍ୟାନିଫେଷ୍ଟ PDF ରୁ ବ୍ୟକ୍ତିଗତ ଚାଲାଣ ରେକର୍ଡ ପୃଥକ କରିବା
  • ପ୍ରତ୍ୟେକ ଖାତା ନମ୍ବରରେ ସ୍କାନ ବ୍ୟାଙ୍କ ଷ୍ଟେଟମେଣ୍ଟ ବ୍ୟାଚ ବିଭାଜନ
  • ପ୍ରତ୍ୟେକ ଛାତ୍ର ନାମରେ ମିଳିତ ପରୀକ୍ଷା ଫଳାଫଳ PDF ବିଭାଜନ
  • ମିଳିତ ବୀମା ଡକୁମେଣ୍ଟ ବ୍ୟାଚରୁ ବ୍ୟକ୍ତିଗତ ପଲିସି ବାହାର କରିବା

କିପରି ବ୍ୟବହାର କରିବେ

  1. 1ଆପଣ ବିଭାଜନ ବିନ୍ଦୁ ଭାବେ ବ୍ୟବହାର କରିବାକୁ ଚାହୁଁଥିବା ପୁନରାବୃତ୍ତ ପାଠ୍ୟ ଚିହ୍ନ ଥିବା PDF ଅପଲୋଡ କରନ୍ତୁ।
  2. 2ବିଭାଜନ ପାଇଁ ଶବ୍ଦ କିମ୍ବା ବାକ୍ୟାଂଶ ଲେଖନ୍ତୁ। ବଡ଼-ଛୋଟ ଅକ୍ଷର ଭିନ୍ନ ହେଲେ କେସ-ଅସଂବେଦନଶୀଳ ମ୍ୟାଚିଂ ସକ୍ଷମ କରନ୍ତୁ, କିମ୍ବା ପରିବର୍ତ୍ତନଶୀଳ ପ୍ୟାଟର୍ନ ପାଇଁ ରେଗୁଲାର ଏକ୍ସପ୍ରେସନ ଲେଖନ୍ତୁ।
  3. 3ଶବ୍ଦ ଥିବା ପୃଷ୍ଠା ପରବର୍ତ୍ତୀ ଆଉଟପୁଟ ଫାଇଲ ଆରମ୍ଭ କରେ ନା ପୂର୍ବ ଫାଇଲ ଶେଷ କରେ ତାହା ଚୟନ କରନ୍ତୁ — ଏହା ନିର୍ଣ୍ଣୟ କରେ ବିଭାଜକ ପୃଷ୍ଠା କେଉଁଠି ଯିବ।
  4. 4ପ୍ରକ୍ରିୟା କ୍ଲିକ କରନ୍ତୁ। dokk.ai ପ୍ରତ୍ୟେକ ପୃଷ୍ଠା ସ୍କାନ କରେ, ସମସ୍ତ ମ୍ୟାଚ ଚିହ୍ନଟ କରେ, ଏବଂ ପ୍ରତ୍ୟେକ ଘଟଣାରେ ଡକୁମେଣ୍ଟ ବିଭାଜନ କରେ।
  5. 5ବ୍ୟକ୍ତିଗତ ବିଭାଜିତ ଫାଇଲ କିମ୍ବା ZIP ଆର୍କାଇଭ ଡାଉନଲୋଡ କରନ୍ତୁ। ଫାଇଲ କ୍ରମାନୁସାରେ ନାମିତ ଏବଂ ପ୍ରତ୍ୟେକଟି ଶବ୍ଦ ଘଟଣା ମଧ୍ୟର ଗୋଟିଏ ବିଭାଗ ପ୍ରତିନିଧିତ୍ୱ କରେ।

ଯେତେବେଳେ ଏକ PDF ଏକାଧିକ ଡକୁମେଣ୍ଟ ଏକତ୍ର ଯୋଡ଼ି ଏକ ବ୍ୟାଚ ଏକ୍ସପୋର୍ଟ — ଏକ ଫାଇଲରେ ଶହ ଶହ ଇନଭଏସ, ଦିନଟିର ସ୍କାନ ହୋଇଥିବା ଫର୍ମ, କିମ୍ବା ପ୍ରତ୍ୟେକ ବିଭାଗ ଏକ ଜଣାଶୁଣା ଶୀର୍ଷକରେ ଆରମ୍ଭ ହେଉଥିବା ସ୍ୱୟଂ-ସୃଷ୍ଟ ରିପୋର୍ଟ — ତେବେ ଏକ ସ୍ଥିର ଶବ୍ଦ ଅନୁସାରେ ବିଭାଜନ ପୃଷ୍ଠା ପରିସୀମା ହାତରେ ଚିହ୍ନଟ ତୁଳନାରେ ବହୁତ ଦ୍ରୁତ। ଟେକ୍ସଟ ଅନୁସାରେ ବିଭାଜନ ଆପଣ ଦେଇଥିବା ବାକ୍ୟାଂଶ ପାଇଁ ପ୍ରତ୍ୟେକ ପୃଷ୍ଠା ସ୍କାନ କରେ ଏବଂ ସେହି ବାକ୍ୟାଂଶ ଦେଖାଯିବା ମାତ୍ରେ ନୂଆ ଆଉଟପୁଟ ଫାଇଲ ସୃଷ୍ଟି କରେ, ଡକୁମେଣ୍ଟର ନିଜ ବିଷୟବସ୍ତୁକୁ ବିଭାଜନ ମାନଚିତ୍ର ଭାବେ ବ୍ୟବହାର କରି। ଏହା ସେହି ଉପକରଣ ଯାହା ହିସାବ ପ୍ରଦାନ ସ୍ୱୟଂଚାଳନ, ଫର୍ମ ପ୍ରକ୍ରିୟାକରଣ ପାଇପଲାଇନ, ଏବଂ ବହୁଳ ଡକୁମେଣ୍ଟ ବିତରଣ କାର୍ଯ୍ୟପ୍ରବାହ ସମ୍ପୂର୍ଣ୍ଣ କରେ। ଏକ ହିସାବ ବ୍ୟବସ୍ଥା 500 ଇନଭଏସ ଏକ PDF ଭାବେ ଏକ୍ସପୋର୍ଟ କରେ; ଟେକ୍ସଟ ଅନୁସାରେ ବିଭାଜନ ପ୍ରତ୍ୟେକ ବିଭାଜକ ପୃଷ୍ଠାରେ 'ଇନଭଏସ ନମ୍ବର' ଖୋଜି 500 ବ୍ୟକ୍ତିଗତ ଇନଭଏସ ଫାଇଲ ପ୍ରସ୍ତୁତ କରେ। ଏକ ଚିକିତ୍ସା ରେକର୍ଡ ବ୍ୟବସ୍ଥା ରୋଗୀ ପତ୍ର ବ୍ୟାଚ କରେ; ଉପକରଣ ପ୍ରତି ରୋଗୀଙ୍କ ପାଇଁ ଗୋଟିଏ ପତ୍ର ପ୍ରସ୍ତୁତ କରିବାକୁ 'ପ୍ରିୟ ରୋଗୀ' ରେ ବିଭାଜନ କରେ। ଏକ ଲଜିଷ୍ଟିକ୍ସ କମ୍ପାନୀ ଦୈନିକ ମ୍ୟାନିଫେଷ୍ଟ ଗ୍ରହଣ କରେ ଯେଉଁଥିରେ ପ୍ରତ୍ୟେକ ଚାଲାଣ 'ଚାଲାଣ ID' ଥିବା ବାର୍କୋଡ ଲେବେଲରେ ଆରମ୍ଭ ହୁଏ; ଉପକରଣ ପ୍ରତ୍ୟେକ ଚାଲାଣକୁ ପରବର୍ତ୍ତୀ ପ୍ରକ୍ରିୟାକରଣ ପାଇଁ ନିଜ ଫାଇଲରେ ପୃଥକ କରେ। ଆପଣ ଚୟନ କରିପାରିବେ ଶବ୍ଦ ଥିବା ପୃଷ୍ଠାକୁ ଆଉଟପୁଟ ଫାଇଲରେ ସାମିଲ କରିବେ ନା ବାଦ ଦେବେ — ନିଜର କୌଣସି ଅର୍ଥପୂର୍ଣ୍ଣ ବିଷୟବସ୍ତୁ ନଥିବା ବିଭାଜକ ପୃଷ୍ଠା ପାଇଁ ଉପଯୋଗୀ। କେସ-ଅସଂବେଦନଶୀଳ ମ୍ୟାଚିଂ ନିଶ୍ଚିତ କରେ ଯେ ସ୍ୱୟଂ-ସୃଷ୍ଟ ଡକୁମେଣ୍ଟରେ ବଡ଼-ଛୋଟ ଅକ୍ଷର ଭିନ୍ନତା ନେଇ ଚିନ୍ତା କରିବାକୁ ପଡିବ ନାହିଁ। ରେଗୁଲାର ଏକ୍ସପ୍ରେସନ ପ୍ୟାଟର୍ନ ଉନ୍ନତ ବ୍ୟବହାର ପାଇଁ ସମର୍ଥିତ ଯେଉଁଠାରେ ବିଭାଜନ ଚିହ୍ନ ପରିବର୍ତ୍ତନଶୀଳ, ଯେପରି 'Invoice #\d+' ଯେକୌଣସି ଇନଭଏସ ନମ୍ବର ମ୍ୟାଚ କରେ। ଟେକ୍ସଟ ଅନୁସାରେ ବିଭାଜନ ବୁକମାର୍କ ଅନୁସାରେ ବିଭାଜନକୁ ପୂରକ କରେ ଯେଉଁ ଡକୁମେଣ୍ଟରେ ଆନୁଷ୍ଠାନିକ ରୂପରେଖା ନାହିଁ କିନ୍ତୁ ସ୍ଥିର ପାଠ୍ୟ ଚିହ୍ନ ଅଛି। ଦୁହିଁଟି ଥିଲେ, ବୁକମାର୍କ ସାଧାରଣତଃ ଅଧିକ ନିର୍ଭରଯୋଗ୍ୟ କାରଣ ସେଗୁଡ଼ିକ ବିଷୟବସ୍ତୁ-ଆଧାରିତ ନ ହୋଇ ସଂରଚନାତ୍ମକ। ସର୍ବାଧିକ ନମନୀୟତା ପାଇଁ, ଦୁଇ ପଦ୍ଧତି ମିଶାନ୍ତୁ: ଅଧ୍ୟାୟ ସ୍ତରରେ ବୁକମାର୍କ ଅନୁସାରେ ବିଭାଜନ, ତାପରେ ବ୍ୟକ୍ତିଗତ ରେକର୍ଡ ପୃଥକ କରିବାକୁ ଅଧ୍ୟାୟ ଭିତରେ ଟେକ୍ସଟ ଅନୁସାରେ ବିଭାଜନ। ସमସ୍ତ ଫାଇଲ ପ୍ରକ୍ରିୟାକରଣ dokk.ai ର ସୁରକ୍ଷିତ ଭିତ୍ତିଭୂମିରେ ହୁଏ। ଫାଇଲ 60 ମିନିଟ ଭିତରେ ବିଲୋପ ହୁଏ ଏବଂ ମେସିନ ଲର୍ନିଂ ପାଇଁ କଦାପି ବ୍ୟବହୃତ ହୁଏ ନାହିଁ କିମ୍ବା ତୃତୀୟ ପକ୍ଷ ସହ ଅଂଶୀଦାର ହୁଏ ନାହିଁ। ଆଉଟପୁଟ ଫାଇଲ ପ୍ରତ୍ୟେକ ରିଡର, ପ୍ରିଣ୍ଟର, ଏବଂ ଡକୁମେଣ୍ଟ ପରିଚାଳନା ବ୍ୟବସ୍ଥା ସହ ସୁସଙ୍ଗତ ମାନକ PDF।

ଘନ ଘନ ପଚରାଯାଉଥିବା ପ୍ରଶ୍ନ

ସୁରକ୍ଷା ଓ ଗୋପନୀୟତା

ଡକୁମେଣ୍ଟ ଟେକ୍ସଟ କେବଳ ବିଭାଜନ ଶବ୍ଦ ଖୋଜିବା ପାଇଁ ସ୍କାନ ହୁଏ ଏବଂ ସଂରକ୍ଷିତ କିମ୍ବା ସୂଚୀକୃତ ହୁଏ ନାହିଁ। ସମସ୍ତ ଫାଇଲ TLS ମାଧ୍ୟମରେ ସ୍ଥାନାନ୍ତରିତ ଏବଂ ପ୍ରକ୍ରିୟାକରଣର 60 ମିନିଟ ଭିତରେ ବିଲୋପ ହୁଏ। dokk.ai GDPR ଅନୁପାଳନ କରେ ଏବଂ ଡକୁମେଣ୍ଟ ବିଷୟବସ୍ତୁ ତାଲିମ କିମ୍ବା ବିଶ୍ଳେଷଣ ପାଇଁ କଦାପି ବ୍ୟବହାର କରେ ନାହିଁ।