Skip to content
Všechny nástroje

OCR

Rozpoznat text ve skenech

1Nahrát
2Nastavit
3Zpracovat

Drop file here

PDF, Word, Excel, PowerPoint, images up to 25 MB

Klíčové funkce

  • Podpora přes 100 jazyků
  • Zachovává originální obrázek stránky
  • Přidává neviditelnou textovou vrstvu pro vyhledávání
  • Automatické deskew preprocessing
  • Výsledek je prohledávatelný PDF
  • Vícestránkové dokumenty
  • Volitelná rekognoskace layoutu
  • Žádná registrace
  • Automatické smazání souborů

Případy použití

  • Konverze skenovaných smluv na prohledávatelné dokumenty
  • Digitalizace archivovaných papírových záznamů
  • OCR na naskenovaných účtenách pro účetnictví
  • Příprava skenovaných zpráv pro vyhledávání fulltextem
  • Digitalizace historických dokumentů pro archivaci
  • Konverze faxem přijatých PDF na editovatelné dokumenty

Jak používat

  1. 1Nahrajte skenovaný PDF nebo obrázek (JPG, PNG, TIFF) přetažením nebo kliknutím pro výběr.
  2. 2Vyberte primární jazyk dokumentu pro nejlepší OCR přesnost.
  3. 3Klikněte na Spustit OCR.
  4. 4Počkejte na zpracování — čas závisí na počtu stránek.
  5. 5Stáhněte prohledávatelný PDF soubor.

Skenované dokumenty jsou obrázky PDF — grafické snímky fyzických stránek. Text v nich vypadá jako text ale ve skutečnosti jsou to pixely. Nemůžete jej kopírovat, vyhledávat v něm ani editovat. OCR (optické rozpoznávání znaků) analyzuje tyto obrázky a převede je na skutečná textová data, čímž se z skenovaného dokumentu stane prohledávatelný, kopírovatelný a editovatelný PDF. dokk.ai OCR nástroj podporuje přes 100 jazyků včetně češtiny, angličtiny, němčiny, francouzštiny, španělštiny a mnoha dalších. Po OCR zpracování jsou do dokumentu vloženy dvě vrstvy: originální obrázek stránky (zachovávající přesnou vizuální podobu) a neviditelná textová vrstva (umožňující vyhledávání a kopírování). Výsledný soubor vypadá identicky jako originál, ale text je nyní přístupný. Pro dokumenty s špatnou kvalitou skenování nebo nestandardními fonty lze přizpůsobit parametry OCR: úrovně preprocessing, prahování kontrastu a jazyková přezdívka. Deskew (narovnávání nakřivo naskenovaných stránek) je automaticky aplikován kde je to potřeba. OCR vyžaduje zpracovací čas úměrný počtu stránek a složitosti dokumentu. Jednoduché jednojazyčné dokumenty jsou typicky zpracovány do 30 sekund na stránku.

Často kladené dotazy

Bezpečnost a soukromí

Soubory jsou nahrány přes TLS. Obsah dokumentu je zpracován výhradně pro OCR. Nahrané soubory i výstupní soubory jsou automaticky smazány po stažení.