OCR
Rozpoznat text ve skenech
Drop file here
PDF, Word, Excel, PowerPoint, images up to 25 MB
Klíčové funkce
- Podpora přes 100 jazyků
- Zachovává originální obrázek stránky
- Přidává neviditelnou textovou vrstvu pro vyhledávání
- Automatické deskew preprocessing
- Výsledek je prohledávatelný PDF
- Vícestránkové dokumenty
- Volitelná rekognoskace layoutu
- Žádná registrace
- Automatické smazání souborů
Případy použití
- Konverze skenovaných smluv na prohledávatelné dokumenty
- Digitalizace archivovaných papírových záznamů
- OCR na naskenovaných účtenách pro účetnictví
- Příprava skenovaných zpráv pro vyhledávání fulltextem
- Digitalizace historických dokumentů pro archivaci
- Konverze faxem přijatých PDF na editovatelné dokumenty
Jak používat
- 1Nahrajte skenovaný PDF nebo obrázek (JPG, PNG, TIFF) přetažením nebo kliknutím pro výběr.
- 2Vyberte primární jazyk dokumentu pro nejlepší OCR přesnost.
- 3Klikněte na Spustit OCR.
- 4Počkejte na zpracování — čas závisí na počtu stránek.
- 5Stáhněte prohledávatelný PDF soubor.
Skenované dokumenty jsou obrázky PDF — grafické snímky fyzických stránek. Text v nich vypadá jako text ale ve skutečnosti jsou to pixely. Nemůžete jej kopírovat, vyhledávat v něm ani editovat. OCR (optické rozpoznávání znaků) analyzuje tyto obrázky a převede je na skutečná textová data, čímž se z skenovaného dokumentu stane prohledávatelný, kopírovatelný a editovatelný PDF. dokk.ai OCR nástroj podporuje přes 100 jazyků včetně češtiny, angličtiny, němčiny, francouzštiny, španělštiny a mnoha dalších. Po OCR zpracování jsou do dokumentu vloženy dvě vrstvy: originální obrázek stránky (zachovávající přesnou vizuální podobu) a neviditelná textová vrstva (umožňující vyhledávání a kopírování). Výsledný soubor vypadá identicky jako originál, ale text je nyní přístupný. Pro dokumenty s špatnou kvalitou skenování nebo nestandardními fonty lze přizpůsobit parametry OCR: úrovně preprocessing, prahování kontrastu a jazyková přezdívka. Deskew (narovnávání nakřivo naskenovaných stránek) je automaticky aplikován kde je to potřeba. OCR vyžaduje zpracovací čas úměrný počtu stránek a složitosti dokumentu. Jednoduché jednojazyčné dokumenty jsou typicky zpracovány do 30 sekund na stránku.
Často kladené dotazy
Bezpečnost a soukromí
Soubory jsou nahrány přes TLS. Obsah dokumentu je zpracován výhradně pro OCR. Nahrané soubory i výstupní soubory jsou automaticky smazány po stažení.