Přesnost závisí na kvalitě skenování, fontu a kontrastu. Pro čisté skenování v rozlišení 300 DPI jsou moderní OCR enginy přesné na 99%+ pro standardní tištěné fonty.

Je podporována čeština?

Ano. Čeština je plně podporována včetně diakritiky. Vyberte Češtinu jako primární jazyk pro nejlepší výsledky.

Mohu provést OCR na vícestránkovém dokumentu?

Ano. OCR je aplikován na každou stránku dokumentu. Zpracovací čas je úměrný počtu stránek.

Bude originální vzhled dokumentu změněn?

Ne. OCR přidá neviditelnou textovou vrstvu pod originální obrázek stránky. Dokument vypadá identicky jako originál.

Mohu provést OCR na fotografii z telefonu?

Ano. JPG a PNG obrázky jsou akceptovány. Pro nejlepší výsledky fotografie musí mít dostatečné osvětlení, minimální deformaci perspektivy a jasný text.

Co se stane pokud dokument obsahuje text v více jazycích?

Vyberte primární jazyk. Mnoho OCR motorů zvládá vícejyčné dokumenty ale nejvyšší přesnosti je dosaženo pro nastavený primární jazyk.

Jsou tabulky a speciální formátování zpracovány správně?

Jednoduchá tabulková struktura je typicky rozpoznána. Složitá rozvržení mohou vyžadovat manuální úpravu extrahovaného textu.

Mohu vybrat konkrétní stránky pro OCR?

Nejprve extrahujte požadované stránky pomocí nástroje Extrahovat stránky a poté spusťte OCR na extrahovaném souboru.

Jsou anotace zachovány po OCR?

Ano. Anotace v originálním PDF jsou zachovány a přidány po OCR zpracování.

Jak mohu ověřit přesnost OCR?

Po zpracování otevřete výstupní PDF a zkuste vybrat text nebo použít Ctrl+F pro vyhledávání. Vizuální shoda s originálním textem potvrdí přesnost.

Všechny nástroje

OCR

Rozpoznat text ve skenech

1Nahrát

2Nastavit

3Zpracovat

Drop file here

PDF, Word, Excel, PowerPoint, images up to 25 MB

Klíčové funkce

Podpora přes 100 jazyků
Zachovává originální obrázek stránky
Přidává neviditelnou textovou vrstvu pro vyhledávání
Automatické deskew preprocessing
Výsledek je prohledávatelný PDF
Vícestránkové dokumenty
Volitelná rekognoskace layoutu
Žádná registrace
Automatické smazání souborů

Případy použití

Konverze skenovaných smluv na prohledávatelné dokumenty
Digitalizace archivovaných papírových záznamů
OCR na naskenovaných účtenách pro účetnictví
Příprava skenovaných zpráv pro vyhledávání fulltextem
Digitalizace historických dokumentů pro archivaci
Konverze faxem přijatých PDF na editovatelné dokumenty

Jak používat

1Nahrajte skenovaný PDF nebo obrázek (JPG, PNG, TIFF) přetažením nebo kliknutím pro výběr.
2Vyberte primární jazyk dokumentu pro nejlepší OCR přesnost.
3Klikněte na Spustit OCR.
4Počkejte na zpracování — čas závisí na počtu stránek.
5Stáhněte prohledávatelný PDF soubor.

Skenované dokumenty jsou obrázky PDF — grafické snímky fyzických stránek. Text v nich vypadá jako text ale ve skutečnosti jsou to pixely. Nemůžete jej kopírovat, vyhledávat v něm ani editovat. OCR (optické rozpoznávání znaků) analyzuje tyto obrázky a převede je na skutečná textová data, čímž se z skenovaného dokumentu stane prohledávatelný, kopírovatelný a editovatelný PDF. dokk.ai OCR nástroj podporuje přes 100 jazyků včetně češtiny, angličtiny, němčiny, francouzštiny, španělštiny a mnoha dalších. Po OCR zpracování jsou do dokumentu vloženy dvě vrstvy: originální obrázek stránky (zachovávající přesnou vizuální podobu) a neviditelná textová vrstva (umožňující vyhledávání a kopírování). Výsledný soubor vypadá identicky jako originál, ale text je nyní přístupný. Pro dokumenty s špatnou kvalitou skenování nebo nestandardními fonty lze přizpůsobit parametry OCR: úrovně preprocessing, prahování kontrastu a jazyková přezdívka. Deskew (narovnávání nakřivo naskenovaných stránek) je automaticky aplikován kde je to potřeba. OCR vyžaduje zpracovací čas úměrný počtu stránek a složitosti dokumentu. Jednoduché jednojazyčné dokumenty jsou typicky zpracovány do 30 sekund na stránku.

Často kladené dotazy

Bezpečnost a soukromí

Soubory jsou nahrány přes TLS. Obsah dokumentu je zpracován výhradně pro OCR. Nahrané soubory i výstupní soubory jsou automaticky smazány po stažení.