OCR
متن را در اسکنها تشخیص دهید
Drop file here
PDF, Word, Excel, PowerPoint, images up to 25 MB
ویژگیهای کلیدی
- تشخیص متن مبتنی بر هوش مصنوعی با پشتیبانی از بیش از ۱۰۰ زبان، لایه متنی نامرئی که ظاهر بصری اصلی اسکنها را حفظ میکند، پردازش دقیق چیدمانهای پیچیده چندستونی و جداول، کار روی PDFهای اسکنشده و تصاویر (JPG و PNG و TIFF)، پردازش اسناد چندصفحهای در یک عملیات، فرمتهای خروجی متعدد — PDF قابل جستجو یا متن ساده استخراجشده، بهبود دسترسیپذیری — PDFهای قابل جستجو با صفحهخوانها کار میکنند، حالت رد متن از پردازش مجدد صفحاتی که از قبل متن دارند جلوگیری میکند، ترکیب با تصحیح کجی برای دقت بهتر روی اسکنهای کج، بدون واترمارک و بدون نیاز به ثبتنام، روی هر دستگاهی کار میکند — مرورگر دسکتاپ و تبلت و موبایل، رمزگذاری TLS و حذف خودکار فایل پس از پردازش
موارد استفاده
- قابل جستجو کردن قراردادهای اسکنشده برای یافتن بندها با کلمه کلیدی، دیجیتالی کردن بایگانیهای کاغذی در یک مخزن دیجیتال قابل جستجو، فعال کردن کپی-پیست از مقالات علمی و اسناد پژوهشی اسکنشده، در دسترس قرار دادن اسناد اسکنشده برای صفحهخوانها برای کاربران کمبینا، استخراج شماره فاکتور و تاریخ از فاکتورهای اسکنشده برای حسابداری، تبدیل یادداشتهای تختهسفید عکاسیشده به فایلهای مرجع قابل جستجو، پردازش فرمهای پذیرش بیمار اسکنشده برای ورود داده در بهداشت و درمان، آمادهسازی پروندههای حقوقی اسکنشده برای جستجوی متن کامل در مدیریت پرونده، تبدیل اسناد قدیمی ماشیننویسیشده به فرمت دیجیتال قابل جستجو، استخراج متن از کارتهای ویزیت و برگههای تماس اسکنشده
نحوه استفاده
- 1فایل PDF اسکنشده یا فایل تصویر (JPG، PNG، TIFF) خود را با کشیدن به ناحیه آپلود بارگذاری کنید
- 2زبان اصلی سند را انتخاب کنید — این به موتور OCR کمک میکند تا تشخیص کاراکتر را برای آن خط بهینه کند
- 3فرمت خروجی خود را انتخاب کنید: PDF قابل جستجو (لایه متنی پشت تصویر) یا استخراج متن ساده
- 4روی پردازش کلیک کنید — موتور OCR هر صفحه را تجزیه و تحلیل کرده و لایه متنی شناساییشده را جاسازی میکند
- 5PDF قابل جستجوی خود را دانلود کرده و نتایج را تأیید کنید — برای اطمینان از صحت تشخیص متن، یک کلمه کلیدی را جستجو کنید
یک قرارداد اسکنشده دارید و باید یک بند خاص پیدا کنید. یا انبوهی از رسیدهای عکاسیشده که نمیتوانید از آنها کپی-پیست کنید. یا اسناد کاغذی بایگانیشده که برای جستجو کاملاً نامرئی هستند. مشکل همیشه یکسان است: یک PDF اسکنشده فقط یک تصویر از متن است — نمیتوانید آن را جستجو، انتخاب یا دادهای از آن استخراج کنید. OCR (تشخیص نوری کاراکتر) این مشکل را با تبدیل اسناد مبتنی بر تصویر به فایلهای PDF کاملاً قابل جستجو، انتخاب و کپی حل میکند. ابزار OCR آنلاین رایگان dokk.ai این کار را در چند ثانیه و بدون نصب و ثبتنام انجام میدهد. موتور OCR ما از تشخیص پیشرفته مبتنی بر هوش مصنوعی استفاده میکند که بیش از ۱۰۰ زبان را پشتیبانی میکند، از جمله خطوط لاتین، سیریلیک، عربی، چینی، ژاپنی و کرهای. این موتور متن را حتی از اسکنهای با کیفیت پایین، اسناد ماشیننویسی محو شده، صفحات چندزبانه و اسناد با چیدمانهای پیچیده چندستونی به دقت شناسایی و رونویسی میکند. جداول، سرصفحهها، پاورقیها و شماره صفحات شناسایی شده و در لایه متنی به درستی قرار میگیرند. خروجی یک PDF قابل جستجو است که دقیقاً مانند اسکن اصلی به نظر میرسد. ظاهر بصری هر صفحه کاملاً حفظ میشود — موتور OCR به جای جایگزینی تصویر اسکنشده، یک لایه متنی نامرئی پشت آن اضافه میکند. این به معنای داشتن بهترین از هر دو دنیا است: ظاهر اصیل سند اصلی با تمام قابلیتهای متن دیجیتال. میتوانید کلمات کلیدی را جستجو کنید، پاراگرافها را انتخاب و کپی کنید، و از متن با صفحهخوانها و فناوریهای کمکی برای رعایت استانداردهای دسترسیپذیری استفاده کنید. OCR dokk.ai هم فایلهای PDF اسکنشده و هم تصاویر مستقل (JPG، PNG، TIFF) را پردازش میکند. میتوانید اسناد چندصفحهای را در یک عملیات پردازش کنید — یک کتاب اسکنشده ۲۰۰ صفحهای آپلود کنید و یک PDF کاملاً قابل جستجو دریافت کنید. برای بهترین نتایج، ابتدا ابزار تصحیح کجی را اجرا کنید تا صفحات کج را صاف کنید، که دقت OCR را در اسناد اسکنشده دستهای به طور قابل توجهی بهبود میبخشد. این ابزار همچنین چندین فرمت خروجی ارائه میدهد. PDF قابل جستجو را برای بایگانی و اشتراکگذاری نگه دارید، یا متن شناساییشده را به عنوان یک فایل متنی ساده برای پردازش بیشتر استخراج کنید. این برای جریانهای کاری استخراج داده بیارزش نیست — استخراج شماره فاکتور از فاکتورهای اسکنشده، استخراج نام از فرمها، یا تبدیل بایگانیهای کاغذی به دادههای دیجیتال ساختاریافته. dokk.ai روی هر دستگاه و سیستم عاملی کار میکند. OCR را روی ویندوز، مک، لینوکس یا موبایل اجرا کنید — تنها به یک مرورگر نیاز دارید. چیزی برای نصب وجود ندارد. فایلهای شما در حین انتقال رمزگذاری شده و پس از پردازش به طور خودکار حذف میشوند. ما هرگز اسناد شما را فراتر از زمان لازم برای انجام تشخیص نمیخوانیم یا ذخیره نمیکنیم.
سوالات متداول
امنیت و حریم خصوصی
فایلهای شما در طول آپلود و دانلود با رمزگذاری TLS محافظت میشوند. همه اسناد پس از اتمام پردازش OCR به طور خودکار از سرورهای ما حذف میشوند — ما هرگز فایلهای شما را ذخیره، مطالعه یا به اشتراک نمیگذاریم. موتور OCR در یک محیط ایزوله بدون دسترسی به دادههای سایر کاربران اجرا میشود. ثبتنام لازم نیست.