Trích xuất hình ảnh
Lấy hình ảnh từ PDF
Drop file here
PDF, Word, Excel, PowerPoint, images up to 25 MB
Tính năng chính
- Trích xuất tất cả hình ảnh nhúng ở độ phân giải gốc
- Hỗ trợ định dạng JPEG
- JPEG 2000
- TIFF
- PNG và bitmap thô
- Không lấy mẫu lại hay mất chất lượng
- Đánh số thứ tự với vị trí trang trong tên file
- Chọn ảnh cụ thể hoặc tất cả cùng một lúc
- Tùy chọn chuyển đổi đầu ra sang JPG hoặc PNG
- Hỗ trợ lọc theo trang
- kích thước hoặc định dạng
- Tải về kho ZIP cho nhiều hình ảnh
- Hoạt động trên PDF gốc và PDF được quét
- Mã hóa TLS và tự động xóa
- Không giới hạn số lượng hình ảnh được trích xuất
Trường hợp sử dụng
- Trích xuất ảnh sản phẩm từ danh mục PDF của nhà cung cấp
- Khôi phục hình ảnh gốc từ PDF marketing đã nhận
- Lấy sơ đồ từ tài liệu kỹ thuật PDF
- Trích xuất biểu đồ từ báo cáo thường niên cho bài thuyết trình
- Lấy ảnh gốc từ PDF để tái sử dụng
- Trích xuất chữ ký hoặc con dấu từ tài liệu pháp lý được quét
- Lấy hình minh họa từ PDF sách điện tử để in ấn
- Trích xuất ảnh sản phẩm từ danh mục PDF cho cửa hàng thương mại điện tử
- Thu thập hình ảnh từ tài liệu đào tạo
- Trích xuất biểu đồ và đồ họa từ báo cáo khoa học
Cách sử dụng
- 1Tải lên file PDF của bạn. dokk.ai phân tích cấu trúc tài liệu và liệt kê tất cả tài nguyên hình ảnh nhúng trên tất cả các trang.
- 2Xem lại kho hình ảnh — số lượng, định dạng và kích thước ước tính. Chọn tất cả hình ảnh hoặc các hình ảnh cụ thể để trích xuất.
- 3Chọn định dạng đầu ra: giữ định dạng gốc, hoặc chuyển đổi tất cả sang JPG (với cài đặt chất lượng) hoặc PNG. Đối với hình ảnh chất lượng in, hãy dùng PNG hoặc giữ định dạng gốc.
- 4Nhấp vào Trích xuất hình ảnh. dokk.ai lấy từng hình ảnh từ luồng nội dung PDF ở độ phân giải gốc.
- 5Tải về kho lưu trữ ZIP chứa tất cả hình ảnh được trích xuất, được đặt tên theo trang và số thứ tự để dễ nhận dạng.
Bạn nhận được một file PDF chứa ảnh sản phẩm, biểu đồ, sơ đồ hoặc hình ảnh được quét — và bây giờ bạn cần các file ảnh thực sự. Mở PDF trong trình xem và chụp màn hình làm giảm độ phân giải và tạo ra các file mờ, vô dụng. Sao chép dán từ trình đọc PDF chụp lại hình ảnh được hiển thị trên màn hình ở độ phân giải màn hình — thường là 72-96 DPI, kém xa so với 300 DPI gốc. Công cụ trích xuất hình ảnh của dokk.ai trích xuất từng hình ảnh nhúng từ file PDF trực tiếp từ cấu trúc dữ liệu nội bộ, không cần hiển thị trang. Điều này có nghĩa là hình ảnh được trích xuất với chính xác cùng độ phân giải và định dạng mà chúng được nhúng vào ban đầu — không có nén-giải nén, không có lỗi lấy mẫu. Các định dạng nhúng được hỗ trợ bao gồm JPEG, JPEG 2000, TIFF, PNG và bitmap thô. Mỗi hình ảnh được trích xuất với cấu hình màu gốc của nó. Bạn có thể chọn giữ định dạng gốc hoặc chuyển đổi tất cả sang JPG hoặc PNG với cài đặt chất lượng có thể cấu hình. Mỗi hình ảnh được trích xuất được đặt tên theo số trang và thứ tự — ví dụ page-03-image-002.jpg — để bạn có thể truy vết từng hình ảnh về trang nguồn của nó. Công cụ hiển thị số lượng, định dạng và kích thước ước tính của tất cả hình ảnh nhúng trước khi trích xuất. Bạn có thể chọn tất cả hoặc chỉ các hình ảnh cụ thể từ danh sách. Các file PDF lớn với hàng trăm hình ảnh nhúng được xử lý giống như các file nhỏ. Tất cả hình ảnh được trích xuất được đóng gói vào kho lưu trữ ZIP để tải về. Các file PDF gốc được tải lên và hình ảnh được trích xuất sẽ tự động bị xóa sau một giờ. Không có nội dung nào được giữ lại hoặc sử dụng cho bất kỳ mục đích nào ngoài việc trích xuất theo yêu cầu.
Câu hỏi thường gặp
Bảo mật và quyền riêng tư
Các file PDF được truyền qua TLS và xử lý trên các máy chủ cách ly. Tất cả các file — PDF đầu vào và hình ảnh được trích xuất — đều tự động bị xóa sau một giờ. Không có nội dung nào được giữ lại hoặc sử dụng cho bất kỳ mục đích nào ngoài việc trích xuất theo yêu cầu.