PDF sang Excel
Trích xuất bảng sang .xlsx
Drop file here
PDF, Word, Excel, PowerPoint, images up to 25 MB
Tính năng chính
- Chuyển bảng biểu PDF sang trang tính XLSX có thể chỉnh sửa
- Phát hiện bảng cấu trúc giữ nguyên hàng và cột
- Hỗ trợ tiêu đề nhiều hàng và ô được gộp
- Phát hiện định dạng số (tiền tệ
- phần trăm
- số thập phân)
- Nhiều bảng được xuất ra các trang tính XLSX riêng
- OCR cho PDF từ bản scan có bảng in
- Hỗ trợ hơn 40 ngôn ngữ OCR
- Hỗ trợ bảng có đường kẻ và tiêu đề có bóng
- Xử lý tệp lên đến 100 MB
- Thường hoàn thành trong vòng dưới 20 giây
- Không có hình mờ
- Không cần tài khoản hay đăng ký
- Tự động xóa tệp sau khi xử lý
Trường hợp sử dụng
- Trích xuất dữ liệu tài chính từ báo cáo thường niên PDF sang Excel để phân tích và lập biểu đồ
- Chuyển bảng thống kê PDF của chính phủ sang XLSX để xử lý tiếp
- Lấy dữ liệu tồn kho từ bảng giá nhà cung cấp PDF sang bảng tính
- Trích xuất các mục hóa đơn từ lô PDF hóa đơn để đối chiếu kế toán
- Chuyển bảng báo cáo in đã scan sang Excel qua OCR để phân tích dữ liệu
- Trích xuất bảng điểm từ bảng điểm học thuật PDF sang Excel để tính GPA
Cách sử dụng
- 1Nhấp Tải lên PDF hoặc kéo và thả tệp của bạn. Hỗ trợ PDF có bảng biểu — cả dựa trên văn bản và bản scan — lên đến 100 MB.
- 2Nếu PDF của bạn là bản scan, hãy chọn ngôn ngữ tài liệu để tối ưu hóa độ chính xác OCR cho nội dung bảng.
- 3Nhấp Chuyển sang Excel. Công cụ phát hiện tất cả bảng trong tài liệu và ánh xạ chúng sang cấu trúc bảng tính.
- 4Chờ xử lý, thường dưới 20 giây. Mỗi bảng được phát hiện sẽ được đặt trên một trang tính riêng trong tệp XLSX đầu ra.
- 5Tải xuống tệp XLSX và mở trong Microsoft Excel, LibreOffice Calc hoặc Google Sheets. Tệp đã tải lên sẽ tự động bị xóa sau khi phiên kết thúc.
Dữ liệu tài chính nằm trong báo cáo PDF. Bảng thống kê chỉ tồn tại dưới dạng PDF. Bảng giá của nhà cung cấp được gửi dưới dạng PDF. Công cụ chuyển PDF sang Excel của dokk.ai trích xuất bảng biểu và ánh xạ chúng sang cấu trúc bảng tính có thể chỉnh sửa — không cần nhập liệu thủ công. Công cụ phân tích cấu trúc phát hiện ranh giới cột dựa trên vị trí không gian của văn bản trong PDF, không chỉ từ đường kẻ. Điều này có nghĩa là nó tách cột chính xác ngay cả trong các bảng sử dụng khoảng trắng thay vì đường kẻ để phân tách dữ liệu. Mỗi bảng được phát hiện được đặt trên một trang tính riêng trong sổ làm việc XLSX. Công cụ OCR hỗ trợ hơn 40 ngôn ngữ cho các bảng in được scan. Công cụ chuyển PDF sang Excel của dokk.ai sử dụng công cụ phân tích cấu trúc phát hiện ranh giới bảng, căn chỉnh cột và nhóm hàng — thay vì xử lý các ô bảng như các khối văn bản độc lập. Với PDF từ bản scan có bảng biểu được chụp ảnh, OCR được áp dụng tự động trước khi trích xuất bảng. Công cụ OCR hỗ trợ hơn 40 ngôn ngữ. Công cụ trích xuất tất cả bảng sang các trang tính Excel riêng — một trang tính mỗi bảng. Bạn cũng có thể chọn trích xuất tất cả bảng vào một trang tính. Với tài liệu có cả bảng biểu và văn bản liên tục, công cụ PDF sang Word có thể là điểm khởi đầu tốt hơn. TLS và tự động xóa.
Câu hỏi thường gặp
Bảo mật và quyền riêng tư
Tất cả tệp tải lên được mã hóa qua TLS 1.3. Tệp được xử lý trong các phiên riêng biệt và bị xóa vĩnh viễn khỏi máy chủ sau khi phiên tải xuống kết thúc, thường trong vòng 30 phút. Dokk.ai không đọc, không lập chỉ mục và không lưu trữ nội dung tài liệu. Không yêu cầu tài khoản và không thu thập dữ liệu cá nhân ngoài những gì cần thiết cho phiên. Dịch vụ tuân thủ GDPR.