Văn bản pháp quy
1. Trích xuất thông tin Văn bản pháp quy với đầu vào URL của ảnh hoặc pdf
API:
| Method | URL |
|---|---|
| GET | https://demo.computervision.com.vn/api/v2/ocr/document/van_ban_phap_quy |
Params:
| Key | Value | Mô tả |
|---|---|---|
img | https://example.com/image.png | URL của ảnh hoặc pdf |
format_type | url | Loại data truyền vào, nhận giá trị: url, file, base64 |
get_thumb | true/false | Trả về ảnh của Văn bản pháp quy đã được căn chỉnh |
get_seal | true/false | Trả về ảnh con dấu được cắt |
Demo Python:
import requestsapi_key = "YOUR_API_KEY"api_secret = "YOUR_API_SECRET"image_url = 'https://example.com/image.png'response = requests.get("https://demo.computervision.com.vn/api/v2/ocr/document/van_ban_phap_quy?img=%s&format_type=url&get_thumb=false"% image_url,auth=(api_key, api_secret))print(response.json())
2. Trích xuất thông tin Văn bản pháp quy với đầu vào file ảnh hoặc file pdf
API:
| Method | URL | content-type |
|---|---|---|
| POST | https://demo.computervision.com.vn/api/v2/ocr/document/van_ban_phap_quy | multipart/form-data |
Params:
| Key | Value | Mô tả |
|---|---|---|
format_type | file | Loại data truyền vào, nhận giá trị: url, file, base64 |
get_thumb | true/false | Trả về ảnh của Văn bản pháp quy đã được căn chỉnh |
get_seal | true/false | Trả về ảnh con dấu được cắt |
Body:
| Key | Type | Value | Mô tả |
|---|---|---|---|
img | file | example.jpg | File ảnh hoặc pdf của Văn bản pháp quy |
Demo Python:
import requestsapi_key = "YOUR_API_KEY"api_secret = "YOUR_API_SECRET"image_path = '/path/to/your/image.jpg'response = requests.post("https://demo.computervision.com.vn/api/v2/ocr/document/van_ban_phap_quy?format_type=file&get_thumb=false",auth=(api_key, api_secret),files={'img': open(image_path, 'rb')})print(response.json())
3. Trích xuất thông tin Văn bản pháp quy với đầu vào JSON
API:
| Method | URL | content-type |
|---|---|---|
| POST | https://demo.computervision.com.vn/api/v2/ocr/document/van_ban_phap_quy | application/json |
Params:
| Key | Value | Mô tả |
|---|---|---|
format_type | base64 | Loại data truyền vào, nhận giá trị: url, file, base64 |
get_thumb | true/false | Trả về ảnh của Văn bản pháp quy đã được căn chỉnh |
Body:
{"img": "iVBORw0KGgoAAAANSU..." // string base64 của ảnh hoặc pdf cần trích xuất}
Demo Python:
import base64import ioimport requestsfrom PIL import Imagedef get_byte_img(img):img_byte_arr = io.BytesIO()img.save(img_byte_arr, format='PNG')encoded_img = base64.encodebytes(img_byte_arr.getvalue()).decode('ascii')return encoded_imgapi_key = "YOUR_API_KEY"api_secret = "YOUR_API_SECRET"img_name = "path_img"encode_cmt = get_byte_img(Image.open(img_name))response = requests.post("https://demo.computervision.com.vn/api/v2/ocr/document/van_ban_phap_quy?format_type=base64&get_thumb=false",auth=(api_key, api_secret),json={'img' : encode_cmt})print(response.json())
4. Thông tin trả về
Thông tin trả về là một JSON với định dạng sau:
{"data": {"info": [xxxx],"type": "van_ban_phap_quy"},"errorCode": string, // Mã lỗi"errorMessage": string // Thông báo lỗi}
info: Thông tin trích xuất được, bao gồm:
image: Là một list ảnh định dạng base64, mỗi ảnh là một trang văn bản đã được căn chỉnh. List ảnh này gồm 2 phần tử là trang đầu và trang cuối chứa dấu mộc.ten_loai_van_ban: Loại văn bản pháp quy. Là một trong các loại: Báo Cáo, Chỉ Thị, Công Điện, Công Văn, Hướng Dẫn, Kế Hoạch, Nghị Định, Nghị Quyết, Quy Chế, Quy Định, Quyết Định, Thông Báo, Thông Tư, Tờ Trình.ten_loai_van_ban_box: Tọa độ của trườngten_loai_van_banlà một list gồm [left, top, right, bottom].ten_loai_van_ban_confidence: Độ tin cậy của trườngten_loai_van_ban.ten_loai_van_ban_id: Thể hiện trườngten_loai_van_bannằm ở ảnh thứ bao nhiêu trong trườngimage, bắt đầu từ 0.trich_yeu: Thông tin trích yếu.trich_yeu_box: Tọa độ trườngtrich_yeulà một list gồm [left, top, right, bottom].trich_yeu_confidence: Độ tin cậy trườngtrich_yeu.trich_yeu_id: Thể hiện trườngtrich_yeunằm ở ảnh thứ bao nhiêu trong trườngimage, bắt đầu từ 0.noi_nhan: Thông tin nơi nhận.noi_nhan_box: Tọa độ trườngnoi_nhanlà một list gồm [left, top, right, bottom].noi_nhan_confidence: Độ tin cậy trườngnoi_nhan.noi_nhan_id: Thể hiện trườngnoi_nhannằm ở ảnh thứ bao nhiêu trong trườngimage, bắt đầu từ 0.so_va_ky_hieu: Số và ký hiệu.so_va_ky_hieu_box: Tọa độ trườngso_va_ky_hieulà một list gồm [left, top, right, bottom].so_va_ky_hieu_confidence: Độ tin cậy trườngso_va_ky_hieu.so_va_ky_hieu_id: Thể hiện trườngso_va_ky_hieunằm ở ảnh thứ bao nhiêu trong trườngimage, bắt đầu từ 0.ngay_ban_hanh: Ngày ban hành.ngay_ban_hanh_box: Tọa độ trườngngay_ban_hanhlà một list gồm [left, top, right, bottom].ngay_ban_hanh_confidence: Độ tin cậy trườngngay_ban_hanh.ngay_ban_hanh_id: Thể hiện trườngngay_ban_hanhnằm ở ảnh thứ bao nhiêu trong trườngimage, bắt đầu từ 0.co_quan_ban_hanh: Cơ quan ban hành.co_quan_ban_hanh_box: Tọa độ trườngco_quan_ban_hanhlà một list gồm [left, top, right, bottom].co_quan_ban_hanh_confidence: Độ tin cậy trườngco_quan_ban_hanh.co_quan_ban_hanh_id: Thể hiện trườngco_quan_ban_hanhnằm ở ảnh thứ bao nhiêu trong trườngimage, bắt đầu từ 0.co_quan_chu_quan: Cơ quan chủ quản.co_quan_chu_quan_box: Tọa độ trườngco_quan_chu_quanlà một list gồm [left, top, right, bottom].co_quan_chu_quan_confidence: Độ tin cậy trườngco_quan_chu_quan.co_quan_chu_quan_id: Thể hiện trườngco_quan_chu_quannằm ở ảnh thứ bao nhiêu trong trườngimage, bắt đầu từ 0.thong_tin_nguoi_ki: Là một danh sách. Mỗi phần tử trong danh sách gồm các trường sau:chuc_vu: Chức vụ của người ký.chuc_vu_box: Tọa độ trườngchuc_vulà một list gồm [left, top, right, bottom].chuc_vu_confidence: Độ tin cậy trườngchuc_vu.chuc_vu_id: Thể hiện trườngchuc_vunằm ở ảnh thứ bao nhiêu trong trườngimage, bắt đầu từ 0.nguoi_ki: Người ký văn bản pháp quy.nguoi_ki_box: Tọa độ trườngnguoi_kilà một list gồm [left, top, right, bottom].nguoi_ki_confidence: Độ tin cậy trườngnguoi_ki.nguoi_ki_id: Thể hiện trườngnguoi_kinằm ở ảnh thứ bao nhiêu trong trườngimage, bắt đầu từ 0.con_dau: Ảnh con dấu định dạng base64.
Bảng mã lỗi:
| Mã lỗi | Message | Mô tả |
|---|---|---|
| 0 | Success | Thành công |
| 1 | Incorrect image format | Ảnh bị lỗi |
| 2 | Url is unavailable | Link ảnh bị lỗi |
| 3 | Incorrect image format | Upload ảnh bị lỗi khi dùng POST |
| 4 | Incorrect api_key or api_secret | api_key hoặc api_secret sai |
| 5 | Out of requests | Hết số lượng requests hữu dụng |
| 6 | Error when processing the request | Lỗi khi xử lý request |