Văn bản pháp quy

Thử nghiệm nhanh API:Run in Postman

1. Trích xuất thông tin Văn bản pháp quy với đầu vào URL của ảnh hoặc pdf

API:

MethodURL
GEThttps://demo.computervision.com.vn/api/v2/ocr/document/van_ban_phap_quy

Params:

KeyValueMô tả
imghttps://example.com/image.pngURL của ảnh hoặc pdf
format_typeurlLoại data truyền vào, nhận giá trị: url, file, base64
get_thumbtrue/falseTrả về ảnh của Văn bản pháp quy đã được căn chỉnh
get_sealtrue/falseTrả về ảnh con dấu được cắt

Demo Python:

import requests
api_key = "YOUR_API_KEY"
api_secret = "YOUR_API_SECRET"
image_url = 'https://example.com/image.png'
response = requests.get(
"https://demo.computervision.com.vn/api/v2/ocr/document/van_ban_phap_quy?img=%s&format_type=url&get_thumb=false"
% image_url,
auth=(api_key, api_secret))
print(response.json())

2. Trích xuất thông tin Văn bản pháp quy với đầu vào file ảnh hoặc file pdf

API:

MethodURLcontent-type
POSThttps://demo.computervision.com.vn/api/v2/ocr/document/van_ban_phap_quymultipart/form-data

Params:

KeyValueMô tả
format_typefileLoại data truyền vào, nhận giá trị: url, file, base64
get_thumbtrue/falseTrả về ảnh của Văn bản pháp quy đã được căn chỉnh
get_sealtrue/falseTrả về ảnh con dấu được cắt

Body:

KeyTypeValueMô tả
imgfileexample.jpgFile ảnh hoặc pdf của Văn bản pháp quy

Demo Python:

import requests
api_key = "YOUR_API_KEY"
api_secret = "YOUR_API_SECRET"
image_path = '/path/to/your/image.jpg'
response = requests.post(
"https://demo.computervision.com.vn/api/v2/ocr/document/van_ban_phap_quy?format_type=file&get_thumb=false",
auth=(api_key, api_secret),
files={'img': open(image_path, 'rb')})
print(response.json())

3. Trích xuất thông tin Văn bản pháp quy với đầu vào JSON

API:

MethodURLcontent-type
POSThttps://demo.computervision.com.vn/api/v2/ocr/document/van_ban_phap_quyapplication/json

Params:

KeyValueMô tả
format_typebase64Loại data truyền vào, nhận giá trị: url, file, base64
get_thumbtrue/falseTrả về ảnh của Văn bản pháp quy đã được căn chỉnh

Body:

{
"img": "iVBORw0KGgoAAAANSU..." // string base64 của ảnh hoặc pdf cần trích xuất
}

Demo Python:

import base64
import io
import requests
from PIL import Image
def get_byte_img(img):
img_byte_arr = io.BytesIO()
img.save(img_byte_arr, format='PNG')
encoded_img = base64.encodebytes(img_byte_arr.getvalue()).decode('ascii')
return encoded_img
api_key = "YOUR_API_KEY"
api_secret = "YOUR_API_SECRET"
img_name = "path_img"
encode_cmt = get_byte_img(Image.open(img_name))
response = requests.post(
"https://demo.computervision.com.vn/api/v2/ocr/document/van_ban_phap_quy?format_type=base64&get_thumb=false",
auth=(api_key, api_secret),
json={'img' : encode_cmt})
print(response.json())

4. Thông tin trả về

Thông tin trả về là một JSON với định dạng sau:

{
"data": {
"info": [xxxx],
"type": "van_ban_phap_quy"
},
"errorCode": string, // Mã lỗi
"errorMessage": string // Thông báo lỗi
}

info: Thông tin trích xuất được, bao gồm:

  • image: Là một list ảnh định dạng base64, mỗi ảnh là một trang văn bản đã được căn chỉnh. List ảnh này gồm 2 phần tử là trang đầu và trang cuối chứa dấu mộc.
  • ten_loai_van_ban: Loại văn bản pháp quy. Là một trong các loại: Báo Cáo, Chỉ Thị, Công Điện, Công Văn, Hướng Dẫn, Kế Hoạch, Nghị Định, Nghị Quyết, Quy Chế, Quy Định, Quyết Định, Thông Báo, Thông Tư, Tờ Trình.
  • ten_loai_van_ban_box: Tọa độ của trường ten_loai_van_ban là một list gồm [left, top, right, bottom].
  • ten_loai_van_ban_confidence: Độ tin cậy của trường ten_loai_van_ban.
  • ten_loai_van_ban_id: Thể hiện trường ten_loai_van_ban nằm ở ảnh thứ bao nhiêu trong trường image, bắt đầu từ 0.
  • trich_yeu: Thông tin trích yếu.
  • trich_yeu_box: Tọa độ trường trich_yeu là một list gồm [left, top, right, bottom].
  • trich_yeu_confidence: Độ tin cậy trường trich_yeu.
  • trich_yeu_id: Thể hiện trường trich_yeu nằm ở ảnh thứ bao nhiêu trong trường image, bắt đầu từ 0.
  • noi_nhan: Thông tin nơi nhận.
  • noi_nhan_box: Tọa độ trường noi_nhan là một list gồm [left, top, right, bottom].
  • noi_nhan_confidence: Độ tin cậy trường noi_nhan.
  • noi_nhan_id: Thể hiện trường noi_nhan nằm ở ảnh thứ bao nhiêu trong trường image, bắt đầu từ 0.
  • so_va_ky_hieu: Số và ký hiệu.
  • so_va_ky_hieu_box: Tọa độ trường so_va_ky_hieu là một list gồm [left, top, right, bottom].
  • so_va_ky_hieu_confidence: Độ tin cậy trường so_va_ky_hieu.
  • so_va_ky_hieu_id: Thể hiện trường so_va_ky_hieu nằm ở ảnh thứ bao nhiêu trong trường image, bắt đầu từ 0.
  • ngay_ban_hanh: Ngày ban hành.
  • ngay_ban_hanh_box: Tọa độ trường ngay_ban_hanh là một list gồm [left, top, right, bottom].
  • ngay_ban_hanh_confidence: Độ tin cậy trường ngay_ban_hanh.
  • ngay_ban_hanh_id: Thể hiện trường ngay_ban_hanh nằm ở ảnh thứ bao nhiêu trong trường image, bắt đầu từ 0.
  • co_quan_ban_hanh: Cơ quan ban hành.
  • co_quan_ban_hanh_box: Tọa độ trường co_quan_ban_hanh là một list gồm [left, top, right, bottom].
  • co_quan_ban_hanh_confidence: Độ tin cậy trường co_quan_ban_hanh.
  • co_quan_ban_hanh_id: Thể hiện trường co_quan_ban_hanh nằm ở ảnh thứ bao nhiêu trong trường image, bắt đầu từ 0.
  • co_quan_chu_quan: Cơ quan chủ quản.
  • co_quan_chu_quan_box: Tọa độ trường co_quan_chu_quan là một list gồm [left, top, right, bottom].
  • co_quan_chu_quan_confidence: Độ tin cậy trường co_quan_chu_quan.
  • co_quan_chu_quan_id: Thể hiện trường co_quan_chu_quan nằm ở ảnh thứ bao nhiêu trong trường image, bắt đầu từ 0.
  • thong_tin_nguoi_ki: Là một danh sách. Mỗi phần tử trong danh sách gồm các trường sau:
    • chuc_vu: Chức vụ của người ký.
    • chuc_vu_box: Tọa độ trường chuc_vu là một list gồm [left, top, right, bottom].
    • chuc_vu_confidence: Độ tin cậy trường chuc_vu.
    • chuc_vu_id: Thể hiện trường chuc_vu nằm ở ảnh thứ bao nhiêu trong trường image, bắt đầu từ 0.
    • nguoi_ki: Người ký văn bản pháp quy.
    • nguoi_ki_box: Tọa độ trường nguoi_ki là một list gồm [left, top, right, bottom].
    • nguoi_ki_confidence: Độ tin cậy trường nguoi_ki.
    • nguoi_ki_id: Thể hiện trường nguoi_ki nằm ở ảnh thứ bao nhiêu trong trường image, bắt đầu từ 0.
    • con_dau: Ảnh con dấu định dạng base64.

Bảng mã lỗi:

Mã lỗiMessageMô tả
0SuccessThành công
1Incorrect image formatẢnh bị lỗi
2Url is unavailableLink ảnh bị lỗi
3Incorrect image formatUpload ảnh bị lỗi khi dùng POST
4Incorrect api_key or api_secretapi_key hoặc api_secret sai
5Out of requestsHết số lượng requests hữu dụng
6Error when processing the requestLỗi khi xử lý request