Mục lục:
Định nghĩa - Dữ liệu bán cấu trúc có nghĩa là gì?
Dữ liệu bán cấu trúc là dữ liệu không phải là dữ liệu thô, cũng không phải là dữ liệu được nhập trong hệ thống cơ sở dữ liệu thông thường. Nó là dữ liệu có cấu trúc, nhưng nó không được tổ chức theo mô hình hợp lý, như bảng hoặc biểu đồ dựa trên đối tượng. Rất nhiều dữ liệu được tìm thấy trên Web có thể được mô tả là bán cấu trúc. Tích hợp dữ liệu đặc biệt sử dụng dữ liệu bán cấu trúc.
Techopedia giải thích dữ liệu bán cấu trúc
Một số ví dụ về dữ liệu bán cấu trúc sẽ là các tệp BibTex hoặc tài liệu Ngôn ngữ đánh dấu tổng quát hóa tiêu chuẩn (SGML). Các tệp được cấu trúc bán có thể chứa dữ liệu hợp lý được tạo thành từ các bản ghi, nhưng dữ liệu đó có thể không được tổ chức theo cấu trúc dễ nhận biết. Một số trường có thể bị thiếu hoặc chứa thông tin không thể mô tả dễ dàng trong hệ thống cơ sở dữ liệu.
Trong dữ liệu bán cấu trúc, thông tin chứa trong dữ liệu thường được liên kết với lược đồ cơ sở dữ liệu. Đây là lý do tại sao thông tin đôi khi được gọi là tự mô tả.
