Mục lục:
Định nghĩa - Dữ liệu phi cấu trúc có nghĩa là gì?
Dữ liệu phi cấu trúc đại diện cho bất kỳ dữ liệu nào không có cấu trúc dễ nhận biết. Nó không có tổ chức và thô và có thể không phải là văn bản hoặc văn bản. Ví dụ, email là một minh họa tốt cho dữ liệu văn bản phi cấu trúc. Nó bao gồm thời gian, ngày tháng, chi tiết người nhận và người gửi và chủ đề, v.v., nhưng một cơ thể email vẫn không có cấu trúc. Dữ liệu phi cấu trúc cũng có thể được xác định là dữ liệu có cấu trúc lỏng lẻo, trong đó các nguồn dữ liệu bao gồm một cấu trúc, nhưng không phải tất cả dữ liệu trong một tập dữ liệu đều theo cùng một cấu trúc.
Trong các doanh nghiệp lấy khách hàng làm trung tâm, dữ liệu được tìm thấy ở dạng không có cấu trúc có thể được kiểm tra để tăng cường tiếp thị mối quan hệ và quản lý quan hệ khách hàng (CRM). Khi các ứng dụng truyền thông xã hội, chẳng hạn như Facebook và Twitter, phát triển dữ liệu chính thống, không có cấu trúc có khả năng vượt xa tiến trình của dữ liệu có cấu trúc.
Techopedia giải thích dữ liệu phi cấu trúc
Dữ liệu phi cấu trúc đề cập đến dữ liệu theo một biểu mẫu ít được sắp xếp hơn các mục như trang bảng tính, bảng cơ sở dữ liệu hoặc các tập dữ liệu tuyến tính hoặc theo thứ tự khác. Trên thực tế, thuật ngữ "tập dữ liệu" rất hữu ích vì nó được liên kết với dữ liệu trong các mảng gọn gàng, có thể truy cập, không có bất kỳ nội dung bổ sung nào và được liên kết hoặc gắn thẻ trong một cấu trúc cụ thể.
Các trường hợp khác của dữ liệu văn bản phi cấu trúc bao gồm tài liệu Word, thuyết trình PowerPoint, tin nhắn tức thời, phần mềm cộng tác, tài liệu, sách, bài đăng trên phương tiện truyền thông xã hội và hồ sơ y tế. Dữ liệu phi cấu trúc phi văn bản thường được tạo trong phương tiện, chẳng hạn như tệp âm thanh MP3, hình ảnh JPEG và tệp video Flash, v.v.
Dữ liệu phi cấu trúc thường không bao gồm mô hình dữ liệu được xác định trước và nó có thể không khớp với các bảng quan hệ. Dữ liệu phi cấu trúc thường là văn bản nặng. Tuy nhiên, nó có thể bao gồm số và ngày, cũng như sự thật. Điều này dẫn đến sự mơ hồ khó xác định bằng các chương trình phần mềm thông thường.
Việc lưu trữ khối lượng lớn dữ liệu phi cấu trúc được tạo ra trong một doanh nghiệp, nếu được quản lý kém, có thể dẫn đến chi phí cao hơn. Dữ liệu trong các tài liệu sao chép cứng hoặc ở định dạng điện tử phải được quét để ứng dụng tìm kiếm phân tích các ý tưởng, tùy thuộc vào các từ được sử dụng trong các ngữ cảnh nhất định. Điều này được gọi là tìm kiếm doanh nghiệp hoặc ngữ nghĩa.
