Trang Chủ Cơ sở dữ liệu Khai thác dữ liệu là gì? - định nghĩa từ techopedia

Khai thác dữ liệu là gì? - định nghĩa từ techopedia

Mục lục:

Anonim

Định nghĩa - Khai thác dữ liệu có nghĩa là gì?

Khai thác dữ liệu là nơi dữ liệu được phân tích và thu thập thông tin để lấy thông tin liên quan từ các nguồn dữ liệu (như cơ sở dữ liệu) trong một mẫu cụ thể. Xử lý dữ liệu tiếp theo được thực hiện, bao gồm thêm siêu dữ liệu và tích hợp dữ liệu khác; một quá trình khác trong quy trình làm việc dữ liệu.

Phần lớn trích xuất dữ liệu đến từ các nguồn dữ liệu phi cấu trúc và các định dạng dữ liệu khác nhau. Dữ liệu phi cấu trúc này có thể ở bất kỳ dạng nào, chẳng hạn như bảng, chỉ mục và phân tích.

Techopedia giải thích khai thác dữ liệu

Dữ liệu trong kho có thể đến từ các nguồn khác nhau, kho dữ liệu yêu cầu ba phương pháp khác nhau để sử dụng dữ liệu đến. Các quy trình này được gọi là Khai thác, Chuyển đổi và Tải (ETL).

Quá trình trích xuất dữ liệu liên quan đến việc lấy dữ liệu từ các nguồn dữ liệu bị sai lệch. Các trích xuất dữ liệu sau đó được tải vào khu vực tổ chức của cơ sở dữ liệu quan hệ. Ở đây logic khai thác được sử dụng và hệ thống nguồn được truy vấn dữ liệu bằng các giao diện lập trình ứng dụng. Theo quy trình này, dữ liệu hiện đã sẵn sàng để trải qua giai đoạn chuyển đổi của quy trình ETL.

Khai thác dữ liệu là gì? - định nghĩa từ techopedia