Mục lục:
Định nghĩa - Data Lake có nghĩa là gì?
Hồ dữ liệu là một kho lưu trữ tập trung lớn, dễ truy cập, tập trung gồm khối lượng lớn dữ liệu có cấu trúc và không cấu trúc.Techopedia giải thích Hồ dữ liệu
Kiến trúc hồ dữ liệu là một cách tiếp cận tất cả mọi thứ đối với dữ liệu lớn. Dữ liệu không được phân loại khi chúng được lưu trữ trong kho lưu trữ, vì giá trị của dữ liệu không rõ ràng ngay từ đầu. Kết quả là, chuẩn bị dữ liệu được loại bỏ. Do đó, một hồ dữ liệu ít cấu trúc hơn so với kho dữ liệu thông thường. Khi dữ liệu được truy cập, chỉ sau đó chúng được phân loại, tổ chức hoặc phân tích.
Hadoop, một khung nguồn mở để xử lý và phân tích dữ liệu lớn, có thể được sử dụng để sàng lọc dữ liệu trong kho lưu trữ.