Mục lục:
Thách thức của việc quản lý và tận dụng dữ liệu lớn đến từ ba yếu tố, theo Doug Laney, phó chủ tịch nghiên cứu tại Gartner. Laney lần đầu tiên lưu ý hơn một thập kỷ trước rằng dữ liệu lớn gây ra vấn đề như vậy cho doanh nghiệp vì nó giới thiệu khối lượng, vận tốc và sự đa dạng khó quản lý. Vấn đề là, quá nhiều bộ phận CNTT ném mọi thứ họ có vào các vấn đề về khối lượng và vận tốc dữ liệu, quên mất việc giải quyết vấn đề cơ bản của sự đa dạng của dữ liệu.
Trở lại năm 2001, Laney đã viết rằng "các doanh nghiệp hàng đầu sẽ ngày càng sử dụng kho dữ liệu tập trung để xác định vốn từ vựng kinh doanh phổ biến giúp cải thiện sự hợp tác bên trong và bên ngoài." Vấn đề của từ vựng đó - và tính biến đổi khiến các công ty không tạo ra nó - vẫn là khía cạnh ít được giải quyết nhất của câu hỏi hóc búa dữ liệu lớn hiện nay. (Kiểm tra những gì các chuyên gia khác nói. Hãy xem các chuyên gia dữ liệu lớn để theo dõi trên Twitter.)
Ba Vs của dữ liệu lớn
Nhiều doanh nghiệp đã tìm thấy các phương pháp để khai thác khối lượng và tốc độ dữ liệu tăng lên. Facebook, ví dụ, có thể phân tích khối lượng dữ liệu khổng lồ. Tất nhiên, dữ liệu đó thường được trình bày nhiều lần trong cùng một tham số. Điều này đã thúc đẩy các đổi mới công nghệ như cơ sở dữ liệu cột, hiện đang được sử dụng rộng rãi bởi các công ty khác phải đối mặt với các cửa hàng tương tự của các mục dữ liệu tương tự.