Trong lịch sử, các nhà phân tích dữ liệu có khả năng giải mã và trích xuất thông tin từ chỉ một loại dữ liệu: dữ liệu có cấu trúc. Loại dữ liệu này có thể dễ dàng tìm kiếm vì các mẫu rõ ràng, nhưng chiếm một tỷ lệ nhỏ trong tổng số dữ liệu có sẵn.
Dữ liệu phi cấu trúc bao gồm video, âm thanh, email và dữ liệu đến từ phương tiện truyền thông xã hội và thiết bị di động. Đó là, bàn tay, dự trữ thông tin thô lớn nhất hiện có, nhưng không ai có thể khai thác tài nguyên này một cách đáng tin cậy.
Tuy nhiên, mọi thứ đã thay đổi khi khả năng lưu trữ và khả năng xử lý vượt trội tăng lên đã tạo ra các phân tích dữ liệu phi cấu trúc - một dạng công nghệ mới, và do đó chưa trưởng thành. Trí tuệ kinh doanh tốt hơn đang tận dụng tối đa cơ hội này và các khoản đầu tư đáng kể đang được thực hiện để tổng hợp các phân tích dữ liệu có cấu trúc và không cấu trúc để truy cập vào kho thông tin rõ ràng vô tận này.