Mục lục:
Trong bài đăng của tôi, Phân tích Hadoop: Không dễ dàng qua nhiều nguồn dữ liệu, tôi đã thảo luận về các vấn đề mà các tổ chức gặp phải khi cố gắng sử dụng Hadoop để lưu trữ và phân tích dữ liệu từ nhiều nguồn nội bộ. Trong bài đăng này, tôi sẽ nói về những thách thức và lợi ích của việc thêm dữ liệu ngoài vào hỗn hợp.
Thêm dữ liệu ngoài cải thiện phân tích dự đoán
Các tổ chức ngày càng muốn phân tích dữ liệu của bên thứ ba vì các nguồn này tăng khả năng hiển thị của họ vào thị trường rộng lớn hơn, giúp họ dự đoán các hành động trong tương lai và tạo thêm doanh số bán hàng. Phân tích dữ liệu nội bộ một mình cung cấp quan điểm lịch sử về khách hàng và mua hàng của họ, rất hữu ích cho xu hướng và phân tích mẫu, nhưng có giá trị dự đoán hạn chế. Những nguồn nội bộ này cung cấp dữ liệu thường được gọi là các chỉ số tụt hậu vì chúng theo dõi các sự kiện trong quá khứ. Mặc dù các chỉ báo độ trễ có thể xác nhận một mô hình đang xảy ra hoặc sắp xảy ra, nhưng chúng không thể dễ dàng dự đoán những gì sẽ xảy ra hoặc phát hiện sự thay đổi trên thị trường.
Các tổ chức muốn kết hợp các chỉ số thị trường hàng đầu từ các nguồn bên ngoài với dữ liệu lịch sử nội bộ và thông tin kênh bán hàng. Sự kết hợp này cung cấp cho họ những hiểu biết tốt hơn về mô hình và xu hướng, đồng thời giúp cải thiện sự tự tin của họ đối với các mô hình dự đoán mà họ đang tận dụng cho các chương trình bán hàng và tiếp thị, phát hiện gian lận, phân tích rủi ro và hơn thế nữa.