Trang Chủ Trên bản tin tức Dữ liệu lộn xộn là gì? - định nghĩa từ techopedia

Dữ liệu lộn xộn là gì? - định nghĩa từ techopedia

Mục lục:

Anonim

Định nghĩa - Data Wrangling có nghĩa là gì?

Sắp xếp dữ liệu là một kiểu quản lý dữ liệu cụ thể phát sinh từ các khả năng phần mềm mới giới thiệu các tập dữ liệu lớn, lộn xộn và đa dạng cần đi vào kiến ​​trúc hướng dịch vụ (SOA) cho mục đích phân tích và sử dụng. Việc sắp xếp dữ liệu thường liên quan đến nhiều kỹ thuật tinh vi khác nhau để xử lý dữ liệu không thường xuyên hoặc đa dạng và thao tác dữ liệu cho các trường hợp sử dụng kinh doanh.

Techopedia giải thích về sự thay đổi dữ liệu

Nghe có vẻ giống như một thuật ngữ không chính thức, nhưng việc sắp xếp dữ liệu thực sự chiếm một không gian cụ thể trong quản lý dữ liệu. Một cách hữu ích để hiểu sự thay đổi dữ liệu là đối chiếu nó với phương pháp trích xuất, biến đổi và tải (ETL) thường chính thức hơn. Sắp xếp dữ liệu có các khía cạnh và trường hợp sử dụng khác nhau so với ETL. Nó thường được thực hiện bởi các nhà khoa học dữ liệu lành nghề hoặc những người khác gần với đường ống. Theo một số cách, việc sắp xếp dữ liệu có thể được gọi là một loại ETL "nguồn mở" trong đó các kỹ sư xử lý dữ liệu có thể "thực hành" hơn hoặc sử dụng các phương pháp trích xuất thủ công hơn.

Đối với những người thực sự hiểu các quy trình tinh chế mà dữ liệu đa dạng bị loại bỏ, sắp xếp và đưa vào kiến ​​trúc doanh nghiệp, việc sắp xếp dữ liệu thực sự là một chủ đề rất quan trọng. Các chuyên gia CNTT nhìn vào một loạt các công cụ, tài nguyên và kỹ thuật để mang lại giá trị từ dữ liệu lộn xộn, thô hoặc không có cấu trúc.

Dữ liệu lộn xộn là gì? - định nghĩa từ techopedia