Trang Chủ Âm thanh Dữ liệu không nhãn là gì? - định nghĩa từ techopedia

Dữ liệu không nhãn là gì? - định nghĩa từ techopedia

Mục lục:

Anonim

Định nghĩa - Dữ liệu không nhãn có nghĩa là gì?

Dữ liệu không được gắn nhãn là một chỉ định cho các phần dữ liệu chưa được gắn thẻ với các nhãn xác định các đặc điểm, thuộc tính hoặc phân loại. Dữ liệu không nhãn thường được sử dụng trong các hình thức học máy khác nhau.

Techopedia giải thích dữ liệu không nhãn

Trong các loại học máy được gọi là học máy không giám sát, chương trình học máy hoạt động bằng cách đánh giá các bộ dữ liệu chưa được gắn nhãn. Vì dữ liệu không có nhãn, chương trình máy học phải xác định từng phần dữ liệu trên các thuộc tính và đặc tính của nó.

Một trong những cách tốt nhất để giải thích điều này là bằng cách sử dụng phép ẩn dụ bát trái cây. Giả sử chương trình học máy đang học để xác định ba loại trái cây khác nhau - chuối, nho và táo. Nếu dữ liệu trong tập huấn luyện ban đầu được dán nhãn, chương trình máy học sẽ hoạt động theo quan điểm đó - khớp các hình ảnh liên tiếp với một trong ba loại đó.

Tuy nhiên, nếu không có phần dữ liệu nào được dán nhãn bằng ba tên trái cây - chuối, nho và táo - chương trình học máy sẽ cần phải hoạt động bằng cách đánh giá từng hình ảnh và xem xét các đặc điểm như màu sắc - vàng, đỏ hoặc tím - dài và mỏng, tròn hoặc co cụm - và các đặc điểm khác.

Từ ví dụ này, thật dễ dàng để thấy cách dữ liệu được gắn nhãn mang lại cơ hội dễ dàng hơn nhiều để sử dụng thuật toán học máy cho kết quả quyết định. Tuy nhiên, các chương trình học máy không giám sát tinh vi xử lý dữ liệu không được gắn nhãn cũng có thể tạo ra kết quả chính xác và chính xác đáng kinh ngạc.

Dữ liệu không nhãn là gì? - định nghĩa từ techopedia