Mục lục:
Định nghĩa - Dữ liệu được dán nhãn có nghĩa là gì?
Dữ liệu được gắn nhãn là một chỉ định cho các phần dữ liệu đã được gắn thẻ với một hoặc nhiều nhãn xác định các thuộc tính hoặc đặc điểm nhất định hoặc phân loại hoặc các đối tượng có chứa. Nhãn làm cho dữ liệu đó đặc biệt hữu ích trong một số loại máy học nhất định được gọi là thiết lập máy học có giám sát.
Techopedia giải thích dữ liệu được dán nhãn
Trong học máy có giám sát, dữ liệu được dán nhãn đóng vai trò định hướng cho các bài tập kiểm tra và huấn luyện dữ liệu. Chương trình học máy được giám sát có thể bắt đầu với một tập hợp dữ liệu được dán nhãn hoàn toàn hoặc có thể sử dụng dữ liệu được dán nhãn ban đầu để làm việc với dữ liệu chưa được gắn nhãn.
Học máy được giám sát hoạt động như thế này - chương trình xem xét dữ liệu được dán nhãn và đưa ra các so sánh và phân tích tương ứng. Ví dụ: bằng cách vẽ các danh mục được dán nhãn khác nhau trên biểu đồ phân tán, chương trình học máy có thể giúp xác định xem các mục liên tiếp có thuộc danh mục này hay danh mục khác hay không. Các thuật toán sử dụng dữ liệu được dán nhãn là thức ăn gia súc cho các mô hình ra quyết định. Điều này trái ngược với một loại học máy khác gọi là học máy không giám sát, nơi sử dụng dữ liệu không nhãn. Trong học máy không giám sát, chương trình học máy phải đánh giá dữ liệu mà không có nhãn, theo các đặc tính và đặc tính tự nhiên của nó.
