Q:
Tại sao học bán giám sát là một mô hình hữu ích cho học máy?
A:Học bán giám sát là một phần quan trọng của quá trình học máy và học sâu, bởi vì nó mở rộng và nâng cao khả năng của các hệ thống máy học theo những cách quan trọng.
Đầu tiên, trong ngành công nghiệp máy học non trẻ ngày nay, hai mô hình đã xuất hiện để đào tạo máy tính: Chúng được gọi là học tập có giám sát và không giám sát. Chúng khác nhau cơ bản ở chỗ học có giám sát bao gồm sử dụng dữ liệu được dán nhãn để suy ra kết quả và học không giám sát bao gồm ngoại suy từ dữ liệu không được gắn nhãn thông qua kiểm tra các thuộc tính của từng đối tượng trong bộ dữ liệu đào tạo.
Tải xuống miễn phí: Machine Learning và Why It Matters |
Các chuyên gia giải thích điều này bằng cách sử dụng nhiều ví dụ khác nhau: Cho dù các đối tượng trong tập huấn luyện là trái cây hay hình dạng màu hoặc tài khoản khách hàng, điểm chung trong học tập có giám sát là công nghệ bắt đầu biết những đối tượng đó là gì - các phân loại chính đã được thực hiện . Ngược lại, trong học tập không giám sát, công nghệ xem xét các mục chưa được xác định và phân loại chúng theo cách sử dụng tiêu chí riêng của nó. Điều này đôi khi được gọi là "tự học."
Sau đó, đây là tiện ích chính của học tập bán giám sát: Nó kết hợp việc sử dụng dữ liệu được gắn nhãn và không nhãn để có được phương pháp "tốt nhất của cả hai".
Học tập có giám sát mang lại cho công nghệ nhiều hướng đi hơn, nhưng nó có thể tốn kém, tốn nhiều công sức, tẻ nhạt và đòi hỏi nhiều nỗ lực hơn. Học tập không giám sát là "tự động" hơn, nhưng kết quả có thể kém chính xác hơn nhiều.
Vì vậy, trong việc sử dụng một tập hợp các dữ liệu được dán nhãn (thường là một tập hợp nhỏ hơn trong sơ đồ lớn), một phương pháp học tập có giám sát bán "hiệu quả" hệ thống để phân loại tốt hơn. Ví dụ: giả sử một hệ thống máy học đang cố gắng xác định 100 mục theo tiêu chí nhị phân (đen so với trắng). Có thể cực kỳ hữu ích khi chỉ có một phiên bản được dán nhãn của mỗi (một màu trắng, một màu đen) và sau đó phân cụm các mục "xám" còn lại theo tiêu chí nào là tốt nhất. Tuy nhiên, ngay sau khi hai mục đó được dán nhãn, việc học tập không giám sát sẽ trở thành việc học bán giám sát.
Trong chỉ đạo học tập bán giám sát, các kỹ sư xem xét kỹ các ranh giới quyết định ảnh hưởng đến các hệ thống máy học để phân loại theo một hoặc kết quả được dán nhãn khác khi đánh giá dữ liệu không được gắn nhãn. Họ sẽ suy nghĩ về cách sử dụng tốt nhất việc học bán giám sát trong bất kỳ triển khai nào: Ví dụ: thuật toán học bán giám sát có thể "bao bọc" một thuật toán unup hiện có cho phương pháp "một hai".
Học bán giám sát như một hiện tượng chắc chắn sẽ thúc đẩy biên giới của học máy tiến lên, vì nó mở ra tất cả các khả năng mới cho các hệ thống máy học hiệu quả hơn và hiệu quả hơn.