Q:
Sự khác biệt giữa học tập có giám sát, không giám sát và bán giám sát là gì?
A:Sự khác biệt chính giữa học tập có giám sát và không giám sát trong học máy là việc sử dụng dữ liệu đào tạo.
Việc học có giám sát sử dụng dữ liệu mẫu để hiển thị dữ liệu chính xác của Cameron trông như thế nào. Dữ liệu được cấu trúc để hiển thị đầu ra của đầu vào đã cho.
Một thuật toán học máy phân loại trái cây có thể có hình ảnh của các loại trái cây như táo, chuối, nho và cam làm đầu vào và tên của các loại trái cây này làm đầu ra.
Một ví dụ trong thế giới thực sẽ là các bộ lọc thư rác Bayes trong các chương trình email. Các bộ lọc này được đào tạo với các ví dụ về các email được coi là thư rác. Sau đó, bộ lọc thư rác có thể tìm kiếm các cụm từ nhất định xuất hiện trong email xuất hiện trong email spam và chuyển chúng vào thư mục thư rác.
Nó giống như chỉ cho con người cách thực hiện một nhiệm vụ mới. Một người thực hiện nhập dữ liệu có thể được hiển thị các ví dụ về dữ liệu theo định dạng mà công ty muốn và sau đó dự kiến sẽ tuân theo dữ liệu đó.
Các chương trình học máy sử dụng học có giám sát lặp đi lặp lại nhiều lần với dữ liệu đào tạo. Kết quả có thể ấn tượng khi nó thực sự được thực hiện. Bộ lọc thư rác Gmail của Google rất chính xác vì có rất nhiều người dùng đào tạo nó.
Học tập không giám sát không có bất kỳ dữ liệu đào tạo trước. Trong ví dụ phân loại trái cây của chúng tôi, một thuật toán có thể chỉ được hiển thị hình ảnh của trái cây và được yêu cầu phân loại chúng.
Học tập không giám sát có các ứng dụng trong nghiên cứu thị trường bằng cách học thói quen mua hàng của khách hàng hoặc bảo mật bằng cách theo dõi các mô hình hack.
Các nỗ lực học tập được giám sát bán để có một nền tảng trung gian bằng cách dán nhãn một số dữ liệu. Ví dụ, táo và cam có thể được dán nhãn trong chương trình phân loại trái cây, nhưng chuối và nho thì không.
Khi nào sử dụng bất kỳ thuật toán nào trong số này sẽ phụ thuộc vào loại dữ liệu được sử dụng. Một số tác vụ có mô hình ổn định, chẳng hạn như gian lận thẻ tín dụng hoặc tin nhắn rác. Học có giám sát là thích hợp cho các loại nhiệm vụ. Các cuộc tấn công mạng là không thể đoán trước, và phương pháp học tập không giám sát hoặc bán giám sát có thể phù hợp hơn.