Mục lục:
Định nghĩa - Naive Bayes có nghĩa là gì?
Trình phân loại Bayes ngây thơ là một thuật toán sử dụng định lý Bayes để phân loại các đối tượng. Các trình phân loại Naive Bayes giả định tính độc lập mạnh mẽ hoặc ngây thơ giữa các thuộc tính của các điểm dữ liệu. Việc sử dụng phổ biến các phân loại Bayes ngây thơ bao gồm các bộ lọc thư rác, phân tích văn bản và chẩn đoán y tế. Các phân loại này được sử dụng rộng rãi cho máy học vì chúng đơn giản để thực hiện.
Naive Bayes còn được gọi là Bayes đơn giản hoặc Bayes độc lập.
Techopedia giải thích Naive Bayes
Một trình phân loại Bayes ngây thơ sử dụng lý thuyết xác suất để phân loại dữ liệu. Các thuật toán phân loại Naive Bayes sử dụng định lý Bayes. Cái nhìn sâu sắc chính của định lý Bayes là xác suất của một sự kiện có thể được điều chỉnh khi dữ liệu mới được đưa ra.
Điều làm cho một trình phân loại Bayes ngây thơ trở nên ngây thơ là giả định của nó rằng tất cả các thuộc tính của một điểm dữ liệu đang được xem xét là độc lập với nhau. Một bộ phân loại phân loại trái cây thành táo và cam sẽ biết rằng táo có màu đỏ, tròn và có kích thước nhất định, nhưng sẽ không giả định tất cả những điều này cùng một lúc. Cam cũng tròn, sau tất cả.
Một trình phân loại Bayes ngây thơ không phải là một thuật toán đơn lẻ, mà là một nhóm các thuật toán học máy sử dụng tính độc lập thống kê. Các thuật toán này tương đối dễ viết và chạy hiệu quả hơn các thuật toán Bayes phức tạp hơn.
Ứng dụng phổ biến nhất là bộ lọc thư rác. Bộ lọc thư rác xem các thông báo email cho một số từ khóa nhất định và đặt chúng vào thư mục thư rác nếu chúng khớp.
Mặc dù có tên, càng có nhiều dữ liệu, trình phân loại Bayes ngây thơ càng chính xác, chẳng hạn như từ người dùng gắn cờ thư email trong hộp thư đến để spam.
