Mục lục:
Định nghĩa - Hàng xóm K-Gần (K-NN) có nghĩa là gì?
Thuật toán k-lân cận lân cận, thường được viết tắt là k-nn, là một cách tiếp cận để phân loại dữ liệu ước tính khả năng điểm dữ liệu là thành viên của nhóm này hay nhóm khác tùy thuộc vào nhóm điểm dữ liệu gần nhất với nhóm nào .
Hàng xóm k gần nhất là một ví dụ về thuật toán "người học lười biếng", nghĩa là nó không xây dựng mô hình bằng cách sử dụng tập huấn luyện cho đến khi thực hiện một truy vấn của tập dữ liệu.
Techopedia giải thích K-Recent Neighbor (K-NN)
Một hàng xóm gần nhất là một thuật toán phân loại dữ liệu cố gắng xác định nhóm điểm dữ liệu nằm trong nhóm nào bằng cách xem xét các điểm dữ liệu xung quanh nó.
Một thuật toán, nhìn vào một điểm trên lưới, cố gắng xác định xem một điểm nằm trong nhóm A hay B, xem xét trạng thái của các điểm gần nó. Phạm vi được xác định tùy ý, nhưng vấn đề là lấy một mẫu dữ liệu. Nếu phần lớn các điểm nằm trong nhóm A, thì có khả năng điểm dữ liệu trong câu hỏi sẽ là A chứ không phải B và ngược lại.
Hàng xóm k gần nhất là một ví dụ về thuật toán "người học lười biếng" bởi vì nó không tạo ra một mô hình của tập dữ liệu trước đó. Các tính toán duy nhất mà nó thực hiện là khi nó được yêu cầu thăm dò ý kiến hàng xóm của điểm dữ liệu. Điều này làm cho k-nn rất dễ thực hiện để khai thác dữ liệu.
