Mục lục:
Định nghĩa - Giảm kích thước có nghĩa là gì?
Giảm kích thước là một loạt các kỹ thuật trong học máy và thống kê để giảm số lượng các biến ngẫu nhiên cần xem xét. Nó liên quan đến lựa chọn tính năng và trích xuất tính năng. Giảm kích thước làm cho việc phân tích dữ liệu dễ dàng hơn và nhanh hơn cho các thuật toán học máy mà không cần các biến ngoại lai để xử lý, làm cho thuật toán học máy nhanh hơn và lần lượt đơn giản hơn.
Techopedia giải thích Giảm kích thước
Giảm kích thước cố gắng giảm số lượng biến ngẫu nhiên trong dữ liệu. Một cách tiếp cận K-láng giềng gần nhất thường được sử dụng. Các kỹ thuật giảm kích thước được chia thành hai loại chính: lựa chọn tính năng và trích xuất tính năng.
Các kỹ thuật chọn tính năng tìm một tập hợp con nhỏ hơn của tập dữ liệu nhiều chiều để tạo mô hình dữ liệu. Các chiến lược chính cho bộ tính năng là bộ lọc, trình bao bọc (sử dụng mô hình dự đoán) và được nhúng, thực hiện lựa chọn tính năng trong khi xây dựng mô hình.
Khai thác tính năng liên quan đến việc chuyển đổi dữ liệu chiều cao thành không gian có ít kích thước hơn. Các phương pháp bao gồm phân tích thành phần chính, PCA nhân, PCA dựa trên đồ thị, phân tích phân biệt tuyến tính và phân tích phân biệt tổng quát.