Q:
Tại sao đóng bao trong học máy giảm phương sai?
A:Tập hợp Bootstrap, hoặc "đóng gói", trong học máy giúp giảm phương sai thông qua việc xây dựng các mô hình tập hợp dữ liệu phức tạp hơn. Cụ thể, phương pháp đóng bao tạo ra các tập hợp con thường chồng chéo để mô hình hóa dữ liệu theo cách liên quan hơn.
Một khái niệm thú vị và đơn giản về cách áp dụng đóng bao là lấy một tập hợp các mẫu ngẫu nhiên và rút ra giá trị trung bình đơn giản. Sau đó, sử dụng cùng một tập hợp các mẫu, tạo ra hàng tá tập hợp con được xây dựng dưới dạng cây quyết định để thao tác kết quả cuối cùng. Giá trị trung bình thứ hai sẽ hiển thị một bức tranh xác thực về cách các mẫu riêng lẻ đó liên quan với nhau về giá trị. Ý tưởng tương tự có thể được áp dụng cho bất kỳ thuộc tính nào của bất kỳ tập hợp điểm dữ liệu nào.
Tải xuống miễn phí: Machine Learning và Why It Matters |
Vì cách tiếp cận này hợp nhất khám phá vào các ranh giới xác định hơn, nó làm giảm phương sai và giúp vượt quá. Hãy nghĩ về một biểu đồ phân tán với các điểm dữ liệu được phân phối phần nào; bằng cách sử dụng phương pháp đóng bao, các kỹ sư "thu nhỏ" các đường khám phá phức tạp và định hướng để các thông số mượt mà hơn.
Một số người nói về giá trị của việc đóng bao là "phân chia và chinh phục" hoặc một loại "heuristic hỗ trợ". Ý tưởng là thông qua mô hình hóa đồng bộ, chẳng hạn như sử dụng rừng ngẫu nhiên, những người sử dụng đóng bao như một kỹ thuật có thể nhận được kết quả dữ liệu có phương sai thấp hơn. Về mặt giảm bớt sự phức tạp, việc đóng bao cũng có thể giúp khắc phục tình trạng thừa. Hãy nghĩ về một mô hình có quá nhiều điểm dữ liệu: giả sử, một điểm kết nối với 100 dấu chấm không được sắp xếp. Dòng dữ liệu trực quan kết quả sẽ bị lởm chởm, năng động, không ổn định. Sau đó "giải quyết" phương sai bằng cách tập hợp các bộ đánh giá. Trong học tập đồng bộ, điều này thường được coi là tham gia một số "người học yếu" để cung cấp một kết quả hợp tác "học tập mạnh mẽ". Kết quả là một dòng dữ liệu mượt mà hơn, nhiều đường viền hơn và ít phương sai hoang dã hơn trong mô hình.
Thật dễ dàng để thấy ý tưởng đóng bao có thể được áp dụng cho các hệ thống CNTT của doanh nghiệp. Các nhà lãnh đạo doanh nghiệp thường muốn có "cái nhìn toàn cảnh" về những gì đang xảy ra với sản phẩm, khách hàng, v.v. cho người dùng cuối.