Mục lục:
Định nghĩa - Test Set có nghĩa là gì?
Tập kiểm thử trong học máy là tập dữ liệu thứ cấp (hoặc đại học) được sử dụng để kiểm tra chương trình học máy sau khi được đào tạo trên tập dữ liệu huấn luyện ban đầu. Ý tưởng là các mô hình dự đoán luôn có một số khả năng chưa biết cần phải được kiểm tra, trái ngược với phân tích từ góc độ lập trình.
Một tập kiểm tra còn được gọi là tập dữ liệu kiểm tra hoặc dữ liệu kiểm tra.
Techopedia giải thích Bộ kiểm tra
Nhiều chuyên gia sẽ nói rằng một cách thực hành tốt nhất là có một bộ dữ liệu thử nghiệm được sắp xếp lại theo thứ tự, hoặc được giữ đến cuối quá trình. Các kỹ sư tìm kiếm quá mức của mô hình và các vấn đề khác trong quá trình đào tạo. Lý tưởng nhất là có bộ thứ ba, bộ dữ liệu xác nhận, kiểm tra các tham số phân loại. Sau đó, và chỉ sau đó, bộ thử nghiệm có thể được đưa ra để xem chương trình được đào tạo tốt như thế nào và liệu mô hình dự đoán của nó có chính xác trên dữ liệu mới hay không. Mặc dù một số mô hình có thể tránh việc tạo một bộ kiểm tra phân vùng hoàn toàn, nhưng điều này thường được xem là thiển cận, vì việc thiếu kiểm tra thực tế có thể khiến chương trình dễ bị thiếu chính xác.
