Mục lục:
Định nghĩa - Học tăng cường có nghĩa là gì?
Học tăng cường, trong bối cảnh trí tuệ nhân tạo, là một loại lập trình động, đào tạo các thuật toán bằng cách sử dụng một hệ thống khen thưởng và trừng phạt.
Một thuật toán học tăng cường, hoặc tác nhân, học bằng cách tương tác với môi trường của nó. Các đại lý nhận được phần thưởng bằng cách thực hiện chính xác và hình phạt cho việc thực hiện không chính xác. Các đặc vụ học mà không cần sự can thiệp từ con người bằng cách tối đa hóa phần thưởng của nó và giảm thiểu hình phạt của nó.
Techopedia giải thích Học tăng cường
Học tăng cường là một cách tiếp cận học máy được lấy cảm hứng từ tâm lý học hành vi. Nó tương tự như cách một đứa trẻ học cách thực hiện một nhiệm vụ mới. Học tăng cường tương phản với các phương pháp học máy khác ở chỗ thuật toán không được nói rõ ràng về cách thực hiện một nhiệm vụ, mà tự nó hoạt động thông qua vấn đề.
Là một đại lý, có thể là một chiếc xe tự lái hoặc một chương trình chơi cờ, tương tác với môi trường của nó, nhận được trạng thái phần thưởng tùy thuộc vào cách nó thực hiện, chẳng hạn như lái xe đến đích an toàn hoặc chiến thắng một trò chơi. Ngược lại, đại lý nhận một hình phạt cho việc thực hiện không chính xác, chẳng hạn như đi ra đường hoặc bị kiểm tra.
Tác nhân theo thời gian đưa ra quyết định để tối đa hóa phần thưởng của mình và giảm thiểu hình phạt bằng cách sử dụng lập trình động. Ưu điểm của phương pháp này đối với trí tuệ nhân tạo là nó cho phép một chương trình AI học mà không cần lập trình viên đánh vần cách một tác nhân nên thực hiện nhiệm vụ.
