Trang Chủ Phát triển Một quá trình quyết định markov (mdp) là gì? - định nghĩa từ techopedia

Một quá trình quyết định markov (mdp) là gì? - định nghĩa từ techopedia

Mục lục:

Anonim

Định nghĩa - Quy trình quyết định Markov (MDP) có nghĩa là gì?

Một quá trình ra quyết định của Markov (MDP) là một cái gì đó mà các chuyên gia gọi là quá trình kiểm soát ngẫu nhiên thời gian rời rạc của người Hồi giáo. Đó là dựa trên toán học được tiên phong bởi học giả người Nga, Mark Markov vào cuối thế kỷ 19 và đầu thế kỷ 20.

Techopedia giải thích Quy trình ra quyết định của Markov (MDP)

Một cách để giải thích quá trình ra quyết định của Markov và các chuỗi Markov liên quan là đây là những yếu tố của lý thuyết trò chơi hiện đại dựa trên nghiên cứu toán học đơn giản hơn của nhà khoa học Nga khoảng một trăm năm trước. Mô tả về quy trình ra quyết định của Markov là nó nghiên cứu một kịch bản trong đó một hệ thống ở một số trạng thái nhất định và chuyển sang trạng thái khác dựa trên các quyết định của người ra quyết định.

Một chuỗi Markov như một mô hình cho thấy một chuỗi các sự kiện trong đó xác suất của một sự kiện nhất định phụ thuộc vào trạng thái đạt được trước đó. Các chuyên gia có thể nói về một không gian trạng thái có thể đếm được của người Viking khi mô tả quá trình ra quyết định của Markov - một số người liên tưởng ý tưởng của mô hình quyết định Markov với mô hình đi bộ ngẫu nhiên của người Viking hoặc mô hình ngẫu nhiên khác dựa trên xác suất (mô hình đi bộ ngẫu nhiên, thường được trích dẫn trên Wall Street, mô hình chuyển động của một vốn chủ sở hữu lên hoặc xuống trong bối cảnh xác suất thị trường).

Nhìn chung, các quy trình quyết định của Markov thường được áp dụng cho một số công nghệ tinh vi nhất mà các chuyên gia đang làm việc ngày nay, ví dụ, trong các mô hình robot, tự động hóa và nghiên cứu.

Một quá trình quyết định markov (mdp) là gì? - định nghĩa từ techopedia