Trang Chủ Âm thanh Dữ liệu đào tạo là gì? - định nghĩa từ techopedia

Dữ liệu đào tạo là gì? - định nghĩa từ techopedia

Mục lục:

Anonim

Định nghĩa - Dữ liệu đào tạo có nghĩa là gì?

Ý tưởng sử dụng dữ liệu đào tạo trong các chương trình học máy là một khái niệm đơn giản, nhưng nó cũng rất có cơ sở đối với cách thức mà các công nghệ này hoạt động. Dữ liệu đào tạo là một bộ dữ liệu ban đầu được sử dụng để giúp chương trình hiểu cách áp dụng các công nghệ như mạng thần kinh để học và tạo ra kết quả tinh vi. Nó có thể được bổ sung bởi các bộ dữ liệu tiếp theo được gọi là bộ xác nhận và thử nghiệm.

Dữ liệu đào tạo còn được gọi là tập huấn luyện, tập dữ liệu huấn luyện hoặc tập học.

Techopedia giải thích dữ liệu đào tạo

Tập huấn luyện là tài liệu mà qua đó máy tính học cách xử lý thông tin. Học máy sử dụng các thuật toán - nó bắt chước các khả năng của bộ não con người để tiếp nhận các đầu vào đa dạng và cân nhắc chúng, để tạo ra các kích hoạt trong não, trong từng tế bào thần kinh. Tế bào thần kinh nhân tạo tái tạo rất nhiều quá trình này với phần mềm - học máy và các chương trình mạng thần kinh cung cấp các mô hình rất chi tiết về cách thức hoạt động của quá trình suy nghĩ của con người chúng ta.

Với ý nghĩ đó, dữ liệu đào tạo có thể được cấu trúc theo những cách khác nhau. Đối với các cây quyết định tuần tự và các loại thuật toán đó, nó sẽ là một tập hợp các văn bản thô hoặc dữ liệu chữ số được phân loại hoặc thao tác khác. Mặt khác, đối với các mạng nơ ron tích chập phải xử lý hình ảnh và thị giác máy tính, tập huấn luyện thường bao gồm một số lượng lớn hình ảnh. Ý tưởng là bởi vì chương trình học máy rất phức tạp và phức tạp, nó sử dụng đào tạo lặp trên mỗi hình ảnh đó để cuối cùng có thể nhận ra các tính năng, hình dạng và thậm chí cả các đối tượng như người hoặc động vật. Dữ liệu huấn luyện là hoàn toàn cần thiết cho quá trình - nó có thể được coi là thức ăn trên mạng mà hệ thống sử dụng để vận hành.

Dữ liệu đào tạo là gì? - định nghĩa từ techopedia