Trang Chủ Phát triển Nhận dạng giọng nói trực tiếp là gì? - định nghĩa từ techopedia

Nhận dạng giọng nói trực tiếp là gì? - định nghĩa từ techopedia

Mục lục:

Anonim

Định nghĩa - Nhận dạng lời nói có nghĩa là gì?

Nhận dạng giọng nói được định hướng là một loại hệ thống nhận dạng giọng nói sử dụng kịch bản để giảm các lựa chọn cho đầu vào. Điều này giúp cung cấp "nền kinh tế" tốt hơn và mô hình chính xác hơn cho các sản phẩm phần mềm nhận dạng giọng nói.


Techopedia giải thích Nhận dạng giọng nói có định hướng

Một số loại phần mềm nhận dạng giọng nói phổ biến nhất là kết thúc mở - chúng diễn giải toàn bộ phạm vi lời nói thông qua âm thanh. Tuy nhiên, có những thách thức cố hữu được xây dựng trong một hệ thống nhận dạng giọng nói kết thúc mở. Ví dụ, hệ thống phải có khả năng xử lý tất cả các âm thanh khác nhau, thường đòi hỏi một từ vựng thuật toán lớn và các tài nguyên khác.


Với nhận dạng giọng nói trực tiếp, hệ thống chỉ phải giải thích từ một vài lựa chọn khác nhau. Một trong những ví dụ tốt nhất và phổ biến nhất về điều này là trong các công cụ phản hồi bằng giọng nói tương tác (IVR) mà người gọi gặp phải trong môi trường trung tâm cuộc gọi. Những công cụ này không dự đoán đầy đủ các bài phát biểu; họ tìm kiếm các tùy chọn đơn giản như "có" hoặc "không" hoặc các cụm từ như "nói chuyện với người đại diện" hoặc "tìm sự cân bằng".


Do đó, nhận dạng giọng nói theo hướng thường hoạt động tốt hơn và tạo ra kết quả chính xác hơn cho các gói phần mềm giá cả phải chăng hơn cho các loại sản phẩm phần mềm này.

Nhận dạng giọng nói trực tiếp là gì? - định nghĩa từ techopedia