Mục lục:
Định nghĩa - Text Analytics có nghĩa là gì?
Phân tích văn bản là một thông lệ chung về việc áp dụng các thuật toán hoặc chương trình cho văn bản để phân tích văn bản đó.
Phân tích văn bản còn được gọi là khai thác văn bản.
Techopedia giải thích Phân tích văn bản
Với phân tích văn bản, máy tính phân tích văn bản cho dữ liệu thay vì đọc nó.
Các nhà phát triển đã tạo ra bất kỳ số lượng thuật toán phân tích văn bản nào làm những việc khác nhau cho văn bản để thu thập thông tin về văn bản. Ví dụ, phân tích văn bản rất quan trọng trong xử lý ngôn ngữ tự nhiên, nơi các phát triển tiên phong cố gắng giúp máy tính hiểu lời nói của con người.
Một cách để nói về một số chương trình phân tích văn bản là chúng "loại bỏ ngữ nghĩa" của văn bản. Ghi nhãn ngữ nghĩa là một phần của những gì cho phép con người đọc văn bản một cách tự nhiên. Loại bỏ ngữ nghĩa có thể để lại một kết quả có cấu trúc hơn, dễ dàng hơn cho máy tính để phân tích.
Để có cái nhìn sâu hơn về khai thác văn bản hoặc các chương trình phân tích văn bản, có thể hữu ích khi xem xét sự khác biệt giữa các loại ngôn ngữ lập trình ngữ nghĩa mà con người viết và ngôn ngữ máy, đó là những gì máy tính đọc được. Đó là khái niệm hoạt động trong phân tích văn bản: ví dụ: chương trình phân tích văn bản có thể đi qua văn bản và gán số cho các từ và cụm từ cụ thể để cung cấp kết quả được tính toán để sử dụng trong giao diện phân tích, sau đó được người dùng giải thích.
