Trang Chủ Phát triển Bộ công cụ ngôn ngữ tự nhiên (nltk) là gì? - định nghĩa từ techopedia

Bộ công cụ ngôn ngữ tự nhiên (nltk) là gì? - định nghĩa từ techopedia

Mục lục:

Anonim

Định nghĩa - Bộ công cụ ngôn ngữ tự nhiên (NLTK) có nghĩa là gì?

Bộ công cụ ngôn ngữ tự nhiên (NLTK) là một nền tảng được sử dụng để xây dựng các chương trình Python hoạt động với dữ liệu ngôn ngữ của con người để áp dụng trong xử lý ngôn ngữ tự nhiên thống kê (NLP).


Nó chứa các thư viện xử lý văn bản để mã hóa, phân tích cú pháp, phân loại, xuất phát, gắn thẻ và lý luận ngữ nghĩa. Nó cũng bao gồm các trình diễn đồ họa và bộ dữ liệu mẫu cũng như kèm theo một cuốn sách nấu ăn và một cuốn sách giải thích các nguyên tắc đằng sau các tác vụ xử lý ngôn ngữ cơ bản mà NLTK hỗ trợ.

Techopedia giải thích Bộ công cụ ngôn ngữ tự nhiên (NLTK)

Bộ công cụ ngôn ngữ tự nhiên là một thư viện mã nguồn mở cho ngôn ngữ lập trình Python ban đầu được viết bởi Steven Bird, Edward Loper và Ewan Klein để sử dụng trong phát triển và giáo dục.

Nó đi kèm với một hướng dẫn thực hành giới thiệu các chủ đề về ngôn ngữ học tính toán cũng như các nguyên tắc cơ bản lập trình cho Python, nó phù hợp với các nhà ngôn ngữ học không có kiến ​​thức sâu về lập trình, các kỹ sư và nhà nghiên cứu cần đi sâu vào ngôn ngữ học tính toán, sinh viên và nhà giáo dục.


NLTK bao gồm hơn 50 nguồn tài nguyên và từ vựng như Penn Treebank Corpus, Opennet đa ngôn ngữ, Báo cáo vấn đề Corpus và Từ điển phụ thuộc của Lin.

Bộ công cụ ngôn ngữ tự nhiên (nltk) là gì? - định nghĩa từ techopedia