Mục lục:
Định nghĩa - Apache Lucene có nghĩa là gì?
Apache Lucene là một dự án nguồn mở cho một thư viện công cụ tìm kiếm văn bản đầy đủ tính năng và đầy đủ tính năng được viết hoàn toàn bằng Java.
Nó có khả năng tìm kiếm toàn văn bản trong các tài liệu, vì vậy đây là một công nghệ phù hợp với bất kỳ ứng dụng nào yêu cầu tính năng này, đặc biệt nếu nó là đa nền tảng.
Nó được Doug Cutting phát triển lần đầu tiên vào năm 1999 và chính thức trở thành một phần của gia đình các dự án Java nguồn mở Jakarta của tháng 9 năm 2001. Nó đã được nâng cấp thành dự án Apache cấp cao nhất vào tháng 2 năm 2005.
Techopedia giải thích Apache Lucene
Apache Lucene là một công cụ tìm kiếm hiệu suất cao với khái niệm "một tài liệu chứa các trường văn bản" theo kiến trúc logic cốt lõi của nó. Điều này mang lại sự linh hoạt cao và cho phép API Lucene trở nên độc lập với bất kỳ định dạng tệp nào.
Bất kỳ văn bản nào từ các định dạng như MS Word, HTML, XML, PDF và OpenDocument đều có thể được lập chỉ mục miễn là thông tin văn bản có thể được trích xuất, điều đó có nghĩa là nó không thể làm bất cứ điều gì với hình ảnh.
Lucene phù hợp cho bất kỳ ứng dụng nào cần khả năng tìm kiếm và lập chỉ mục toàn văn bản, nhưng nó được công nhận rộng rãi là một tiện ích tuyệt vời để triển khai các công cụ tìm kiếm Internet và tìm kiếm địa phương, một trang web.
Các tính năng bao gồm:
- Lập chỉ mục hiệu suất cao và có thể mở rộng - nó có thể xử lý hơn 150 Gb mỗi giờ trên phần cứng hiện đại và chỉ cần 1 Mb cho mỗi đống yêu cầu bộ nhớ.
- Các thuật toán tìm kiếm mạnh mẽ, chính xác và hiệu quả - nó cung cấp nhiều loại truy vấn mạnh mẽ như cụm từ, ký tự đại diện, khoảng cách và truy vấn phạm vi. Nó cũng có lĩnh vực tìm kiếm và sắp xếp theo bất kỳ lĩnh vực nào.
- Nền tảng chéo - triển khai Java thuần túy và cũng có sẵn trong các ngôn ngữ lập trình khác.
