Trang Chủ Trên bản tin tức Apache kafka là gì? - định nghĩa từ techopedia

Apache kafka là gì? - định nghĩa từ techopedia

Mục lục:

Anonim

Định nghĩa - Apache Kafka có nghĩa là gì?

Apache Kafka là một hệ thống thông báo đăng ký xuất bản mã nguồn mở được thiết kế để cung cấp xử lý nhanh chóng, có thể mở rộng và xử lý lỗi đối với các nguồn cấp dữ liệu thời gian thực. Không giống như phần mềm nhắn tin doanh nghiệp truyền thống, Kafka có thể xử lý tất cả dữ liệu chảy qua một công ty và thực hiện nó trong thời gian thực gần.

Kafka được viết bằng Scala và ban đầu được phát triển bởi LinkedIn. Kể từ thời điểm đó, một số công ty đã sử dụng nó để xây dựng các nền tảng thời gian thực.

Techopedia giải thích Apache Kafka

Kafka có nhiều điểm tương đồng với nhật ký giao dịch và nó duy trì nguồn cấp tin nhắn trong các chủ đề. Các nhà sản xuất viết dữ liệu cho các chủ đề và người tiêu dùng đọc từ các chủ đề đó, được phân vùng và nhân rộng trên nhiều nút theo định dạng hệ thống phân tán. Kafka là duy nhất ở chỗ nó coi mỗi phân vùng chủ đề là nhật ký và mỗi thông báo trong phân vùng được gán một phần bù duy nhất. Nó giữ lại tất cả các tin nhắn trong một khoảng thời gian nhất định và người tiêu dùng có trách nhiệm theo dõi vị trí của chúng trong mỗi nhật ký. Điều này khác với các hệ thống trước đây, nơi các nhà môi giới chịu trách nhiệm theo dõi này, điều này đã hạn chế nghiêm trọng khả năng mở rộng của hệ thống khi số lượng người tiêu dùng tăng lên. Cấu trúc này cho phép Kafka hỗ trợ nhiều người tiêu dùng và giữ lại một lượng lớn dữ liệu với chi phí rất thấp.

Kafka có thể được sử dụng:

  • Là một nhà môi giới tin nhắn truyền thống
  • Để theo dõi hoạt động của trang web
  • Để tổng hợp nhật ký
  • Để xử lý luồng dữ liệu lớn

Kafka có thể được sử dụng cùng với Apache Storm, Apache HBase và Apache Spark để phân tích thời gian thực và hiển thị dữ liệu phát trực tuyến.

Apache kafka là gì? - định nghĩa từ techopedia