Trang Chủ Xu hướng Apache avro là gì? - định nghĩa từ techopedia

Apache avro là gì? - định nghĩa từ techopedia

Mục lục:

Anonim

Định nghĩa - Apache Avro có nghĩa là gì?

Apache Avro là một khung công tác tuần tự hóa và gọi thủ tục từ xa được phát triển trong dự án Apache Hadoop, nơi nó cung cấp cả định dạng tuần tự hóa để có được dữ liệu liên tục và định dạng dây để cung cấp liên lạc giữa các nút Hadoop, cũng như kết nối các chương trình máy khách với Hadoop dịch vụ.

Avro sử dụng định dạng JSON để xác định các giao thức và loại dữ liệu, cũng như tuần tự hóa dữ liệu thành định dạng nhị phân nhỏ gọn.

Techopedia giải thích Apache Avro

Apache Avro là một khung công tác tuần tự hóa dữ liệu lớn, tạo ra dữ liệu ở định dạng nhị phân nhỏ gọn, không yêu cầu tạo mã hoặc các đối tượng proxy.

Nó được sử dụng như một thành phần tuần tự hóa dữ liệu cho Apache Hadoop. Avro hoạt động trên khái niệm lược đồ. Khi dữ liệu Avro đang được đọc, lược đồ được sử dụng trong quá trình ghi dữ liệu cụ thể đó luôn luôn xuất hiện.

Điều này cho phép mỗi bộ dữ liệu không có chi phí trên mỗi giá trị, điều này làm cho việc tuần tự hóa cả nhanh và kích thước tương đối nhỏ. Và vì dữ liệu và lược đồ của chúng hoàn toàn tự mô tả, điều này giúp dễ dàng sử dụng với các ngôn ngữ kịch bản động.

Khi dữ liệu Avro được lưu trữ trong một tệp cụ thể, lược đồ cũng được lưu trữ cùng với chúng để sau đó được xử lý bởi một chương trình khác. Vì vậy, nếu một chương trình đọc dữ liệu đang mong đợi một lược đồ khác, thì điều này có thể dễ dàng được giải quyết vì cả hai lược đồ đều có mặt.

Avro cung cấp:

    Một định dạng dữ liệu nhị phân nhỏ gọn và nhanh chóng

    Cấu trúc dữ liệu phong phú

    Một tập tin container để lưu trữ dữ liệu liên tục

    Cuộc gọi thủ tục từ xa (RPC)

    Tích hợp với các ngôn ngữ động

Tạo mã không phải là một yêu cầu để đọc hoặc ghi tệp dữ liệu hoặc để sử dụng hoặc thực hiện các giao thức RPC.

Apache avro là gì? - định nghĩa từ techopedia