Mục lục:
Định nghĩa - Schema on Read có nghĩa là gì?
Lược đồ về đọc đề cập đến một chiến lược phân tích dữ liệu sáng tạo trong các công cụ xử lý dữ liệu mới như Hadoop và các công nghệ cơ sở dữ liệu liên quan khác. Trong lược đồ khi đọc, dữ liệu được áp dụng cho một kế hoạch hoặc lược đồ khi nó được kéo ra khỏi một vị trí được lưu trữ, thay vì khi nó đi vào.
Techopedia giải thích Schema về Đọc
Các công nghệ cơ sở dữ liệu cũ hơn có một chiến lược thực thi lược đồ trên viết khác, dữ liệu phải được áp dụng cho một kế hoạch hoặc lược đồ khi nó đi vào cơ sở dữ liệu. Điều này đã được thực hiện một phần để thực thi tính nhất quán của dữ liệu và đó là một trong những lợi ích chính của lược đồ khi viết. Với lược đồ đã đọc, những người xử lý dữ liệu có thể cần thực hiện nhiều công việc hơn để xác định từng phần dữ liệu, nhưng có tính linh hoạt hơn rất nhiều.
Theo một cách cơ bản, thiết kế lược đồ đọc bổ sung cho các ứng dụng chính của Hadoop và các công cụ liên quan. Các công ty muốn tổng hợp hiệu quả rất nhiều dữ liệu và lưu trữ nó cho các mục đích sử dụng cụ thể. Điều đó nói rằng, họ có thể coi trọng việc thu thập dữ liệu ô uế hoặc không nhất quán nhiều hơn họ coi trọng chế độ thực thi dữ liệu nghiêm ngặt. Nói cách khác, Hadoop có thể đáp ứng được một phạm vi rộng các bit dữ liệu nhỏ khác nhau có thể không được tổ chức hoàn toàn. Sau đó, khi thông tin đó được sử dụng, nó sẽ được tổ chức. Áp dụng hệ thống ghi trên lược đồ cơ sở dữ liệu cũ có nghĩa là dữ liệu ít được tổ chức hơn có thể sẽ bị loại bỏ.
Một cách khác để nói điều này là lược đồ trên ghi tốt hơn để có được các tập dữ liệu rất rõ ràng và nhất quán, nhưng các tập dữ liệu đó có thể bị hạn chế hơn. Lược đồ về đọc phôi tạo ra một mạng lưới rộng hơn và cho phép tổ chức dữ liệu linh hoạt hơn. Các chuyên gia cũng chỉ ra rằng việc tạo hai chế độ xem khác nhau của cùng một dữ liệu với lược đồ khi đọc sẽ dễ dàng hơn.
Chiến lược đọc lược đồ này là một phần thiết yếu của lý do tại sao Hadoop và các công nghệ liên quan rất phổ biến trong công nghệ doanh nghiệp ngày nay. Các doanh nghiệp đang sử dụng một lượng lớn dữ liệu thô để cung cấp năng lượng cho tất cả các loại quy trình kinh doanh bằng cách áp dụng logic mờ và các hệ thống sắp xếp và lọc khác liên quan đến kho dữ liệu của công ty và các tài sản dữ liệu lớn khác.