Mục lục:
Định nghĩa - Apache Sqoop có nghĩa là gì?
Apache Sqoop ("SQL to Hadoop") là một ứng dụng chế độ bảng điều khiển dựa trên Java được thiết kế để truyền dữ liệu hàng loạt giữa kho dữ liệu Apache Hadoop và không phải Hadoop, như cơ sở dữ liệu quan hệ, cơ sở dữ liệu NoQuery và kho dữ liệu. Phiên bản 1.4.4 được phát hành vào ngày 31 tháng 7 năm 2013.Techopedia giải thích Apache Sqoop
Các doanh nghiệp sử dụng Hadoop đang thấy cần phải chuyển một số dữ liệu của họ từ các hệ thống quản lý cơ sở dữ liệu quan hệ truyền thống (RDBMS) sang hệ sinh thái Hadoop.
Sqoop, một phần không thể thiếu của Hadoop, có thể thực hiện việc chuyển tiền này một cách tự động. Hơn nữa, dữ liệu được nhập vào Hadoop có thể được chuyển đổi bằng MapReduce trước khi xuất chúng trở lại RDBMS. Sqoop cũng có thể tạo các lớp Java để tương tác theo chương trình với dữ liệu đã nhập.
Sqoop sử dụng kiến trúc dựa trên trình kết nối cho phép nó sử dụng các plugin để kết nối với cơ sở dữ liệu bên ngoài.