Mục lục:
Khi bạn nghĩ rằng bạn có một ý tưởng tuyệt vời nhưng cần thử nghiệm nó, bạn muốn thử nghiệm nó càng nhanh và càng tiết kiệm càng tốt. Bạn không muốn tham gia vào một chu kỳ thử nghiệm và phát triển kéo dài và lãng phí rất nhiều thời gian và tiền bạc. Apache Spark đã tạo điều kiện cho việc phát triển ứng dụng nhanh chóng chủ yếu vì nó cho phép bạn nhanh chóng kiểm tra ý tưởng của mình với trình bao và API của nó.
Apache Spark là gì?
Về mặt kỹ thuật, Apache Spark là công cụ xử lý dữ liệu có thể tạo thành các khối dữ liệu khổng lồ và xử lý chúng trong nháy mắt. Hai tính năng chính của nó là tốc độ xử lý dữ liệu và hiệu năng trong bộ nhớ. Khung máy tính cụm này là một công cụ nguồn mở giúp các nhà phát triển vừa chớm nở xây dựng các ứng dụng của họ ngay lập tức.
Khung xử lý dữ liệu nâng cao này được AMP Lab làm mẹ và được xuất bản như một công cụ nguồn mở vào năm 2010 như là một phần không thể thiếu của Dự án Apache. Toàn bộ dự án Spark được mã hóa bằng ngôn ngữ Scala và nó có thể chạy trên máy ảo dựa trên Java (JVM).