Q:
Điều gì tốt hơn, một nền tảng hoặc một thuật toán học máy mang lại cho chính bạn trên AWS?
A:Ngày nay, nhiều công ty tích hợp các giải pháp học máy vào bộ công cụ phân tích của họ để tăng cường quản lý thương hiệu, cải thiện trải nghiệm của khách hàng và tăng hiệu quả hoạt động. Các mô hình học máy là thành phần cốt lõi của các giải pháp học máy. Các mô hình được đào tạo bằng thuật toán toán học và các tập dữ liệu lớn để đưa ra dự đoán đáng tin cậy. Hai ví dụ phổ biến về dự đoán là (1) xác định xem một tập hợp giao dịch tài chính có biểu thị gian lận hay (2) đánh giá tình cảm của người tiêu dùng xung quanh sản phẩm, dựa trên đầu vào được thu thập từ phương tiện truyền thông xã hội.
Amazon SageMaker là một dịch vụ được quản lý hoàn toàn cho phép các nhà phát triển và nhà khoa học dữ liệu xây dựng, đào tạo và triển khai các mô hình học máy. Trong SageMaker, bạn có thể sử dụng các thuật toán bên ngoài hoặc đi theo con đường mang theo của riêng bạn để có giải pháp tùy chỉnh hơn. Cả hai lựa chọn đều hợp lệ và phục vụ như nhau làm cơ sở cho một giải pháp máy học thành công.
(Lưu ý của biên tập viên: Bạn có thể xem các lựa chọn thay thế khác cho SageMaker tại đây.)
Các thuật toán vượt trội của SageMaker bao gồm các ví dụ phổ biến, được tối ưu hóa cao để phân loại hình ảnh, xử lý ngôn ngữ tự nhiên, v.v. Danh sách đầy đủ có thể được tìm thấy ở đây .
- Ưu điểm vượt trội: Các thuật toán này đã được tối ưu hóa trước (và đang được cải tiến liên tục). Bạn có thể lên, chạy và triển khai nhanh. Thêm vào đó, điều chỉnh siêu tham số tự động AWS có sẵn.
- Các cân nhắc ngoài luồng: Các cải tiến liên tục được đề cập ở trên có thể không tạo ra kết quả như dự đoán như thể bạn có toàn quyền kiểm soát việc thực hiện các thuật toán của mình.
Nếu các thuật toán này không phù hợp với dự án của bạn, bạn có ba lựa chọn khác: (1) Thư viện Spark Spark của Amazon, (2) mã Python tùy chỉnh (sử dụng TensorFLow hoặc Apache MXNet) hoặc (3) mang theo chính bạn về cơ bản là không bị ràng buộc, nhưng sẽ cần phải tạo một hình ảnh Docker để đào tạo và phục vụ mô hình của bạn (bạn có thể làm như vậy bằng cách sử dụng các hướng dẫn ở đây ).
Cách tiếp cận mang lại cho bạn sự tự do hoàn toàn. Điều này có thể chứng minh sự hấp dẫn đối với các nhà khoa học dữ liệu đã xây dựng một thư viện mã thuật toán tùy chỉnh và / hoặc mã độc quyền có thể không được trình bày trong bộ ngoài hộp hiện tại.
- Mang lại lợi thế cho riêng bạn: Cho phép kiểm soát hoàn toàn toàn bộ hệ thống khoa học dữ liệu cùng với việc sử dụng IP độc quyền.
- Cân nhắc mang theo của bạn: Dockerization là cần thiết để đào tạo và phục vụ mô hình kết quả. Kết hợp cải tiến thuật toán là trách nhiệm của bạn.
Bất kể lựa chọn thuật toán của bạn là gì, SageMaker trên AWS là một cách tiếp cận đáng để xem xét, dựa trên mức độ tập trung vào mức độ dễ sử dụng từ góc độ khoa học dữ liệu. Nếu bạn đã từng cố gắng di chuyển một dự án máy học từ môi trường địa phương sang một máy chủ lưu trữ, bạn sẽ ngạc nhiên khi thấy SageMaker liền mạch tạo ra nó như thế nào. Và nếu bạn đang bắt đầu từ đầu, bạn đã tiến gần hơn đến mục tiêu của mình, với bao nhiêu là trong tầm tay bạn.