Eric Kavanagh: Thưa quý vị và các bạn, xin chào và chào mừng bạn quay trở lại TechWise. Tên tôi là Eric Kavanagh. Tôi sẽ là người điều hành của bạn cho Tập 3. Đây là một chương trình mới mà chúng tôi đã thiết kế với bạn bè từ Techopedia, một trang web rất tuyệt vời tập trung vào công nghệ, và tất nhiên, tại The Bloor Group, chúng tôi tập trung khá nhiều vào doanh nghiệp Công nghệ. Vì vậy, phần mềm doanh nghiệp các loại và toàn bộ định dạng TechWise được thiết kế để cung cấp cho người tham dự của chúng tôi một cái nhìn thực sự tốt về một không gian cụ thể. Vì vậy, chúng tôi đã thực hiện Hadoop chẳng hạn, chúng tôi đã phân tích trong chương trình trước và trong chương trình cụ thể này, chúng tôi đang nói về tất cả về đám mây.
Vì vậy, nó được gọi là "Đám mây bắt buộc - Cái gì, ở đâu, khi nào và như thế nào." Chúng tôi sẽ nói chuyện với một vài nhà phân tích ngày hôm nay và sau đó là ba nhà cung cấp. Vì vậy, Qubole, Cloudant và Attunity là những nhà tài trợ cho chương trình hôm nay. Một lời cảm ơn lớn cho những người đã dành thời gian và sự quan tâm của họ ngày hôm nay và một lời cảm ơn lớn, tất nhiên, cho tất cả các bạn ngoài kia. Và hãy nhớ rằng là những người tham dự các chương trình này, bạn đóng một vai trò quan trọng. Chúng tôi muốn bạn đặt câu hỏi, tham gia, tương tác, cho chúng tôi biết suy nghĩ của bạn vì rõ ràng, toàn bộ mục đích của chương trình ở đây là để giúp các bạn hiểu những gì đang diễn ra ngoài kia trong thế giới điện toán đám mây.
Tầng bắt buộc trên đám mây
Vì vậy, hãy di chuyển ngay dọc. Người dẫn chương trình đầu tiên, người dẫn chương trình của bạn ở đó, Eric Kavanagh là tôi và sau đó chúng tôi có Tiến sĩ Robin Bloor gọi từ sân bay, như một vấn đề thực tế và người bạn tốt của chúng tôi Gilbert, Gilbert Van Cutsem, một nhà phân tích độc lập, cũng sẽ chia sẻ một vài suy nghĩ với bạn Sau đó, chúng tôi sẽ nghe từ Ashish Doesoo, CEO và đồng sáng lập của Qubole. Chúng ta sẽ được nghe từ Mike Miller, nhà khoa học trưởng tại Cloudant và cuối cùng là từ Lawrence Schwartz, Phó Giám đốc Tiếp thị tại Attunity. Vì vậy, chúng tôi có rất nhiều nội dung xếp hàng cho bạn ngày hôm nay.
Vì vậy, đám mây - phù hiệu từ trên cao - đây là một khái niệm đã đến với tôi vào một ngày khác khi tôi đang nghĩ về điều này. Thực sự, điện toán đám mây chỉ là rất lớn những ngày này. Ý tôi là, nó thực sự rất hấp dẫn để xem sự phát triển của công cụ này và một trong những ví dụ tôi thường đưa ra là trong chính công nghệ webcasting. Tất nhiên, những người quay số sớm đã nghe thấy một số thách thức kỹ thuật thú vị. Đó là một vấn đề với đám mây là nó thay đổi, định dạng thay đổi, tiêu chuẩn thay đổi, giao diện thay đổi và đôi khi khi bạn cố gắng kết nối hai khu vực khác nhau lại với nhau, bạn gặp một số khó khăn, bạn gặp một số rắc rối. Vì vậy, đây thực sự là một trong những điều đáng lo ngại với điện toán đám mây. Hãy cẩn thận về kiến trúc! Bạn có thể thấy điều đó ở điểm đạn cuối cùng.
Một trong những điều mà chúng tôi làm, giống như một lưu ý phụ ở đây, đối với webcast của chúng tôi, chúng tôi có một nhà cung cấp hội nghị điện thoại riêng. Sau đó, chúng tôi sử dụng WebEx. Chúng tôi không sử dụng âm thanh WebEx bởi vì thật lòng mà nói, một lần chúng tôi đã sử dụng âm thanh WebEx nhiều năm trước và nó bị hỏng và bị đốt cháy theo cách khó chịu nhất. Vì vậy, chúng tôi không sẵn sàng để chạy rủi ro đó một lần nữa. Vì vậy, chúng tôi sử dụng công ty thu âm của riêng mình có tên Arkadin như một vấn đề thực tế và chúng tôi kết hợp với nhau, trong thời gian thực, tất cả các giải pháp khác nhau này. Và ý tưởng là sau đó chúng tôi có thể gửi email cho bạn bằng một ứng dụng email riêng với các slide trong trường hợp, ví dụ, WebEx sẽ bị sập, chúng tôi nói với bạn tất cả để quay số, chúng tôi sẽ gửi email cho bạn các slide và chỉ cần đi qua nó nhiều hơn hoặc ít hơn mà không có loại môi trường WebEx. Vì vậy, cách mà bạn có thể giải quyết các loại vấn đề này, nhưng các loại vấn đề này ở khắp mọi nơi.
Nhưng, có rất nhiều lợi ích cho đám mây. Rõ ràng, đó là một rào cản thấp để gia nhập, rõ ràng bạn có thể nhìn vào con đẻ của điện toán đám mây là salesforce.com, điều này chỉ cách mạng hóa kinh doanh, cụ thể là tự động hóa lực lượng bán hàng, rõ ràng. Nhưng, sau đó bạn đã có những thứ như Marketo và iContact và Constant Contact và sailthru và, trời ơi, về mặt tiếp thị và tự động hóa bán hàng, có hàng tấn công cụ, nhưng đó không phải là tất cả. Nhân sự đang đưa nó vào toàn bộ trò chơi đám mây, phân tích là trong trò chơi đám mây. Hãy nhìn vào công ty ít được biết đến ngoài Amazon Web Services, những gì họ đang làm với điện toán đám mây - nó thật lớn. Và tôi đã nghe một câu nói hay vào một ngày khác từ một anh chàng chúng tôi làm việc rất nhiều với David, người hiện đang làm việc tại Cisco, như một vấn đề thực tế, công ty đã mua WebEx. Không chắc họ đã đầu tư nhiều như tôi muốn họ có trong WebEx, nhưng đó không thực sự là quyết định của tôi, phải không? Tuy nhiên, anh ấy ở Cisco những ngày này và anh ấy đã có một câu trích dẫn rất hài hước, vui nhộn và đó là "không có một đám mây, có nhiều đám mây" và điều đó hoàn toàn chính xác. Có rất nhiều và rất nhiều đám mây ngoài kia. Trong thực tế, mỗi nhà cung cấp đám mây là đám mây của riêng mình. Vì vậy, một trong những thách thức ngày nay là kết nối đám mây, phải không? Nếu bạn là lực lượng bán hàng, chẳng có gì tốt đẹp khi kết nối trực tiếp với iContact và Liên hệ liên tục và với LinkedIn, chẳng hạn, và có thể với Twitter và các môi trường khác, các đám mây khác ngoài đó chỉ cố định các giải pháp kinh doanh phù hợp với bạn và công ty của bạn.
Vì vậy, đây là một số vấn đề cần lưu ý, nhưng đám mây vẫn ở đây. Chỉ cần biết rằng về điều đó, phần mềm tại chỗ là ở đây để ở lại. Vì vậy, những gì chúng ta phải tìm ra trong doanh nghiệp hoặc bất kỳ doanh nghiệp vừa và nhỏ nào, làm thế nào để bạn xác định kiến trúc của mình và duy trì nó để bạn có thể tận dụng đám mây mà không tạo ra một người khổng lồ nào đó ngoài tầm kiểm soát của bạn? Vì vậy, rõ ràng toàn bộ ngành lưu trữ dữ liệu phát triển xung quanh nhu cầu củng cố thông tin quan trọng để phân tích thông tin đó và đưa ra quyết định tốt hơn.
Chà, giờ thì Amazon Web Services đã có Redshift. Đó là một trong những webcast lớn nhất chúng tôi từng làm là với Redshift. Đó là một vấn đề khá lớn. Họ đang thay đổi động lực, họ đang thay đổi cấu trúc giá cả. Bạn có thể xem khi giá của bạn giảm khi cấp phép phần mềm doanh nghiệp truyền thống một phần vì điện toán đám mây và một phần vì những người này ở ngoài đó hạ thấp điểm giá, gây áp lực lên giá. Vì vậy, đó là tin tốt cho người dùng cuối. Đó là điều cần lưu ý chắc chắn cho bất cứ ai ngoài kia đang cố gắng sử dụng một số công nghệ này. Vì vậy, đó là điều cần lưu ý và chúng tôi sẽ nói về điều đó ngày hôm nay trong chương trình.
Vì vậy, nhà phân tích Tiến sĩ Robin Bloor sẽ là nhà phân tích đầu tiên của chúng tôi trong ngày. Vì vậy, tôi sẽ đi trước và đẩy slide đầu tiên của anh ấy và đưa chìa khóa cho anh ấy. Robin, tôi nghĩ bạn đang ở đây, một nơi nào đó. Và với điều đó tôi sẽ xử lý nó, và sàn là của bạn!
Tiến sĩ Robin Bloor: Được rồi, Eric. Cảm ơn vì lời giới thiệu đó. Tôi đã tình cờ gặp một vài ngày trước, tôi đã đi qua một cuộc khảo sát về người tiêu dùng, thực tế, đã đặt câu hỏi - bạn có nghĩ rằng thời tiết bão tố cản trở điện toán đám mây? Và hơn 50 phần trăm trong số họ nói có. Tôi chỉ nghĩ rằng tôi sẽ cho bạn biết rằng nó không, nếu bạn là một trong những người tin vào điều đó. Và sau đó, điều đó hơi giống như tin rằng, bạn biết đấy, khi bạn có tuyết trên tivi là vì trời đang có tuyết.
Đám mây, bạn biết đấy, một trong những điều đó là loại, bạn biết, một điều quan trọng, nếu bạn thích, chi tiết đơn giản của đám mây là đám mây thực sự là một trung tâm dữ liệu theo cách này hay cách khác, hoặc bất kỳ dịch vụ đám mây cụ thể nào một trung tâm dữ liệu. Điều duy nhất là, đó là một trung tâm dữ liệu khác với đám mây truyền thống. Vì vậy, tôi sẽ nói một cách tổng quan về đám mây để sao lưu của bạn đi sâu vào chi tiết hơn về việc sử dụng đám mây vì không có điểm nào trong cùng một mặt bằng.
Vì vậy, điểm đầu tiên mà tôi muốn đưa ra là đám mây đó là một dịch vụ, bạn biết không? Và một trong những điều thực sự xảy ra vì điện toán đám mây là có … à, tôi gọi là cái chết của các thương hiệu, cả loạt thương hiệu phần mềm có sức mạnh khủng khiếp và tiếp tục có sức mạnh trong điện toán doanh nghiệp. Một khi bạn lên đám mây, họ không còn nhiều sức mạnh nữa, bạn biết không? Khi bạn mua dịch vụ đám mây, bạn quan tâm đến ứng dụng, tất nhiên, bạn quan tâm đến mức độ dịch vụ mà đám mây sẽ cung cấp cho bạn, bạn không muốn dịch vụ đám mây thất bại thường xuyên, bạn quan tâm đến chi phí sử dụng và bạn quan tâm đến những điều này điều này là vì đây là một dịch vụ, nhưng điều bạn không quan tâm nữa là bạn không quan tâm phần cứng đang chạy trên phần nào, bạn không quan tâm công nghệ mạng là gì, bạn không quan tâm hệ điều hành là gì Nó đang chạy, bạn không quan tâm hệ thống tệp là gì, thậm chí bạn không quan tâm cơ sở dữ liệu là gì và thực sự được sử dụng cụ thể bởi bất kỳ dịch vụ cơ sở dữ liệu cụ thể nào trên đám mây, bạn biết không? Và tác động của điều đó theo cách này là đám mây là rất nhiều thương hiệu phần mềm không có giá trị thực sự trên đám mây bởi vì, bạn biết đấy, bạn đi vào đám mây bằng cách này hay cách khác cho một thứ gì đó là dịch vụ chứ không phải là một dịch vụ nữa sản phẩm. Vì vậy, tôi nghĩ rằng tôi có thể thực hiện một vài lý do để không sử dụng đám mây, bạn biết đấy, và đây là tất cả, nếu bạn muốn, bạn biết, những lý do đơn giản, đẫm máu, nhưng ai đó phải nêu ra, vì vậy, tôi nghĩ rằng tôi sẽ.
Vì vậy, lý do không cho tôi … không sử dụng đám mây - nếu họ không thể cung cấp loại dữ liệu và quản trị quy trình mà bạn muốn, bạn biết, đơn giản là nó không đáp ứng tiêu chí của bạn. Nếu họ không thể cung cấp cho bạn hiệu suất mà bạn muốn, nó sẽ không đáp ứng các tiêu chí. Nếu đám mây mang đến cho bạn sự linh hoạt về cách bạn có thể di chuyển mọi thứ xung quanh thì nó sẽ không đáp ứng tiêu chí. Đó chỉ là lý do rõ ràng tại sao các dịch vụ đám mây cụ thể sẽ không phù hợp với rất nhiều người ngoài việc làm máy tính doanh nghiệp.
Bạn có thể không làm điều đó bởi vì bạn có thể làm nó rẻ hơn. Đám mây không phải lúc nào cũng là lựa chọn rẻ nhất. Một số người dường như nghĩ bởi vì nó thường là một lựa chọn rẻ tiền, nó sẽ luôn rẻ hơn, nó không phải lúc nào cũng rẻ hơn. Và một điều nữa là nếu bạn đang sử dụng một ứng dụng từ đám mây, nó không tích hợp tốt với những gì bạn đang làm, thì có lẽ bạn sẽ không tiếp tục với nó và đó là những lý do để bạn từ chối .
Dưới đây là những lý do để áp dụng. Bạn biết đấy, một trong những điều bạn có thể làm trong đám mây, chống đạn khá nhiều, là hoạt động tạo mẫu. Nếu bạn có thể tạo nguyên mẫu trên đám mây và triển khai trong trung tâm dữ liệu, điều đó hoàn toàn khả thi và có rất nhiều người làm điều đó. Bạn có thể tải lên công việc từ trung tâm dữ liệu với các ứng dụng không quan trọng bởi vì chúng có thể, bạn sẽ có thể tìm thấy một số loại dịch vụ đám mây đáp ứng cấp độ dịch vụ của bạn cho các công cụ không chính xác. Và bạn có thể tải lên các ứng dụng cụ thể như salesforce.com và các dịch vụ tương tự với điều đó, bạn biết đấy, các ứng dụng tiêu chuẩn. Mọi người đều có khả năng trong lĩnh vực đó và lĩnh vực này không chuyên biệt và, bạn biết đấy, truyền thống … bất cứ thứ gì có sẵn trên đám mây có lẽ sẽ là thứ bạn đi cùng.
Vì vậy, điều cuối cùng mà tôi muốn nói, đó là một điều thú vị, thực sự, là khi bạn thực sự tìm kiếm đám mây, một cách hiểu chỉ là một loạt các nền kinh tế có quy mô. Toàn bộ vấn đề là, bạn biết đấy, điều hành một trung tâm dữ liệu ngoài đó và bạn sẽ quay số vào trung tâm dữ liệu đó từ nơi này hay nơi khác và sử dụng nó và do đó, sẽ tốt hơn, tốt hơn là ở chính rẻ hơn nếu bạn tự làm Vì vậy, bạn biết đấy, đó thực sự là tất cả về quy mô kinh tế.
Các nhà cung cấp đám mây, họ chọn vị trí trung tâm dữ liệu và nơi tốt nhất để xác định vị trí trung tâm dữ liệu nằm ngay bên cạnh một nhà máy điện và đặc biệt là ngay bên cạnh một nhà máy điện rẻ tiền. Vì vậy, một nhà máy điện ở phía bắc tình cờ là thủy điện hoặc đại loại như thế. Nó thường là rẻ nhất, bạn biết không? Bạn thực sự có thể định vị trung tâm dữ liệu ở đó và bạn sẽ thấy nó dễ dàng hơn. Việc thuê người ở những địa điểm như vậy ít tốn kém hơn so với ở trung tâm New York hoặc San Francisco. Bạn có thể tiêu chuẩn hóa toàn bộ cơ sở về điều hòa không khí và năng lượng. Điều đó sẽ giúp bạn tiết kiệm rất nhiều bởi vì điều đó có nghĩa là, bạn biết đấy, bạn có thể cung cấp toàn bộ tòa nhà cho nó và đó chính xác là tất cả những gì các nhà khai thác đám mây làm. Họ chuẩn hóa phần cứng mạng, họ chuẩn hóa phần cứng máy tính họ sử dụng, thông thường là bảng x86, thường họ sẽ tự lắp ráp chúng. Vì vậy, một số thậm chí đang thực sự xây dựng toàn bộ. Họ sẽ sử dụng phần mềm Amazon mà họ có thể bởi vì nó thực sự có nghĩa là không mất phí khi áp dụng nó. Họ sẽ chuẩn hóa trong tất cả các phần mềm. Vì vậy, họ sẽ không bao giờ nâng cấp bất cứ thứ gì ngoại trừ nâng cấp tất cả cùng một lúc. Họ sẽ tổ chức hỗ trợ. Vì vậy, họ sẽ trả tiền hỗ trợ cho vô số nhà cung cấp khác nhau chỉ có cơ sở hỗ trợ riêng. Họ sẽ, có khả năng mở rộng và mở rộng theo nghĩa là họ sẽ chạy nhiều hơn bạn từng chạy loại dịch vụ đó và họ sẽ giám sát việc sử dụng của họ theo cách mà hầu hết các trung tâm dữ liệu không thể vì họ là loại chỉ chạy một dịch vụ được tiêu chuẩn hóa, nhưng hầu hết các trung tâm dữ liệu đang chạy một loạt các thứ. Và đó thực sự là những gì đám mây hướng đến, và theo một cách nào đó, có thể xác định liệu nó có làm bạn quan tâm hay liệu nó không dành cho bất kỳ ứng dụng cụ thể nào. Vì vậy, bạn biết đấy, loại quy tắc thô sơ của tôi là nếu kinh tế theo quy mô có thể, đám mây sẽ chiếm lĩnh sớm hay muộn. Nhưng, cách đổi mới và linh hoạt và những điều rất cụ thể mà bạn tự mình thực sự không thể. Đám mây luôn luôn tốt thứ hai.
Được chứ. Hãy để tôi đưa nó lại cho Eric, hoặc cho Gilbert.
Eric Kavanagh: Được rồi, Gilbert, tôi sẽ đưa cho bạn các khóa ở đây để WebEx. Đứng gần. Chỉ cần nhấp vào bất cứ nơi nào trên slide đó và sử dụng mũi tên xuống trên bàn phím của bạn.
Gilbert Van Cutsem: Tôi nghĩ rằng tôi đang kiểm soát.
Eric Kavanagh: Bạn đang kiểm soát.
Gilbert Van Cutsem: Được rồi. Chúng ta đi đây. Đám mây bắt buộc - bầu trời là giới hạn, nó là một huyền thoại đô thị, hay bạn sẽ nghĩ gì về nó? Đây chỉ là một vài cuộc nói chuyện và những điều cần xem xét.
Đầu tiên, từ mặt trận "cái gì", như chúng ta đều biết, tôi không nghĩ có ai nghi ngờ điều này. SaaS-ification vẫn ở đây vì phần mềm thực sự không bao giờ chết, nó chỉ đơn thuần chuyển sang đám mây, phải không? Tôi nghĩ rằng tôi đã nói điều này trước đây trong phiên bản trước của điều này. Ồ không, hoặc Eric đã nói điều đó với tôi trong phiên bản trước. Và tôi nghĩ lý do rõ ràng, và điều này cũng quay trở lại với Robin theo một cách nào đó, đó là về mặt công ty, dòng thời gian của công ty khá dễ dàng. CMO luôn cần tất cả và anh ấy cần nó ngay bây giờ. Vì vậy, anh ấy là tất cả về thời gian để thị trường. Thật đáng buồn, đó là một cái cớ tốt cho điều đó theo cách của anh ta. Tuy nhiên, CIO hơi lo lắng về SaaS và các đám mây bởi vì, bạn biết đấy, toàn bộ vấn đề co giãn có nghĩa là những gì đi lên cũng phải đi xuống. Bạn phải sẵn sàng để thu nhỏ lại, nhưng cũng để thu nhỏ lại. Vì vậy, anh hơi lo lắng về điều đó. CFO không lo lắng, không nhiều hơn bình thường, nhưng anh ta nói, "Này, đây là … điều này sẽ khiến chúng ta quay lại bao nhiêu?" Đó là, bạn biết đấy, chi tiêu vốn khét tiếng so với thảo luận của OPEX. Nó khá cũ, nhưng nó rất, bạn biết đấy, rất quan trọng trong thế giới này. Và sau đó, cuối cùng nhưng không kém phần quan trọng, là CEO, tất nhiên. Anh ta nói, "Ồ! Giảm thiểu rủi ro! Các bạn, các bạn đều rất phấn khích, nhưng chúng ta đã sẵn sàng cho việc này chưa?" Bởi vì rủi ro là những gì anh ấy nghĩ về.
Vậy, rủi ro là gì? Chỉ là một vài suy nghĩ, phải không? Chúng ta đang làm việc ở đây với sự lãnh đạo tư tưởng, nhưng trong một con đường còn dang dở bởi vì đây là tất cả những thứ khá mới, tất cả những thứ khá gần đây. Chúng tôi không có nhiều điểm dữ liệu, thực sự, nếu bạn nghĩ về nó. Và vì vậy, về mặt rủi ro, chúng tôi cũng phải đối phó với việc lên máy bay, bạn biết đấy, mọi người ký thỏa thuận như sau, "Vâng, đó là những gì chúng tôi muốn, con đường để đi", họ đăng ký, nhưng sau đó Như thế là không đủ. Bạn biết đấy, bạn phải ở trên tàu và đó, nhớ những bộ phim? Quay trở lại với bản dịch, đó là một chút về, bạn biết đấy, những gì trên máy bay là tất cả về. Và sau đó, như Robin vừa nói, bạn biết đấy, tại chỗ không nhất thiết phải đi ngay lập tức. Vì vậy, bạn phải tích hợp cả hai thế giới. Đó là một thế giới lai. Và vì vậy, làm thế nào bạn sẽ làm điều đó? Đó là 80-20, quy tắc Pareto 80-20, có ổn không? Như vậy đã đủ tốt chưa? Và sau đó rác vào / đổ rác khi bạn kết nối các hệ thống. Được không Có bền không? Bởi vì, bạn biết đấy, bạn sẽ di chuyển, bạn sẽ ánh xạ doanh nghiệp của mình đến hệ thống gốc, bạn sẽ làm điều đó như thế nào? Và điều cuối cùng, mà tôi nghĩ là vô cùng quan trọng, là kiến trúc đa tầng, nghĩa là sự riêng tư dữ liệu trên dữ liệu của bạn, đôi khi nó được gọi là "sở hữu dữ liệu của riêng bạn", bạn biết không? Một trăm người sử dụng cùng một hệ thống, một cơ sở dữ liệu nằm bên dưới hệ thống, ai sẽ thấy dữ liệu của tôi? Chỉ tôi thôi phải không? Bạn có chắc chắn về điều đó? Bảo mật dữ liệu, bảo mật dữ liệu giúp các chuyên gia. Nếu bạn là CIO, nó sẽ mang lại "Tôi" vào CIO vì bây giờ bạn chịu trách nhiệm về thông tin. Điều đó khá thú vị nếu bạn là một CIO.
Vì vậy, hãy nói một chút về "tại sao." Vì vậy, ý định chiến lược của tất cả những điều này là rất, rất đơn giản, tôi nghĩ vậy. Nếu bạn là một thuê bao, có áp lực thị trường. Nếu bạn là một nhà cung cấp, có áp lực cạnh tranh. Nếu bạn có đồng nghiệp, có áp lực ngang hàng. Nếu bạn là một thuê bao, đó chỉ là tâm lý thị trường. Mọi người đều muốn lên đám mây, SaaS hoặc bất cứ điều gì bạn gọi nó, đám mây SaaS, tất cả chúng ta đều cần và muốn đến đó. Và lý do thường là tài chính. Đó là lý do rõ ràng, nhưng nếu bạn nghĩ về khía cạnh tài chính, bạn sẽ hiểu được điều mà tôi gọi là nghịch lý hóa đơn so với ngân sách. Bạn sẽ đăng ký, các hệ thống hoàn toàn có thể ăn, 50 đô la, 500 đô la một tháng hoặc một cái gì đó tương tự, hoặc bạn mơ ước về việc sử dụng dựa trên để bạn chỉ trả tiền cho những gì bạn thực sự sử dụng? Và như vậy, làm thế nào là đi làm, sử dụng, dựa trên tiêu dùng? Bạn sẽ đo tất cả những thứ đó? Nó có thể sẽ không xảy ra ngay lập tức. Vì vậy, bạn sẽ kết thúc với một cơ chế lai, đó là, tôi trả 200 mỗi tháng và đôi khi có thể là 500 vì tôi phải trả cho việc tiêu thụ thêm. Retainer Plus, theo tôi, có lẽ nó sẽ đi.
Nhưng, cũng có một cái gì đó mà tôi gọi là mục đích ẩn giấu trên mặt trận rộng, và tôi tin rằng, bạn biết đấy, điều này là hoàn toàn có thật. Đó là sự thay đổi quyền kiểm soát, đó là CIO so với CMO, sự thay đổi quyền lực hoặc cuộc đấu tranh quyền lực giữa CMO, "Tôi muốn tất cả và tôi muốn ngay bây giờ", và CIO, người nói như: "Này, đây là tất cả Tôi đã từng chạy, 20 năm trước, tất cả là về các hệ thống phần cứng. Mười năm trước đây là về các ứng dụng. Ngày nay, tất cả là về dữ liệu. Và vì tôi là CIO - thông tin - tất cả là về tôi. Tôi đang kiểm soát. " Vì vậy, đó là loại thay đổi quyền lực hoặc đấu tranh quyền lực mà tôi tin rằng đang diễn ra ngay bây giờ giữa hai người này, CMO và CIO.
Vì vậy, cuối cùng, đây là tất cả quá trẻ mà không ai thực sự biết nếu chúng ta đang ở trong loại môi trường đổi mới hoặc trong loại môi trường chấp nhận sớm. Tôi tin rằng chúng ta đang ở trong môi trường chấp nhận sớm, không phải là đa số sớm, chỉ là người chấp nhận sớm, nhưng, bạn biết đấy, loại nửa chừng. Và vì vậy, bạn biết, đối với khách hàng, người dùng cuối, người đăng ký, đây là về việc bắt đầu vì CMO muốn bắt đầu, phải không? Và vì vậy, điều quan trọng là không kết thúc với những gì chúng ta gọi là lợi nhuận giảm dần. Việc bắt đầu hạn chế có thể dẫn đến lợi nhuận giảm dần. Đó là lý do tại sao nó cực kỳ quan trọng, bạn biết, tìm, tin tưởng các bên có thể đảm bảo rằng một điểm thất bại không phải là vấn đề và bảo mật dữ liệu được tôn trọng. Vì vậy, nó sẽ đòi hỏi khá nhiều quản lý thay đổi. Và cuối cùng - gần như đã hoàn thành, đây là slide cuối cùng - chúng ta sẽ làm điều này như thế nào? Làm thế nào để di chuyển lên đám mây, di chuyển đến SaaS sẽ diễn ra, bạn biết đấy, liền mạch và dễ dàng? Vâng, bằng cách làm hai điều: chú ý - cung cấp - thực sự quan trọng, và trên máy bay, thậm chí còn quan trọng hơn.
Eric Kavanagh: Được rồi …
Gilbert Van Cutsem: Và trong trường hợp đó, bầu trời là giới hạn. Cảm ơn bạn.
Eric Kavanagh: Vâng. Điều đó thật tuyệt. Tôi yêu những ý tưởng rất khiêu khích, tôi thích cái cách mà bạn phá vỡ tất cả. Tôi nghĩ rằng điều đó rất có ý nghĩa. Và hãy tiếp tục và đẩy slide đầu tiên của Ashish và tôi sẽ trao chìa khóa cho WebEx cho bạn, Ashish. Sao đi trước. Chỉ cần nhấp vào bất cứ nơi nào trên slide đó và sử dụng mũi tên xuống trên bàn phím của bạn. Có bạn đi.
Ashish Doesoo: Được rồi. Cảm ơn, Eric. Xin chào mọi người, đây là Ashish và tôi sẽ kể cho bạn nghe về Qubole. Vì vậy, chỉ để bắt đầu, Qubole, về cơ bản, nó cung cấp dữ liệu lớn như một nền tảng dịch vụ. Đó là một nền tảng dựa trên đám mây được lưu trữ trên đám mây Amazon và đám mây Google và chúng tôi cung cấp công nghệ như Hadoop, Hive, Presto và một loạt các nền tảng khác mà tôi sẽ nói về, tất cả theo cách chìa khóa trao tay để khách hàng của chúng tôi có thể thoát khỏi tất cả sự nhầm lẫn trong thế giới cơ sở hạ tầng dữ liệu lớn hoặc thoát khỏi việc vận hành một cơ sở hạ tầng này và thực sự tập trung nhiều hơn vào dữ liệu của họ và các biến đổi mà họ muốn thực hiện trên dữ liệu của họ. Vì vậy, đó là những gì Qubole nói về tất cả.
Về mặt lợi ích hữu hình, một cách nghĩ về Qubole, tất nhiên, đó là một chìa khóa trao tay, nền tảng tự phục vụ để phân tích dữ liệu lớn và tích hợp dữ liệu lớn được xây dựng xung quanh Hadoop, nhưng về cơ bản hơn, đó là gì biết rằng, đối với tất cả các công cụ dữ liệu lớn như Hadoop, Hive, Presto, Spark, Chartly, v.v., nó mang lại tất cả lợi ích của đám mây cho các công cụ dữ liệu lớn này và một số biểu hiện chính mà nó mang lại từ Quan điểm của đám mây là, bạn biết đấy, làm cho cơ sở hạ tầng thích ứng và bằng cách thích nghi, ý tôi là cả nhanh nhẹn cũng như linh hoạt với khối lượng công việc đang chạy trên bất kỳ động cơ nào và cũng làm cho các động cơ này tự phục vụ và hợp tác nhiều hơn theo nghĩa, bạn biết đấy, Qubole cung cấp các giao diện nơi bạn có thể sử dụng các công nghệ cụ thể này không chỉ cho sự phát triển của mình hoặc, bạn biết, các tác vụ hướng đến nhà phát triển, mà ngay cả các nhà phân tích dữ liệu khác của bạn cũng có thể bắt đầu nhận được lợi ích của các công nghệ này để tự phục vụ giao diện.
Chúng tôi nhận được rất nhiều, bạn biết, liên quan đến vấn đề cụ thể này, bạn biết, webinar, bạn biết đấy, đây là một trong những quan điểm của chúng tôi về lợi ích của đám mây mà Qubole mang lại cho dữ liệu lớn. Vì vậy, nếu bạn chỉ so sánh giữa cách bạn chạy, hãy nói, Hadoop và để nó hoạt động trong một cài đặt tại chỗ, trong một cài đặt tại chỗ, bạn luôn nghĩ về các cụm tĩnh, bạn biết đấy, bạn đã sửa các cụm, bạn có thể định cỡ chúng theo mức sử dụng cao nhất của bạn và bạn giữ chúng ở đó và sau đó nếu bạn phải thay đổi chúng thì bạn phải trải qua toàn bộ quá trình mua sắm, triển khai, thử nghiệm, v.v. Qubole thay đổi bằng cách tạo các cụm hoàn toàn theo yêu cầu, các cụm của chúng tôi hoàn toàn co giãn, chúng tôi sử dụng các đối tượng được lưu trữ từ đám mây để thực sự lưu trữ dữ liệu và các cụm xuất hiện và, bạn biết, chúng xuất hiện trên cơ sở nhu cầu được tạo ra bởi Người dùng và họ biến mất khi không có nhu cầu. Vì vậy, điều này làm cho cơ sở hạ tầng đó nhanh nhẹn và linh hoạt hơn và thích ứng với khối lượng công việc của bạn.
Một ví dụ khác về tính linh hoạt là, bạn biết đấy, hôm nay bạn có thể đã tạo các cụm tĩnh của mình ở đây, bạn biết đấy, với một khối lượng công việc nhất định và nếu khối lượng công việc của bạn thay đổi và cơ sở hạ tầng của bạn bây giờ cần được nâng cấp, có thể bạn cần thêm bộ nhớ trên máy của mình và những điều như thế. Một lần nữa, bạn biết đấy, làm điều này trên đám mây thông qua Qubole chẳng hạn, làm cho điều đó trở nên đơn giản. Bạn luôn có thể thuê các loại máy mới, khác nhau và, bạn biết, nhận các cụm, cụm 100 nút và chạy trong vài phút, trái với vài tuần mà bạn phải đợi Hadoop tại chỗ.
Một điều quan trọng khác mà Qubole khác biệt với tại chỗ là Qubole về cơ bản là một dịch vụ cung cấp, vì vậy tất cả các công cụ và cơ sở hạ tầng mà bạn cần để tích hợp dịch vụ, bạn không phải … Bất cứ nơi nào tại chỗ, bạn biết, chủ yếu là bạn sử dụng phần mềm, bạn phải tự chạy nó, bạn phải tự tích hợp nó và thực hiện tất cả những lợi ích đó, tất cả những lợi ích của mô hình SaaS là đầu mối, bạn biết đấy, làm thế nào Qubole cung cấp dữ liệu lớn thay vì tự chạy Hadoop tại chỗ.
Slide này thường bao gồm kiến trúc của chúng tôi. Tất nhiên, chúng tôi dựa trên đám mây, chúng tôi lưu trữ dữ liệu của chúng tôi trên các đối tượng trong đám mây trên đám mây, Google cloud và Google Compute Engine hoặc Amazon Web Services. Chúng tôi thực hiện tất cả các dự án hệ sinh thái Hadoop và xung quanh đó, chúng tôi đã phát triển IP chính xung quanh quy mô tự động và tự quản lý, chúng tôi đã thực hiện rất nhiều tối ưu hóa đám mây để làm cho các công nghệ thành phần này hoạt động thực sự tốt trên đám mây, như bạn biết, cơ sở hạ tầng đám mây là rất khác với việc chỉ chạy mọi thứ trên kim loại trần và toàn bộ kết nối dữ liệu để cho phép dữ liệu được di chuyển vào và ra khỏi nền tảng này. Vì vậy, điều đó so sánh nền tảng đám mây và điều đó cho phép, bạn biết đấy, đó là một chìa khóa … tính năng chính là cách tạo ra tất cả các dịch vụ tự phục vụ để bạn không cần phải có … bạn không Chúng tôi có một dấu chân hoạt động rất lớn trong khi chạy cái này, nhưng chúng tôi buộc nó cùng với bàn làm việc dữ liệu của chúng tôi cho dù đây là những công cụ dành cho nhà phân tích, cho dù đây là những công cụ quản trị dữ liệu, cho dù đây là những công cụ tạo khuôn mẫu, v.v. có thể mang lại lợi ích của công nghệ này, không chỉ cho các nhà phát triển, mà cả những người dùng doanh nghiệp khác và doanh nghiệp. Và tất nhiên, chúng tôi cũng liên kết nền tảng đám mây này với các công cụ mà mọi người có thể đã sử dụng cho dù đó là những công cụ sử dụng hay chỉ là Tableau hoặc liệu họ có đang sử dụng loại sản phẩm lưu trữ dữ liệu như Redshift và Vv và Vv.
Ngày nay, dịch vụ đang hoạt động ở quy mô khá lớn, chúng tôi xử lý thực sự gần 40 petabyte dữ liệu mỗi tháng trên cơ sở khách hàng của chúng tôi. Các cụm của chúng tôi có kích thước khác nhau từ cụm 10 nút đến cụm 1500 nút và, bạn biết đấy, về phạm vi quy mô mà chúng tôi có thể xử lý và lớn hơn, theo hiểu biết tốt nhất của tôi, chúng tôi có thể chạy một số lớn nhất các cụm trên đám mây liên quan đến Hadoop và chúng tôi xử lý khoảng 250.000 máy ảo trong một tháng trên các cụm của chúng tôi. Hãy nhớ rằng, mô hình của chúng tôi là các cụm theo yêu cầu, có lợi ích to lớn về việc giảm khối lượng công việc hoạt động của bạn cũng như cải thiện của bạn và vv.
Cuối cùng, bạn biết, một trong số chúng tôi, bạn biết, đây chỉ là một ví dụ về cách Qubole đã được chuyển đổi cho các công ty khác nhau. là một ví dụ về khách hàng của chúng tôi. Họ đã ở trên đám mây, ví dụ, họ đang chạy Elastic MapReduce trên đám mây và việc sử dụng dữ liệu ở đó khá hạn chế. Họ sẽ có khoảng 30 người dùng lẻ có thể sử dụng công nghệ đó. Với Qubole, họ đã có thể mở rộng điều đó đến hơn 200 người dùng lẻ trong công ty đã thấy sự mở rộng của các trường hợp sử dụng dữ liệu lớn và nó thực sự mang lại, bạn biết đấy, cái mà chúng ta gọi là định nghĩa của một nền tảng dữ liệu lớn nhanh nhẹn và đó là nó thực sự trở thành trọng tâm của rất nhiều khối lượng công việc phân tích của họ.
Vì vậy, chỉ cần đóng lại, bạn biết đấy, đó là một đoạn tóm tắt ngắn gọn về Qubole. Về cơ bản, tầm nhìn của chúng tôi là cách chúng tôi tạo ra các doanh nghiệp nhanh nhẹn hơn với dữ liệu lớn và về cơ bản, chúng tôi tận dụng lợi ích của đám mây và mang lại cho họ các công nghệ dữ liệu lớn xung quanh Hadoop để khách hàng của chúng tôi có thể tận dụng những lợi ích của sự nhanh nhẹn và những lợi ích đó về tính linh hoạt và những lợi ích của bản chất tự phục vụ trên đám mây để trở nên hiệu quả hơn nhiều đối với nhu cầu dữ liệu của họ. Vì vậy, tôi sẽ dừng lại ở đó và trao lại cho Eric.
Eric Kavanagh: Được rồi. Nghe có vẻ hay và bây giờ, tôi sẽ trao nó cho Mike Miller của Cloudant. Mike, tôi đang đưa cho bạn chìa khóa ngay bây giờ. Chỉ cần nhấp vào slide, ở đây bạn đi. Mang nó đi.
Mike Miller: Có vẻ như tôi có chìa khóa. Vì vậy, tôi sẽ xin lỗi. Tôi đã mất … Tôi nghĩ rằng tôi đã quên gửi một số phông chữ với bài thuyết trình của mình. Vì vậy, hy vọng bạn có thể nhìn qua đó và tưởng tượng nó thật đẹp. Nhưng, vâng, điều này thật thú vị. Tôi đã có một danh sách dài ở đây, những điều khiêu khích mà tôi nghe rằng tôi đã viết ra rằng tôi rất muốn quay lại với bạn trong bảng điều khiển. Vì vậy, tôi sẽ cố gắng vượt qua điều này một cách nhanh chóng.
Vì vậy, tôi sẽ bắt đầu bằng Cloudant. Cloudant là một cơ sở dữ liệu như một dịch vụ, nhà cung cấp đám mây của chúng tôi và thực sự, tôi thậm chí không có logo mới. Chúng tôi đã được IBM mua lại cách đây không lâu. Và vì vậy, chúng tôi … Tôi sẽ nói về dịch vụ của chúng tôi và đặc biệt tập trung vào việc cố gắng làm cho người dùng và khách hàng của chúng tôi nhanh nhẹn theo một cách khá khác so với người nói trước.
Cloudant cung cấp cơ sở dữ liệu dưới dạng dịch vụ và các dịch vụ liên quan đến dữ liệu khác cho những người xây dựng ứng dụng. Vì vậy, chúng tôi tham gia trực tiếp với các nhà phát triển và chúng tôi tập trung vào dữ liệu vận hành hoặc OLTP trái ngược với các phân tích mà chúng tôi đã nghe từ Ashish trước đây. Và vấn đề thực sự là, toàn bộ giá trị của Cloudant, có thể được chia nhỏ để giúp người dùng của chúng tôi làm được nhiều hơn và do đó, xây dựng nhiều ứng dụng hơn, phát triển hơn và ngủ nhiều hơn. Tôi sẽ nói về họ một cách chi tiết, nhưng ý tưởng chung ở đây là nếu bạn là người dùng, bạn biết đấy, bạn đang ở trong một doanh nghiệp kinh doanh, bạn đang xây dựng một ứng dụng mới, thêm một tính năng vào ứng dụng hoặc web hiện có khởi động di động, bạn nên tập trung vào năng lực cốt lõi của mình. Và trước đây, có thể cho đến một thập kỷ trước, CNTT là một sự khác biệt, bạn biết đấy, cạnh tranh, xin lỗi, thiệt hại cạnh tranh thậm chí chạy một cơ sở dữ liệu tốt để trở thành một lợi thế cạnh tranh. Thật nhẹ nhõm vì những ngày đó đã qua! Và vì vậy, cách chúng tôi thực sự cố gắng làm việc với người dùng của mình là khuyến khích họ sử dụng các dịch vụ tổng hợp, mô đun, có thể tái sử dụng, có thể kết hợp với ý tưởng giúp giảm thời gian tiếp thị, tăng khả năng mở rộng. Và ý tưởng tổng thể ở đây là đám mây không chỉ, bạn biết đấy, một thứ mới được đẩy vào người dùng, nó thực sự là một thị trường … đó là một sự phát triển thị trường bởi vì cách mọi người xây dựng ứng dụng, tiêu thụ ứng dụng, thiết bị mà họ đang chạy và quy mô dữ liệu thay đổi hoàn toàn trong 5-10 năm qua. Điều đó thực sự nhấn mạnh kiến trúc ứng dụng hiện có để xây dựng ứng dụng cũng như xử lý khối lượng công việc dữ liệu và phân tích đó ngoại tuyến. Và vì vậy, nó mở ra một luồng cơ hội.
Vì vậy, Cloudant là một cơ sở dữ liệu phân tán như một dịch vụ và nó là duy nhất, tôi tin rằng, ngay từ đầu, nó đã thực sự xuất hiện với chiến lược di động ngay từ đầu và tôi sẽ nói chi tiết về vấn đề này, nhưng ý tưởng là viết ứng dụng ngay bây giờ, bạn không viết cho một nền tảng duy nhất, phải không? Bạn đang viết cho một cái gì đó tôi có thể chạy thang đo petabyte trên đám mây, nó cũng phải có khả năng chạy trơn tru trên máy tính để bàn hoặc trong trình duyệt và càng ngày chúng ta càng thấy mọi thứ, chúng ta phải chạy trên thiết bị di động hoặc một thiết bị bán kết nối hoặc thiết bị đeo được hoặc một cái gì đó chúng tôi gọi là IOT. Và vì vậy, tôi nghĩ rằng, bạn biết rằng, các ứng dụng có thể giải quyết tốt và thúc đẩy các khách hàng khác nhau đó có khả năng cạnh tranh đáng kinh ngạc trên thị trường và những gì chúng tôi cố gắng làm là đơn giản để mọi người sử dụng API đơn lẻ trong mô hình lập trình đơn lẻ để viết xử lý dữ liệu trong tất cả các thiết bị khác nhau có quy mô rất khác nhau. The interesting thing is, you know, initial uptake in web and mobile, this is where we saw our big subtraction, but even now before the acquisition, we are seeing larger and larger number of enterprise users even in things as what I say as conservative as fidelity investments, right, working with a virtual building, a virtual safe deposit box. So, I think that this market is actually taken off much faster than even we had expected.
Let's talk about cloud and a little bit more and then turn it over. The idea here is that we really make it easier for you to build more and use a service like Cloudant to store the database state of your application and then move that to your different devices and keep things in sync and start contrast on how you build application, traditional stack or you have to buy servers like we heard about before, where you have to provision those and install license things. With Cloudant, we try to make easy. All the data that you will need, all the search services, database, etc. for your application can be acquired by signing up and getting a single endpoint URL and then starting to use that URL. The idea being that, that is a service that uses multiple indexes, some multiple technologies underneath, some proprietary and many open source, but we use them together in a way that the end developer or product team needs to build something. And so, database analytics, very different than they did it in inception where you would have, you know, rows and columns to store business ledgers, now we need to start JSON documents that generally happens over HTTP or using existing open-source APIs and then finally, we give you the things that database should do like a primary index and secondary indexes for, you know, retrieval and LTT and then driving application logic. But in addition, there is a wide range of things like search, geo-special and replication between devices that are very important. So, that's all provided underneath our API.
But, the really distinguishing thing that allows our users to grow and, for instance, why Samsung was one of our earliest and biggest customers is that, you know, Cloudant now is underneath cluster. Each cluster shares enough architecture of three to hundreds of nodes, but we run those in over 35 data centers now globally so that there is always a place for you to store your data within a millisecond of any other cloud provider or most existing data centers. So, one of the big early things that we are challenging in the cloud as well, is how do I split a hybrid architecture for my application service maybe here and my database servers maybe someplace else that will never work. They have to be on the same machine or in the same place. Well, the reality now is that by cobbling together different cloud providers, and this is something that we still do as an IBM company, you can make sure that your database is always within a millisecond of any other place and we take care of the peering agreements and just take down with the cost off the table, something that we worry about. So, Cloudant is really a database as a service, but you can think of it more like a CDN like for your database for data that changes, you know, on millisecond time scale.
And really, finally, I think the major selling point is if you build an application that's successful, you have to decide as an organization whether or not if you want to then grow the 24x7, 365 globally distributed, you know, operation team that it takes to run that at the large scale to whether that's something that now is commoditized as well. And so we focus very heavily on helping on-board new users and new customers and help them make the jump to the cloud and build architectures that use cloud analysts and works everything in a very coherent and scalable way so that is the end, you know, our users focus on building applications and not on surviving their own success.
And with that, I will just say thanks, skipped over some slides that were skipped and I will turn it back over to Lawrence.
Eric Kavanagh: That is fantastic. So, Lawrence, let me hand you the keys to the WebEx here. Just give me one second. There you are. Keys being transferred. Just click on that slide anywhere and use the down arrow.
Lawrence Schwartz: Great! Well, thank you for the handover and, you know, thanks to all the presenters today. Nice way to set everything up and there will be a lot of things to talk about it as I get through with the presentation here. So, again, I am Lawrence Schwartz. I run marketing over at Attunity and, you know, want to talk about some of the issues that we see and then some of the challenges in the space that we are in.
So, a quick overview and introduction to Attunity as a company and who we are. We focus on moving data. So, we talk about moving any type of data anytime, anywhere and enabling that for users. We are a public company based out of the Boston area, or near Boston, and when we talk about the cloud, we have some great relationships, we are part of the AWS network, a big data integration partner, and we have been close to them since the launch of their Redshift, even working with them before that. We have gotten some nice recognition for the work that we have done and as a company, we are in over 2000 places use Attunity, and we are in half of the Fortune 100 companies. So, we got some good experiences.
As you can see on kinda of the bottom of the slide here, a big issue is you've got data that's generated from all different types of sources these days from traditional, you know, CRM systems, all different places on the Internet, all the different places where data could start and then it has to go to places to be analyzed, to work with and to be looked at and we spoke if, you know, getting the data, you know, where it needs to be. So, I am gonna talk about our solutions that we do specifically on the cloud and when you think about that, often times the data, we have somewhere on-premise. So, besides having relationships with places like Amazon, we have very close working relationships with places like Teradata, Oracle, and Microsoft, all the places where data traditionally existed on-premise.
So, when you think about this, you know, and I think it was Eric who, you know, talked about on-boarding is the key to the whole process, right? I have been thinking about the issues to getting data on a system. Now, we are just some of the bottlenecks that exist today and when you look at the people moving data into a data warehouse or a database and to the cloud, we can see a lot of time is spent on what's called the ETL process, the extraction, transformation and loading of the data from where it resides to where it needs to go. If you think about getting the value on the data, that's not where you want to be spending your time and efforts, that's not the most productive area for a data scientist. And the flipside to that is this - very few people who are very satisfied with that process. It's no less than 20 percent. We really find that to be a big process. So, there is the real kind of painpoint bottleneck, if you will, in getting to the cloud and doing that type of on-boarding that people need to do and there's even, you know, real performance issues, you know, you could look at how do you get stuff into the cloud and if you want to get, you know, a couple of terabytes into the cloud, you could certainly ship it to the cloud and there are still places that do that with larger data sets, or a lot of the traditional methods, just don't have the performance to get their to do that. So, it's a real, you know, painpoint in the marketplace as people think about how do they get and how do they move onto the cloud.
So, if we step back in and look at what that means or why that's there and, you know, how this has come about, you know, both Eric and Gilbert talked about the fact that, you know, the data that's on there today, that exists today, you know, on-prem is here to stay, you know, cloud is here to stay. So, that integration becomes all the more important and often times, people fall back on the tools that they have to move over data. Again, there is a lot of ETL or traditional tools out there to kinda move data over in batches, but there's a lot of issues with that. People find that traditional ways of moving data are very time and resource intensive to set up. They often require a lot of scripting, even if they are autonomous in some way, a lot of people, a lot of manpower. There's so many sources and targets, particularly on-premise today to move it into the cloud, you know, all the systems I mentioned earlier, Oracle, Microsoft, Teradata, some managing that whole part of it. And then, you know, looking at the performance as it moves over, being able to have the tools to make sure everything is building quickly, there is a lot of thought systems that exist today aren't well built for that.
And then lastly, a lot of the way people think about moving data is kind of done in the batch process and if you are thinking about trying to do more in real time, that's not the most effective way, kind of using stale data that's not interesting to the organization. So, when you look at what Attunity does in this stage and how we think about it is, it's a different architecture that we are focused on, we really built this from the ground up and thought about when you have to go from Pentaho open-source database out to the cloud, how do you make sure that it's very easy and straightforward to do? So, that requires rethinking, how you do the monitoring and kind of set up for. It's making the whole thing just kind of a couple of clicks to get started. It's really thinking about the movement and optimizing the performance over the channel and working with just a wide variety of platforms because a lot of big organizations kinda have the best degree approach and a lot of different types of databases or data warehouses are ready in their environment. So, you have to think about it differently. You can't just do an extract, you know, dump the data out to some sort of information loaded somewhere. You have to kinda think about the architecture change, how you do the processing, do it more in memory and focus on a more performance version.
So, what does that mean and what does that look like? So, one key tenent to get to the problem with the cloud is, that things have to be easier to set up. You know, that screen there, it's just some screenshots from how we do it, but it's, you know, 1, 2, 3, kinda pick your source and target, pick what you want to do, you want to do one time CDC and then just go. It needs to be no harder than that, you know? I know we just, you know, saw the presentation from Mike and he talked about how easy it was for people to get started with Cloudant. It's the same type of thing, you have to deal with, kinda get going in a few steps otherwise you will start losing the value of it. When you think about the monitoring and control of it, there are some great companies out there, I know you're familiar with, like Tableau and others, who have done a great job in visualizing the end product of data and how to do it. But, you know, being able to visualize the movement process, the management or where's the data set on-premise, in the clouds and moving over, is there a lag, there is a vacancy. Having that viewpoint is critical and that's an important part of moving forward.
Another aspect that becomes important is the performance. You can't just rely on the standard FTP kinda two-way protocol that people have been using for years. As you move more and more data over, you have to have optimized, a file-channel protocol that is geared more towards, you know, one-directional movement most of the time after we think about how you break up tables and ship them out and move them over and you have to give people the flexibility to do that, otherwise you can't get it there in time and if you do that differently, think about it differently, you can get a 10x performance, but you have to rethink the technology.
And then lastly, as I mentioned earlier, you know, you have got a lot different places that databases exist today. So, you got to be able to work with all those and offer the widest kind of amount of support so that people can get onto the cloud. So, what does that mean for users and, you know, and those who are out there who wanted, two kind of quick cases of how people had challenges getting to the cloud, see the value, but then are able to do that if they have the right toolset.
So, one company that we work with, Etix, they do online ticketing, major provider in this space and I know Robin talked about data center offload is kind of a key in this case for the cloud. This is exactly what they are trying to do. They were trying to load and sync their data from Oracle on-premise to Redshift and do that in a timely fashion. And the interesting thing is, you know, go back to what Gilbert said, you know, it's really tough about on-boarding being an issue. They could see the intrinsic value of Redshift, they could see the cost savings, they could see all the advanced analytics that they quickly start doing that they continue for, they knew that value, but there was a roadblock to getting there. In this case, they looked at it and said, "Well, I see the value of Redshift, but it's gonna take them, you know, three months, development effort and time and, you know, maybe hiring the DBA and doing all this extra work to get there." So, there is a real block in the path to do it. Once you have the right toolset to do that, the right data integration capability to do that, they were able to go down from, you know, months of planning to literally just get going in minutes, and that's again lowering that barrier of getting people onto the cloud, we need to have the right capabilities to deliver on the promise.
The last, you know, slide I have here, and kind of another use case is, you know, we've worked with other companies, Philips, you know, well known in many spaces, we work with their health-care division and again, they were trying to go from an on-premise source over to Redshift, in this case SQL Server, and they knew the value, they knew all the analytics, they could do on it and they had done some testing on it, but they saw that without having the right tools, this is something that was gonna take them, you know, weeks and they had been spending actually weeks spinning their wheels and trying to get things moved over once they had the right tools that simplify, get it moved over quickly, they were able to go down and start loading in less than an hour, you know, over 30 million records. So, the real time went from couple of months to about two hours for them. And then they were able to do the things that they wanted to do. They didn't have to focus on the data loading, they could focus on the operational support. They got a much better matrix for all these care, cost and operations. So, you think about the whole challenge, you know, we design that spaces, enabling the data movement and now more than ever with the cloud when you think of it being kind of a remote place to pick your data, you know, this becomes an area that, you know, more and more people need to solve, to take advantage of what's out there. So, that's an overview of what we do and with that I will pass it back to you, Eric.
Eric Kavanagh: Okay. That sounds great. We've got a good amount of time here. We'll go a bit long to get to some of your good questions, folks. So, feel free to send your questions and I've got a few questions myself.
Lawrence, I guess I will start off with you. You guys have been in this space of kinda supercharging the movement of data for a while and you have been watching the cloud very carefully and I've really been kinda surprised at how long it's taken major enterprises, Fortune 1000 companies to fully embrace cloud. I mean, there are, of course, pockets of severe interests, let's call it, in large organizations, but as a general rule, there's been a bit of a reluctance that is only starting to wane in the last year or so, at least from my perspective, but what do you see out there in terms of cloud adoption and readiness of the enterprise to use cloud computing?
Lawrence Schwartz: Sure, I think you are right. It has been a significant change and it's certainly taken time, you know, they have that joke about, you know, that successful - overnight sensation - or really overnight success, that really takes years in the making, and that's been true for the cloud, right? It's… you have seen that kick in the last year, but it's due to all the hard work of a lot of players like Amazon who have been doing this for years, you know, to get the service adopted, the kind of, you know, prove the metal and there's, you know, failures and problems to give the diversity and flexibility that they have, that's something that Redshift offers. So, I think the maturity has gotten there, the confidence has gotten there, you know, the… I think it's infiltrated into a lot of companies through small areas, you know, small use cases, small trials, kind of outside that kinda IT control and with that, you know, those successful kind of periphery projects have proven now, there's now more of a willingness to have the conversations about how that spread. And frankly, you know, there's been additional tool that has, you know, have also come out to make these easier, like what we do and, you know, there is that, not just move the data, but show the value of BI in the cloud, and showing that.
So, it's, in one way, it's an overnight or a big uptick in the last year, but a big part of that's been all the hard work of building up to that. So, now we as a company see a lot more adoption. It's as a business for what we do, it's grown quite a bit and the cloud, you know, we do a lot of on-premise to on-premise movement. Now, cloud shows up in a lot of the conversations as, you know, real business cases, real offloading cases out where a year ago was certainly, you know, just more exploratory. Now, they have got real projects to move. So, it's been nice to see that movement.
Eric Kavanagh: Okay. Tuyệt quá. And Mike Miller, you had mentioned that you heard a couple of provocative statements that you wanted to comment on, so, by all means, what do you find interesting or what do you wanna talk about?
Mike Miller: Oh, I think Robin, he made a point, his second-to-last slide contrasting where innovation counts. The cloud will always be second best and I'd love to hear a little bit more about that because in my mind, if I was thinking about building, you know, an application or some new service, it's hard for me to think that my organization, no matter what they are, really wants to go engineer-to-engineer with Google, Amazon, IBM, Microsoft. So, I think maybe I misunderstood his point with that.
Eric Kavanagh: Interesting. Robin, Mike has thrown down the gauntlet. Bạn nghĩ sao?
Dr. Robin Bloor: Well, I mean the point here is that there are a number of situations that I've come across which… where people have gone into the cloud and walked back out and the reason they walked back out was, you know, when it came to actually having emotionally, this was performance driven, but the performance was actually the crux of the application is being built as they couldn't get the low latency they wanted and the cloud was of no use to them. And, you know, the situation was that, you know, actually going into the cloud, even if they were given the ability to measure behavior of the networks for them in the cloud and that workloads in the cloud with something they had absolutely no control over, and because of that, they couldn't create the tailor-made services that they were looking for, and that's a performance edge. I don't think there's anything in terms of, you know, coding that's going to be constricted, what you can do in the cloud. It's service level, it's a constriction… if that's part of where your critical capability is going to be, then the cloud is not going to be able to deliver it.
Mike Miller: Right. The… So, I appreciate that clarification. I do agree, actually, that transparency is one of the big things that here as desire right now from users across many different providers. So, I think you raised a very fair point. When it comes to performance, I think that traditionally it has been very hard to, you know, to go to a cloud provider or any given cloud provider and find exactly the hardware you are looking for, but it will noting kind of the upping the ante in the race to basically free storage between Google and Amazon and other competitors that it is and I think you see the pressure that puts on driving on the cost of SSD, flash, etc. So, I think that's a fun one to watch going forward.
Dr. Robin Bloor: Oh, absolutely correct, you know? I mean, I think there's one of the things that is actually happening is that the second wave is coming on. The first wave was this, you know, this wonderfully tailored services as long as, you know, it's a little bit Henry Ford; you can have it recolor as long as it is black, but, you know, even so, extreme reduction in certain kinds of costs of having the data center. Or, the second thing that happens is, having actually built these huge data centers out, they start these cloud operators, suddenly start discovering things that you can actually do. You couldn't do before because you didn't have the scale. So, there is, I think, a second wave which, to a certain extent, is going to make the cloud even more appealing.
Eric Kavanagh: Okay. Tốt Let me go ahead and bring Ashish as I am gonna go ahead and throw up your architecture slide here. We always love these kind of architecture slides that help people wrap their heads around what's going on. I guess, one thing that just jumps out at me is, of course, YARN. We talked about that on yesterday's briefing. YARN is not a small deal. For those of you who aren't familiar with this concept, it is "yet another resource negotiator." It's, really it's a very interesting development because what happened is in the Hadoop movement, YARN is kind of replacing the engine really, if you will. Our speaker from yesterday will refer to it as the operating system. It's like the new operating system of Hadoop, which of course, consists of the hybrid distributed file system underneath, which is basically storage when you get right down to it, and then MapReduce is what you used to have to use to use HDFS. MapReduce is an absurdly constraining environment in terms of how you get things done. So, the purpose of YARN was to make HDFS much more accessible and make the entire Hadoop ecosystem much more flexible and agile. So, Ashish, I am just gonna ask you in general, since you are mentioning YARN here, I am guessing that you guys are YARN compliant or certified. Can you kinda talk about what… how you see that change in the game for Hadoop and big data?
Ashish Thusoo: Yeah, sure. Chắc chắn rồi. So, I think, you know, there are two parts to… So, let me first talk about, you know, why YARN was done and then talk about how that potentially changes the game and what's fundamentally still is the same, you know, where it doesn't change the game. I think that's an important thing to realize also because many times you, you know, you get caught up on this hype of say, this is the new, shiny thing and, you know, everything is going to, you know, all the problems are going to go away and so on and so forth. So, but the primary thing is that, you know, the strength and the weakness of the MapReduce API was that it was a very simple API and essentially, any problem that you could structure around being a sorting problem could be represented in, you know, that API. And some problems are naturally, you know… can naturally be transformed into that and some problems, you know, you sort of, you know, once you have just MapReduce at your disposal then you try to fit into a sorting problem.
So, I think the latter is where YARN plays a role by expanding out those APIs by, you know, being able to compose, you know, maps and reductions and, you know, whole bunch of different types of APIs in terms of how the data can be distributed between these two stages, and so on and so forth. You just made that API that much more richer. So, now you have at your disposal, different ways of solving that same problem, right? So, you just don't have to, you know, be constrained by the API and the problem gets solved one way or the other like, you know, if you are, you know, trying to do an analytics, you know, workload, you can express that in MapReduce, you can express that in YARN. The big difference that happens, that starts to happen is, you know, in terms of, you know, the performance matrix that you start seeing, you know, once you start, say programming to YARN and in some cases, a newer set of things, for example, streaming analysis and so on and so forth starts becoming a reality when you start, you know, doing that, you know, those things in YARN.
So, those are the differences that, you know, that thing has brought into the ecosystem. I think it's much, the richness there is much more on the API side as opposed to it being another resource manager, especially in the cloud context. If you think about it in cloud context, the resource manager is actually your… the VMs that you bring up, you know, you have virt… you know, it's not necessarily… Again, this is a big difference between say, on-prem how you are running Hadoop clusters and how you are running in the cloud then, you know, you have like the constrained static set of machines, you want to distribute those machines amongst different resources and they were used for YARN there. But, in the cloud, you know, you can bring up machines left and right. And so, just from the perspective of being a resource manager, it probably doesn't have that, you know, that bigger need and specifically in the cloud, but from the perspective of providing these, you know, richness of APIs which allow you to, for example, the Hive is initiative they can now program Hive to not just to use MapReduce, but have much more richer plans of doing jobs and things like that. It brings those benefits to the ecosystem. I think that is where the true value of YARN belongs. And in the cloud context, definitely, it's not that interesting from the resource management point of view, but it's much more interesting in terms of what it enables other projects to do, in terms of, you know, workloads that now, it now can be used to be programmed on to your data or the previous workloads that can be done in a much more efficient way.
Eric Kavanagh: Right.
Ashish Thusoo: I had, you know, one more just, you know, adding to Mike, you know, there was another provocative thing which was said which is around and, you know, which was around, hey, treating the cloud as yet another data center. I think you… you know, that is one point of view which most companies, you know, look at and say, okay, you know, that's the easiest point of view actually to look at saying that, okay, you know, this is, you have bunch of machines on your, you know, you have compute, you have storage and you have networking on your on-prem data center and cloud provides the same thing out there. So, I am just going to do exactly the same thing that I am doing on my own on-prem data center and do the same thing in the cloud and viola - that's how it should work. What we have found out, you know, having been running the clouds for, the two clouds where, you know, you have the ability to provision VMs within a minute, the ability to use a highly scalable objects to store data and things like that. We have found that cloud actually, the cloud architecture and these inherent abilities actually enable different ways of doing things, you know, and this is what I have talked about in my slide as well, you know, the whole notion of… in just, you know, in… the perspective of just Hadoop, the whole notion of just running the static cluster versus on-demand dynamic clusters, that is something that you don't see happening in an on-prem data center, you know, versus, you know, true cloud where the, you know, there's a enough capacity to be able to support these types of workloads.
And so, I think there is definitely some shift needed. You know, the big fear for me is that if you just treat cloud as yet another data center, you actually… while you, you know, there are lot of other benefits, but there are lot of intrinsic benefits that you might ignore if you, you know, start doing that, security is another one, the way you deal with security and the cloud, there's a lot of differences in terms of how you would deal with, you know, in… from on-prem perspective and so on and so forth. Just wanted to add that in, from my perspective.
Eric Kavanagh: Sure. Vâng. Không vấn đề gì. We have one attendee asking about various types of use cases like logistics and specifically HR, so I threw up this website of Workday, wanted to make a couple of comments on that, and then Gilbert, maybe I will bring you in to comment on the whole concept of architecture. So, in terms of HR, I actually heard a rather well, I will call it, let's say comment from an analyst a couple of months ago, a few months ago I suppose, about going to the cloud for Human Resources. I have been doing some research on this to know lot of HR-type functions are being outsourced to the cloud, certainly stuff like payroll is fairly easy to outsource these days, benefits programs and insurance, that kind of thing, but there is a real serious caveat to keep in mind and Gilbert, this is what I want you to comment on from an architectural perspective, which is you have to be very careful about when you are moving to the cloud for some kind of critical business service because you either want to be very strategic and very thoughtful, meaning you go through the process of making sure that you understand what's going on in the cloud and what's staying on-premise, and there is the folk from Attunity will tell you that truly one of the things they specialize in is making those connections such that they provide the kind of connectivity you need because what's happening with some organizations is they go and they will use Workday for example, to put some of their HR stuff to the cloud, but they don't do it all or they don't do enough or they don't think through it enough, and what happens then? Then they want to happen to manage the cloud environment and their original on-premises environment as well, which means, guess what? He just increased your cost, you doubled your workload and you created lots and lots of headaches for people, and that's usually when someone gets fired and then the guy who comes in has a real mess to clean up. So, you really do have to think through the architecture of the data and the systems and the processes and make sure you dot all your i's and cross all your t's and with that, I will throw it over to Gilbert for comments. I am guessing it will be with that, but maybe not.
Gilbert Van Cutsem: Alright. Vâng. So, just another example of something similar, just yesterday happened to me. So, I lost one of my doctors because he went out of business. Tôi không biết. It sounds amazing. He was a chiropractor and he went out of business. I don't know why, but, the thing was this - I have no chiropractor and I like to go to a chiropractor, you know, occasionally. So, I find a new one and it's close to, you know, close by and all that. It's all good. And so, they go, as usual, you have to do all the paperwork and let us know if blah, blah, blah. But, the good news is we have a new system because, you know, we're on the Web now, in the cloud. It's all cool. I go like, okay, you know, and they send me a link and I have to do all the paperwork online, which is fine and I put all kinds of things in there about, kind of secret like, you know, social security numbers and that type of stuff and who I am, how old I am… all my details. I put it all there and I submit because of course, I do believe in technology.
And then I walk up to the office, the next day for my first appointment and they go like, "Did you do the form?" I go like, "Yes, Ma'am, I did." "Okay. Then we will go and find it." I go like, "Well, I did do it." And she goes, "Yes, we know because you are the fifth person today to walk in, to walk up to me and complain about that's not finding the form." And I go like, "But, you can't be serious about that. This is pretty confidential information. Where is it?" This happened to me yesterday, yeah, which brings back the whole issue and the whole idea of who owns the data really, right?
I know you move to the cloud and people get onboard it into a new system like in this case, my chiropractor and they subscribe to a new system. It's in the cloud, it's all safe, it's fully multi-tenant, they used to have it on-premise system, all the data was moved into the new system, but now apparently, they can't get it out.
Eric Kavanagh: Yeah. That's not good.
Gilbert Van Cutsem: So, I don't know where my data is and assume she gets really mad, right? She goes like, "Oh, this is impossible. I pay you money and my customers are, my patients, sorry, are unhappy and with the data is gone, I wanna get away from you. I wanna go to a different system maybe also in the cloud, right?" How do you then move the data of your patients in this case, the data your business owns, to another system? How do I get it out first of all and then load it again? I am sure ETL in the cloud is an answer somehow and we have experts on that, but it's not that easy.
Eric Kavanagh: Yeah, but that's exactly right and folks, I threw up this other slide here, this other, another screen to show you where you can find the archives. So, anytime you want to check out - oh, there's the inside of our website, I don't want to show you that. So, here is the main website and on the right column here you can see a different show. So, TechWise is right here. You click on that and on these different pages where we will actually post the archives. So, we do archive all these webcasts.
Actually, I wanna throw back over to Mike, I suppose, and then also to Lawrence to kinda comment on this story that Gilbert just told. So, Mike, there is some, kind of, now this is kind of a small-business concern. You guys are more focused on big business, but nonetheless, if a large company who works with you and they want to go somewhere else, how do you manage that movement of the data and securing the data and so forth?
Mike Miller: Yeah. Đó là một câu hỏi rất hay. It's one that used to come up a lot more often than it does now in sales calls, which I find to be an interesting anecdotal piece of evidence for a call. You know, I think that first of all, we are talking about a lot technologies, or at least employment models that are relatively new. This is very early in the cloud, right? We are talking about things like cloud, or in the case of data, we are talking about analytics services like Hadoop for databases and then NoSQL or NewSQL formats. You know, these are fundamentally new technologies and especially around things like, Hadoop and NoSQL, all of the ancillary services, the connectors, right, the… you know, if I want to find somebody that consults on Oracle, that's something I can find, but that entire ecosystem is just kinda spinning up right now.
So, it's getting easier day over day to say, okay, you know, give me a service that can read from 'x' traditional system, put it into Cloudant and do something with it and then put it back into 'y' traditional system, right? So, now they are very, you know, there are quite a few those things and it's actually more challenging, I think, for a typical user to understand what is the best choice, right, if I want to connect all the new technologies on-prem and then in the cloud.
So, I think as a cloud vendor, it's really on us to be very opinionated about that and to help walk users through the landscape of possibilities because the shift's a lot of new and I think that the average user, whether it's a CTO, CIO or whether it's actually developer, is coming up that learning curve fairly quickly. I think that a lot of the kind of baseline stuff is being worked out, cross-cloud connectors and, you know, taking away the really most basic worries about say, you know, bandwidth cost and whether or not you are going out on the wide area network versus staying on, you know, VPN the entire time. A lot of those things have been kinda abstracted away and what is the true promise of the cloud.
But, in general, I think you are also seeing, you know, that anecdote that we heard was, you know, something that is probably isomorphic to, you know, what will happen to your buying into a brand, you know, in a past lifetime, you know, what happens if that brand doesn't deliver, how much can I really trust that brand? I think you are seeing exactly the same thing happen in the cloud and, you know, I think that companies like Microsoft, Amazon, IBM and Google are, you know, very much stepping up and saying that there will at least be multiple pillars of trust and making sure that you are not going in with a company that's going to dry up and swallow your data, or worse, lose it or distribute it, right? And so, they are, at least, they are independable and they are anchoring, you know, the development of such ecosystem. But, I say to close, it's very early and a lot of that tooling is just getting started and, you know, I think you are going to see consulting services, you know, really putting a lot of focus on that in the very near term.
Eric Kavanagh: Yeah. That's a really, really good comment you just made there. I like that "pillars of trust" concept because the other thing to keep in mind here is you do once again have a number of fierce competitors vying for market share and for IT span, it's just like the old days all over again. Really, in the old days, by which I mean last year, you had IBM and Oracle and Microsoft and SAP and then Computer Associates and Informatica and all these companies, Teradata, etc. In the new world, now you have got, of course, Microsoft with their Du Jour, you have got Google, you have got Amazon Web Services, you know, you have Facebook in certain context. So, you have all these companies that are not necessarily so excited about working with each other, but you do have things like APIs. And so, one of the nice things that APIs really are crystallizing into the connectors that hold together the larger cloud, I suppose, and I want to throw up a slide for Lawrence to kinda comment on all this.
Yeah, Lawrence, obviously, you guys have specialized in the space for a while. So, I think you do have awesome advantage over maybe some newcomers. But, nonetheless, these are all very serious concerns because how data gets stored in the cloud is different than how it gets stored on-premise. Then I think that Mike makes a really good point that this whole space is just starting to take shape and it's gonna take a while for things to seriously fall into place and to crystallize. So, what's some advice that you have for companies that you… I guess, you basically concur with Mike, or what do you think?
Lawrence Schwartz: Yeah. I think it's, you know, what we see is when people are taking advantage of the cloud for a lot of use cases as compared to on-premise, you know, they are looking at kind of, you know, two different things. One is, they are looking at, you know, as we talked about this a little bit earlier, how do I… how does it incrementally add value to what I do, how do I, you know, how is it kind of an add-on? And so, you know, when back to when I talked about the Etix as a company where, you know, they are not moving all their operations over to Redshift, you know, yet per say, but they're saying, "I do a lot of work on Oracle, I wanna offer some of this to some kind of analytics from different environments, you know, kinda figure out, maybe do some sandbox stuff there, and, you know, and then learn about my business that way, and that way they can kind of carve out what they want, move it over there and do the work and, you know, it's less of a concern with moving, you know, everything over and all the records and whatnot. So, I think they look at that as one way that to take advantage of it with having less issues.
I think the other thing is people are also looking at these cases that are and aren't excellent fit for the cloud that are very, very hard to do in other ways. So, I will take another example, you know, we work with a company called, you know, iN DEMAND. They are video on-demand player. They do this work for Comcast and all of this and they will actually, you know, take the data that they are working with, they will take the media files and they will supply it to the cloud for doing their processing, do their processing there, and then they will consume it back for their on-premise customers. And then, you know, that gets upstairs to third parties that consume reviews. So, it's, you know, if you want to think about how the company is approaching it, it's, you know, how do I get my… how do I add value, how do I maybe not move the whole business at first, how do I get the right use cases, how do I add incremental value to what I do? And that helps kinda build about the confidence on what they are doing and as part of the process, and of course, you know, a key piece of that is, you know, making sure that they can do that securely and reliably and, you know, we make sure to the latest levels of encryption and other things to take care of that as much as we can on the transport side. But, that's how I think a lot of companies are approaching the problem.
Eric Kavanagh: Okay. Tốt And maybe Ashish, I will throw one last question over to you. I am just throwing up, actually, I like your architecture slide. Even this slide I think is pretty neat. So, one of the questions in, you know, HDFS of course, by design the default is to save every piece of data three times. You can adjust that, of course, you can make it twice, you can make it four times, that does provide some overhead over time, obviously, but it is a way of backing up data. Anyway, that was the whole idea, one of the key ideas, right, from HDFS originally is redundancy, is not wanting to lose data. I've kind of been wondering how that's going to affect things like replication servers, quite frankly, when Hadoop does that natively.
But, one of the attendees is asking - "Can you request physical backups like tape for your cloud data? I read of a company that had their cloud management console hacked and their data and online backups trashed."
You know, we are hearing about these breaches all the time, they are getting more and more serious, they are killing major brands like Target, like Home Depot, etc. So, security is an issue and backup and restore is an issue. Can you kinda talk about how you guys address things like backup and restore and security?
Ashish Thusoo: Yeah, sure. So, we… So, I will talk about that and talk about HDFS first. So, as far as Qubole is concerned, you know, we… since we work on the cloud, we use the objects store there to store data. So, again, this is one of the other key differences why, you know, big data service on the cloud becomes different from on-prem. On-prem, we have always talked about, you know, HDFS and so on and so forth, but if you go to the cloud, a lot of the data is actually stored in their object stores. For example, that could be an S3 on AWS, Google cloud storage on Google Cloud, on Google Compute Engine, and so on and so forth.
Now, many of these object stores have built-in capabilities of providing you things, you know, these object stores, by the way, you know, one of the big differentiators from real clouds to actually your own data center is the presence of these object stores and the reason that these object stores are cool pieces of technology, you know, they are able to provide you very cheap storage and along with that they are able to provide you things like, you know, having the ability to actually have a disaster recovery thing built in and, you know, as part of that interface, you don't have to think about it. And also, they have tiered, you know, there is tiering there as well. For example, S3 has high availability and it's online access, but it's much more expensive. It's more expensive than say, a glacier storage on AWS, which is low, you know, it gives you, you know, the turnaround time is like four hours or something like that and it's much cheaper. So, you start thinking of, you know, those types of services. I think cloud providers are essentially providing those types of services to augment the need for things like tapes and so on and so forth. And also, to provide you disaster recovery or rather, you know, replication built in into these systems so that, you know, you are protected from disasters, regional disasters and things like that.
So, that is what Qubole heavily, you know, depends upon and the great thing is that a lot of… all the cloud providers are providing this. These are fundamentally very difficult problems to solve and by being built into some of the object stores that these cloud providers provide, you know, that is one more additional reason of, you know, storing this data, you know, in some of these object stores and using the cloud for that as opposed to trying to, you know, figure out, you know, replication, running two Hadoop clusters across different, you know, regions and, you know, trying to replicate data from HDFS from one region to the other, which is doable, we did that a lot when I was back at Facebook running this stuff there, but, you know, fundamentally, the object stores in the cloud just made it that much more easy.
Eric Kavanagh: Okay. Tuyệt quá! Well, folks, we've burned through an hour and 15 minutes or so, a lot of great questions there and a lot of great presentations. Thank you so much to all of our vendors today and of course, to both of our analysts on the show today. A big thank you, of course, to Qubole, Cloudant and Attunity. We are gonna put the archive up at insideanalysis.com. I showed you where that goes, and big thanks to our friends at Techopedia as well.
So, folks, thank you again for your time and attention. This concludes Episode 3 of TechWise, our relatively new show. There is Episode 4 coming up pretty soon. It's gonna be on the big data ecosystem. So, watch for information on all that. And then till then, folks, thank you so much. We will catch up with you next time. Bảo trọng. Tạm biệt.