Bởi nhân viên Techopedia, ngày 11 tháng 5 năm 2016
Takeaway: Host Rebecca Jozwiak thảo luận về những tiến bộ trong kiến trúc và lưu trữ cơ sở dữ liệu với Dez Blanchfield, Robin Bloor và Brian Bulkowski.
Bạn hiện chưa đăng nhập. Vui lòng đăng nhập hoặc đăng ký để xem video.
Rebecca Jozwiak: Thưa quý vị và các bạn, xin chào và chào mừng đến với Công nghệ nóng của năm 2016. Hôm nay chúng tôi, Sự khác biệt về phơi bày: Một kỷ nguyên mới về cơ sở hạ tầng có thể mở rộng. Tôi đang bước vào Eric Kavanagh hôm nay. Tôi là Rebecca Jozwiak, người dẫn chương trình khiêm tốn của bạn trong nhóm hội đồng quản trị trong khi Eric nghỉ ở Jamaica. Tốt cho anh ấy.
Vì vậy, giống như đã nhiều thập kỷ, năm nay rất nóng, mặc dù công nghệ được cho là đang phát triển với tốc độ vượt xa luật của Moore, và các tổ chức đang làm gì để theo kịp? Họ đang tìm kiếm bất cứ điều gì nhanh, và quy mô, tôi sẽ tranh luận, có lẽ là một trong những điều quan trọng nhất khi chúng ta nghĩ về cơ sở dữ liệu. Và tất nhiên chúng tôi có các tùy chọn cho mối quan hệ thông thường, bây giờ chúng tôi có NoQuery, chúng tôi có kho lưu trữ cột, chúng tôi có cơ sở dữ liệu đồ thị, cơ sở dữ liệu RDF của chúng tôi, nhưng thực sự, những gì doanh nghiệp đang tìm kiếm là quy mô, song song và nhanh chóng .
Bây giờ, kiến trúc truyền thống là loại dựa trên mô hình quan hệ đó. Nhưng nếu bạn nhìn vào hầu hết các doanh nghiệp web đã xuất hiện trong ba, năm, mười năm qua, thì đó không phải là mô hình mà họ đang sử dụng cho cơ sở hạ tầng của họ. Họ đang sử dụng một kiến trúc khác, song song, họ đang mở rộng và họ rất nhanh, và đó là điều mà ngày nay nhiều người đang hướng đến.
Đội hình của chúng tôi, chúng tôi có Dez Blanchfield, anh ấy là một nhà khoa học từ Nhóm Bloor. Chúng tôi có Bác sĩ Robin Bloor, nhà phân tích chính của chúng tôi tại Tập đoàn Bloor, và chúng tôi có Brian Bulkowski, CTO và người sáng lập tại Aerospike. Vì vậy, những người với điều đó, tôi sẽ chuyển nó cho Dez.
Dez Blanchfield: Cảm ơn bạn, và cảm ơn vì đã cho tôi ở đây. Tôi sẽ cố gắng thiết lập bối cảnh cho việc chúng ta sẽ nhanh chóng đến nơi chúng ta đang ở và chúng ta sẽ đi sâu vào nhiều chi tiết kỹ thuật hơn khi chúng ta đi qua các chủ đề ngày nay. Tôi sẽ kiểm soát màn hình ở đây.
Vì vậy, lớn hơn, tốt hơn và nhanh hơn. Khi tôi nghĩ về nơi chúng ta đang ở, hình ảnh luôn hiện lên trong tâm trí tôi, đó chính là hình ảnh mà tôi đã có trên slide tiêu đề của mình, đó là sự mở rộng của vũ trụ. Chúng ta đã có công nghệ phát triển và phát triển trong nhiều thập kỷ nay, thực tế là từ những năm cuối năm mươi khi máy tính lớn trở thành một thứ thực sự. Công nghệ đã tiếp tục phát triển trong nhiều trường hợp ở mức tệ hơn hoặc lớn hơn đường cong tuyến tính, tùy thuộc vào phần nào của đường cong mà bạn sử dụng, theo như phần mềm hoặc phần cứng.
Quy mô đã ngày càng lớn hơn, và nhanh hơn và nhanh hơn, theo như những gì chúng tôi đang cố gắng cung cấp, và nhỏ hơn và nhỏ hơn ở cấp độ sản xuất và chất bán dẫn. Và ở giữa có phần mềm và các ứng dụng và hệ thống làm nền tảng cho phần mềm đó, và chúng có xu hướng ngày càng nhỏ hơn về bản chất, và chúng ta đã thấy những thứ như ứng dụng được đóng gói và máy chủ siêu nhỏ, nó lại trở thành một thứ. Chúng tôi đã làm điều đó trong quá khứ, nhiều thập kỷ trước, nhưng kết quả là ngày càng nhỏ hơn ở đó, chúng tôi ngày càng lớn hơn ở quy mô mà bây giờ chúng tôi có thể chạy mọi thứ, như các ứng dụng và cơ sở dữ liệu cụ thể, và logic của những cơ sở dữ liệu.
Tôi có quan điểm này trong đó chúng tôi đã thu nhỏ theo chiều ngang, về cơ bản là trục X; chúng ta đã thu nhỏ theo chiều dọc trong trục Y. Bây giờ chúng ta đang ở một nơi khác, nơi chúng ta cần phải đi đâu đó khác biệt, và trong tâm trí tôi, đó là loại hình được hình thành về mặt tinh thần như một trục Z, và đó là chúng ta phải đi sâu vào công nghệ và xem xét cách chúng ta có thể làm những điều khác với những gì chúng ta đã làm cho đến nay, để có được phần tốc độ bổ sung đó. Vì vậy, tôi hình dung toàn bộ sự mở rộng của vũ trụ này, nơi chúng ta đã có một vụ nổ xảy ra, và một số công nghệ tồn tại, và sự tăng trưởng và nhu cầu tuyến tính tốt hơn này. Chúng tôi đã phải tìm những cách khác nhau để có được kết quả lớn hơn, tốt hơn, nhanh hơn.
Chỉ cần nhanh chóng bao quát loại nơi chúng ta đang ở trong một vài môi trường phần cứng. Chúng ta đã thấy chi phí giảm của một gigabyte không gian đĩa mang lại một vài sự chuyển đổi và công nghệ khá lớn, và tiếp cận vấn đề quy mô lớn hơn, tốt hơn và nhanh hơn. Đây là hai biểu đồ riêng biệt bao gồm khoảng một thập kỷ, chỉ hơn một thập kỷ mỗi lần giảm giá của một gigabyte dung lượng đĩa cứng.
Đó là một đường cong J cổ điển hoặc một cây gậy khúc côn cầu như chúng ta thường nhắc đến chúng, trong thời gian trước đây bạn có thể chi hàng trăm ngàn đô la để mua một gigabyte dung lượng đĩa, không phải hai thập kỷ trước, trong khi ngày nay nó trở thành đô la và cuối cùng tôi chắc chắn rằng nó sẽ kết thúc, những gì chúng ta gọi cuộc đua về không, nó sẽ trở thành xu. Điều đó mang lại một sự thay đổi thú vị trong loại điều mà các doanh nghiệp có thể làm. Và tôi nói đến điều đó như một sự gián đoạn thông qua dữ liệu hoặc dữ liệu lớn nói riêng, và điều đó, ý tôi là chúng ta đã thấy các công nghệ, như làm thế nào để trở thành một thứ mà chúng ta có thể mở rộng quy mô theo chiều ngang trong lưu trữ và loại tính toán của chúng ta có thể áp dụng cho bộ lưu trữ đó và cách nó mở ra một công nghệ thú vị bởi vì nó cho phép chúng tôi thực hiện lưu trữ song song rất lớn, dự phòng ở mức nhanh nhất và bản thân các bộ phận của Hadoop, có thể sao chép dữ liệu trong một lần ghi nhiều lần, và chỉ mở rộng điều ở một lớp gần tuyến tính.
Và đó là tất cả các công ty như thế này thực sự bị gián đoạn khi sử dụng dữ liệu lớn. Chúng ta đã có những công ty như Uber là công ty taxi lớn nhất thế giới. Họ không thực sự sở hữu bất kỳ taxi, và đó là một danh sách dài ở đây. Airbnb là nhà cung cấp chỗ ở lớn nhất, thực sự không có bất động sản. Một trong những mục yêu thích của tôi là Facebook, ví dụ trong danh sách này, nơi họ không thực sự tạo ra nội dung, chúng tôi tạo nội dung cho họ, nhưng họ thực sự là chủ sở hữu phương tiện truyền thông lớn nhất trên hành tinh. Chúng tôi đã có những người thú vị như các ngân hàng tăng trưởng nhanh nhất, thực sự không có tiền. Đây là những nền tảng và ngân hàng cho vay ngang hàng, và có một cái ở Úc, đặc biệt là sự nổi tiếng ngày càng tăng ở đây được gọi là SocietyOne. Và một số ngân hàng lớn phải có tiền mặt đang đầu tư vào ngân hàng ngang hàng cụ thể đó. Và chúng tôi đi qua danh sách này thậm chí xuống Netflix; họ không thực sự sở hữu bất kỳ rạp chiếu phim nào và họ thực sự là nhà chiếu phim lớn nhất hành tinh.
Vì vậy, họ đã đến nơi, trong suy nghĩ của tôi, thông qua việc áp dụng các công nghệ thông minh ở cấp dữ liệu, bởi vì chúng tôi có thể lưu trữ lớn hơn và rộng hơn với chi phí thấp hơn do giá của một gigabyte dung lượng ổ cứng giảm và chúng tôi có thể áp dụng một số tính toán thông minh và phân phối một mô hình điện toán trên đó. Các công ty này có khả năng tạo ra lợi thế cạnh tranh và phá vỡ do chi phí không gian đĩa giảm.
Chúng ta đã thấy một điều tương tự xảy ra trong chi phí của bộ nhớ. Một vài thập kỷ trước, nếu bạn có sáu triệu đô la nằm xung quanh, bạn có thể mua một gigabyte RAM và chúng ta đã có một đường cong J hoặc khúc côn cầu rất giống nhau, diễn ra trong việc giảm chi phí hoặc giảm giá RAM. Và điều đó mang lại một số điều thú vị, và trong suy nghĩ của tôi, một trong những sự gián đoạn lớn nhất trong không gian đó là dung lượng bộ nhớ có thể được tích hợp vào các thiết bị, như thiết bị di động, như điện thoại và máy tính bảng, và thậm chí cả máy tính xách tay. Máy tính ngày nay, số lượng bộ nhớ đi vào một máy tính xách tay trung bình, nó khá vô lý trong một số trường hợp. Trong một số trường hợp, máy tính xách tay hiện tại của tôi có nhiều bộ nhớ hơn một số máy chủ mà họ đã sử dụng cách đây không lâu.
Điều này đã mang lại sự thay đổi đáng kể theo đúng nghĩa của nó, theo cách tương tự như RAM có trong tâm trí của tôi, nó cho phép chúng tôi mở rộng quy mô và nhanh chóng. Và bây giờ chúng ta đã có sự xuất hiện của một công nghệ mà chúng ta gọi là flash, và đây là công nghệ bắt nguồn từ thứ gì đó nằm trên phần cứng dưới dạng EEPROM, một con chip nhỏ được thiết kế để có thể có sẵn, và viết thư, và sau đó khi mất điện, nó sẽ giữ bất cứ thứ gì bạn viết cho con chip đó như là bộ lưu trữ liên tục. Nó rất chậm, nó rất cục mịch và vào những ngày đó, tôi nghĩ rằng đó là khoảng năm 1980191981, nó đã trở thành một thứ. Đến năm 1984, Toshiba, người mà tôi tin là đã phát minh ra công nghệ, biến nó thành một thứ thương mại mà chúng ta có thể sử dụng.
Nhưng chẳng bao lâu, mọi người đã hình dung ra rằng họ thực sự có thể lấy một tổ hợp các thành phần được sử dụng để tạo ra khái niệm EEPROM này, một bộ nhớ chỉ đọc, một khi nó đã bị xóa và ghi vào đó, và họ thực sự có thể viết cho nó trên cơ sở thường xuyên, và sử dụng nó một chút giống như không gian đĩa và một chút giống như RAM. Theo thời gian, nó đã phát triển. Giờ đây, công nghệ lưu trữ flash này đã là sự hợp nhất giữa lưu trữ đĩa truyền thống, cho dù đó là đĩa quay hay trong một số trường hợp là đĩa lai của bộ nhớ và RAM. Và điều quan trọng là hệ thống giữa vì bạn có thể đọc và viết cho nó, sau đó tắt nguồn và nó sẽ giữ lại những gì bạn đã viết cho nó. Vì vậy, một không gian đĩa, rõ ràng là bạn ghi vào nó, bạn tắt nguồn và trục xoay và sửa đổi nhiều, vì muốn mô tả tốt hơn, giữ các số không và những gì bạn đã viết cho nó.
Trong không gian bộ nhớ truy cập ngẫu nhiên, bạn ghi một cái gì đó vào bộ nhớ trong RAM, bạn tắt máy tính và mọi thứ sẽ bị xóa vì không còn điện tử để giữ cho nó được sạc và giữ thông tin bạn đã viết cho nó. Thêm vào đó, nó ở giữa và cực kỳ nhanh, nhanh hơn đĩa, chậm hơn RAM. Nhưng bạn có thể viết cho nó, và đọc từ nó, và khi bạn tắt nguồn, nó sẽ tiếp tục. Điều này đã mang lại một số công nghệ tuyệt vời và đặc biệt là chúng tôi đã phát triển các thiết bị di động và máy tính xách tay thực sự rất nhanh và có thể làm được nhiều việc, và giờ nó đã chuyển vào không gian cơ sở hạ tầng xung quanh lưu trữ và tính toán, và điều đó mang lại ý nghĩa thay đổi trong những gì chúng tôi có thể cung cấp ở quy mô. Đây là loại mà tôi tin rằng trục Z trong tâm trí của tôi sắp xuất hiện.
Gần như theo thời gian theo nhiều cách, bởi vì chúng ta đã thấy sự gián đoạn thông qua những gì tôi gọi là nhu cầu, và đó là người tiêu dùng, bất kể những gì xảy ra trong cơ sở hạ tầng và không gian công nghệ, và khả năng lái xe nhanh hơn và tính toán nhanh hơn và hiệu suất ở cấp cơ sở hạ tầng, người tiêu dùng đang yêu cầu sự gián đoạn này dưới dạng những gì được đề cập đến bây giờ, trải nghiệm của người nổi tiếng. Mọi người đều muốn mọi hệ thống, mọi ứng dụng, mọi trang web đều biết họ là ai và họ thích gì, và có thể mang đến cho họ trải nghiệm cá nhân từng người một. Nó không còn đủ tốt nữa chỉ để vào một trang web nơi tôi mua vé xem phim. Tôi muốn nó biết những gì tôi đã mua trước đây, tại sao tôi mua nó và có khả năng những gì mọi người giống như tôi đã mua và giới thiệu mọi thứ.
Lúc nào cũng vậy, chúng tôi thấy những gì tôi đề cập đến là một thứ tự xã hội, và đó là tôi muốn trải nghiệm của người nổi tiếng, nhưng tôi cũng muốn xã hội hóa ý tưởng đó, tôi muốn chia sẻ nó với tất cả bạn bè và nói với họ những gì tôi Tôi đang làm và tôi cũng muốn biết bạn bè mình đang làm gì. Và đây là kết quả của một nhu cầu bùng nổ về tính toán và lưu trữ bổ sung, và sự quay vòng nhanh chóng của mọi thứ. Chúng ta đã thấy thế hệ Fitbit, cái mà tôi gọi là theo dõi luôn luôn. Mọi thứ tôi làm đều được theo dõi, ghi lại và ghi lại ở đâu đó. Chúng ta đã thấy mọi thứ trong thời gian thực: ngân hàng, đấu thầu, công cụ đề xuất, phải có khả năng đối phó với những thứ thời gian thực mà cá nhân tôi đang làm với tư cách là người tiêu dùng.
Và sau đó chúng ta thấy một tác động rất lớn, như rủi ro bảo mật xung quanh an ninh mạng. Trước đây chúng ta có những tin tặc cá nhân, sau đó chúng ta có các băng đảng tội phạm tự áp dụng nó, bây giờ chúng ta có toàn bộ các quốc gia sẽ chiến tranh qua internet, đó là một điều có thật và thực sự xảy ra. Hãy chú ý đến điều đó, ngồi lên và xem nó, bởi vì có tác động thực sự đến điều đó, và một số người nói trước buổi diễn của chúng tôi đã thảo luận về nguy cơ có máy tính của riêng bạn, hoặc ít nhất là mạng của bạn, bị xâm nhập.
Chúng ta đã thấy khái niệm khai thác thực thể này. Trích xuất thực thể là khi chúng ta phải tìm thấy những điều đáng quan tâm bên trong các tập dữ liệu rất lớn và đặc biệt là xung quanh hoạt động lừa đảo và hoạt động bất hợp pháp và loại tin tặc. Nhưng thường xuyên hơn không, chúng ta sẽ thấy rằng việc trích xuất thực thể đang trở thành một điểm tập trung cho những điều tốt đẹp và những thứ có giá trị đối với chúng ta, trái ngược với việc tìm kiếm những thứ đang tấn công chúng ta.
Chúng ta cũng đã thấy một vụ nổ, những gì được gọi là dữ liệu không gian địa lý. Đây là dữ liệu thực sự biết nó bắt nguồn từ đâu hoặc dữ liệu khác giống như nó đến từ đâu. Bạn có thể tưởng tượng bạn đang đứng trên đường và bạn muốn tìm trạm đỗ xe gần nhất hoặc nhà hàng gần nhất, các ứng dụng có thể áp dụng tính toán và dữ liệu không gian địa lý, tính toán cho dữ liệu, biết nó ở đâu trong không gian, rất quan trọng bởi vì bạn cần có khả năng biết các đối tượng và thực thể khác ở đâu và thực hiện điều đó một cách nhanh chóng.
Chúng tôi đã thấy kết nối di động vĩnh viễn. Ngay cả khi chúng tôi đi ngủ vào ban đêm, điện thoại di động của chúng tôi vẫn tích tắc, cập nhật email, kiểm tra lịch của chúng tôi, xem thời tiết là gì và tìm hiểu xem những gì chúng tôi muốn cho bữa sáng sẽ có sẵn. Có rất nhiều tiếng ồn xảy ra ở đó, và điều đó đã tạo ra một tác động lớn đến những gì chúng ta cần làm ở phía sau và tốc độ chúng ta làm điều đó.
Nhìn chung, quy mô và tác động của những gì được gọi là Internet vạn vật, hay thường xuyên hơn là kết nối giữa máy với máy, trong đó các thiết bị đang nói chuyện với các thiết bị và điều đó hoàn toàn phù hợp với các động cơ gắn liền với phía máy bay nói với chính máy bay, hoặc hệ thống quản lý máy bay, rằng ổ trục của động cơ số bốn đang bị hao mòn quá mức và nên được thay thế khi chúng ta hạ cánh, sau đó nó giao tiếp với một máy khác, và vì vậy nó nên đặt trật tự, và kỳ diệu là một kỹ sư xuất hiện trên chuyến bay tại sân bay và chuẩn bị thay thế nó trong quá trình nạp nhiên liệu.
Và quy mô quá lớn và lớn đến mức chúng tôi phải đi sâu vào những gì tôi đề cập đến, thông qua việc truy cập để đối phó với nó. Bởi vì một thế giới mới, và chào mừng đến với thế giới mới, một thế giới mới của mọi thứ mà chúng ta sử dụng được kết nối; ngày xưa nó là vệ tinh và thiết bị mạng, bây giờ nó là thiết bị di động, máy tính xách tay và máy tính bảng và điện thoại của chúng tôi, và ngay cả chiếc Audi mới toanh của tôi cũng có một dấu hiệu, và nó báo cáo liên tục về sức khỏe của chính nó, nhưng cũng tự cập nhật, và biết nó ở đâu, và bản đồ nào được áp dụng, và thậm chí cho tôi biết khi nào nên đi một tuyến đường khác nếu có giao thông trên con đường phía trước.
Mọi thứ chúng tôi đang xây dựng bây giờ, mọi thứ chúng tôi đang nói với bạn bây giờ, đang được thiết kế để kết nối và kết nối với những thứ khác, không chỉ từ tôi đến hệ thống, mà từ hệ thống đến hệ thống, và để có thể đối phó với điều đó Chúng ta phải áp dụng suy nghĩ rất khác nhau ở tầng cơ sở hạ tầng, cả về phần cứng và phần mềm, và đặc biệt là các lớp cơ sở dữ liệu mà các hệ thống cần củng cố, và trong nhiều cách, cơ sở dữ liệu đã trở thành công cụ và ứng dụng thực sự là chỉ cần bot nhỏ làm mọi việc.
Tôi sẽ kết thúc nhanh chóng ở đây với quan điểm hơi hài hước về loại nơi chúng ta sẽ làm với những thứ này, và cái mà tôi gọi là là Io IoT chỉ bằng một nút bấm. Có một tiện ích mới được tạo ra được gọi là Nút Amazon Dash, và đây là một tiện ích nhỏ bằng ngón tay cái. Thực tế theo nhiều cách, nó giống như ổ USB của tôi. Khi bạn mua thứ này, nó có giá khoảng 4, 99 đô la Mỹ trực tuyến từ Amazon, nó sẽ được chuyển đến bạn, bạn định cấu hình nó với điện thoại di động của bạn và bạn chỉ cần gắn nó vào một trong các thiết bị của mình, như tủ lạnh hoặc máy giặt hoặc bất cứ thứ gì. Trong ví dụ về máy giặt của bạn, nếu cuối cùng bạn hết bột giặt, bạn có thể nhấn nút đó và nó sẽ quay số về nhà và tự động đặt hàng nhiều hơn cho bạn, và kỳ diệu hơn sẽ được chuyển đến bạn thông qua những người bạn tốt của chúng tôi tại Amazon.
Đối với tôi, điều này làm tôi sợ, bởi vì nó sẽ chứng kiến sự bùng nổ của một số thứ được kết nối trên mạng và cố gắng tạo kết nối và tạo ra nhu cầu. Nếu bạn có thể tưởng tượng, một hoặc hai trong số những thứ này có thể không quá đáng sợ, nhưng lần trước tôi đã xem, có hơn 110 trong số những thứ này có thương hiệu, vì vậy hầu như mọi thương hiệu trên hành tinh sẽ cố gắng và có được sự thúc đẩy nhỏ của riêng mình- Nút IoT, bạn về nhà và bạn nhấn một nút và nó nói, Đặt hàng cho tôi một chiếc bánh pizza. Bạn nhấn một nút khác và nó đặt một bữa ăn trưa được xây dựng sẵn cho con bạn đến trường vào ngày mai.
Điều đó đang thúc đẩy một nhu cầu lớn về chuyển đổi ở phía sau, ở cấp ứng dụng, đặc biệt là ở cấp cơ sở dữ liệu, mà tôi nghĩ rằng chúng ta chỉ mới nhìn thấy phần nổi của loại biến đổi hiệu suất mà chúng ta cần thấy . Và với điều đó, tôi sẽ trao nó cho Bác sĩ Robin Bloor và hiểu rõ hơn về nơi chúng ta đang ở.
Rebecca Jozwiak: Được rồi Robin, tôi đã chuyền bóng cho bạn.
Robin Bloor: Điều đó không tốt sao? Được rồi, chúng ta đi, đây là tôi. Tôi đã xem bài thuyết trình của Dez trước khi tôi đến bài này, vì vậy tôi sẽ nói những điều miễn phí thay vì chỉ lặp lại một số điều mà Dez đã nói. Tôi nghĩ rằng tôi đã nói về sự tiến hóa của cơ sở dữ liệu về những gì thực sự đã xảy ra với kiến trúc, v.v. và các cơ sở dữ liệu từ góc độ lịch sử.
Vấn đề cơ bản mà bất kỳ nhà cung cấp cơ sở dữ liệu nào cũng gặp phải là duy trì một kiến trúc linh hoạt mở rộng quy mô và theo kịp tiến hóa phần cứng. Tôi sẽ nói về điều này, nhưng khi bạn thực sự nhìn lại và thấy cách cơ sở dữ liệu được xây dựng và cách chúng được xây dựng bây giờ, chúng thực sự khác biệt đáng kể so với mức tôi gọi là cấp thiết kế kiến trúc . Thật đáng để xem xét tại sao lại như vậy, hoặc ít nhất là tôi nghĩ vậy. Các yếu tố phần cứng và Dez đã cho chúng ta một bản tóm tắt đặc biệt tốt về các lớp thấp hơn về bộ nhớ và đĩa. Những gì chúng ta có bây giờ, và đây là tương lai sắp tới, Intel là người tiếp theo, CP, người sẽ có một đồ họa trên đó. Mọi người sẽ làm gì với điều đó, tôi không có manh mối. AMD đang hợp nhất CPU và GPU và điều gì sẽ tạo ra sự khác biệt? Đây là những loại thay đổi thực sự sẽ tạo ra sự khác biệt cho cơ sở dữ liệu và tôi nghi ngờ rằng Aerospike trong số những người khác, bởi vì Aerospike được điều khiển bởi hiệu suất, có lẽ họ đã xem xét và tìm ra nơi mà nó thực sự sẽ đi với cách mà sản phẩm hoạt động.
Chúng tôi đã có một hệ thống trên một con chip chưa được cất cánh. SSD mà chúng ta biết, nhưng điểm cần làm là chúng thực sự đang tăng tốc độ, gần bằng tốc độ của luật Moore, hệ số 10 cứ sau sáu năm. Nhưng Intel sắp phát hành điểm chéo 3D, công ty tuyên bố có thể đi nhanh hơn hàng trăm lần so với SSD, trên thực tế, loại này rơi vào hỗn hợp, sau đó sẽ thay đổi tốc độ mà các sản phẩm như Aerospike thực sự có thể đi.
Sau đó, chúng ta đã có các kiến trúc phần cứng song song, nói cách khác là cách chúng ta xây dựng phần cứng theo nghĩa - ban đầu nó chỉ là một CPU ngồi trên bộ nhớ, nằm trên đĩa, nhưng nó trở nên phức tạp hơn thế. Ý tưởng của một hệ thống trên chip là bạn thực sự có thể có chip song song để chip sang chip và khiến mọi thứ diễn ra với tốc độ phi thường, và chúng tôi không biết chính xác những sản phẩm này sẽ thực sự thống trị.
Đó chỉ là một cái nhìn về tương lai, nhưng ở cấp độ phần cứng, hiệu năng đang tăng lên và chi phí tiếp tục giảm, giống như những gì Dez đã mô tả. CPU của bạn không nhất thiết phải rẻ hơn, chúng chỉ nhanh hơn và cứ thế.
Từ góc độ kinh doanh, trong một số tình huống, và đây là những tình huống thị trường, đầu tiên là giá trị kinh doanh. Nếu bạn đặc biệt - nếu bạn hoàn toàn tin tưởng một cổ phiếu cụ thể sẽ giảm giá, người đầu tiên nhận được lệnh bán sẽ có giá tốt nhất. Nó thực sự đơn giản. Do đó, có một cuộc đua công nghệ tiếp tục giao dịch tự động trong các ngân hàng để thực sự cố gắng và chiến thắng những tình huống này. Điều gì xảy ra sau đó? Điều gì xảy ra sau khi các ngân hàng đã làm việc của họ với tất cả điều đó? Bạn đột nhiên bắt đầu thấy các khu vực khác bị nhiễm cùng loại nhu cầu về tốc độ.
Thực sự những gì đang xảy ra, là con người đã bị loại khỏi phương trình, và điều đó đã xảy ra với quảng cáo trên internet rất nhanh. Nhưng vấn đề là, đó không phải là giao dịch cụ thể, thực thi các phương thức, đây là toàn bộ quy trình kinh doanh, thực tế là một trang web vừa bị hủy bỏ và một quyết định cần phải được đưa ra có thể là một quyết định khá phức tạp, đối với những gì quảng cáo thực sự được đưa lên trang web đó, suy luận từ bất kỳ ai sử dụng trình duyệt là quảng cáo phù hợp nhất để đưa nó lên, v.v. Nó trở thành một thứ rất phức tạp và tôi sẽ nhắc lại lần nữa.
Nhưng vấn đề là hiệu suất và khả năng mở rộng của quy trình kinh doanh, không phải là vấn đề giống như hiệu suất và khả năng mở rộng của khả năng truy vấn, và đây là điều mà tôi biết rõ, vì một phòng họp ngắn gần đây chúng tôi đã làm với Aerospike mà họ đã làm Tôi cũng nhận thức được. Một điều nữa, khi bạn thực sự làm việc ở những tốc độ này, các thuộc tính tài sản quan trọng đối với một giao dịch, bất kỳ quá trình xử lý sự kiện nào. Họ thực sự, thực sự quan trọng. Vì vậy, rất nhiều điều mà một số cơ sở dữ liệu đang làm, mất một hoặc hai chữ cái từ tài sản, có thể hoạt động hợp lý trong bối cảnh - điều này sẽ hoạt động tốt trong bối cảnh chúng ta đang nói đến. Thành thật mà nói, nó không được chấp nhận.
Từ góc độ công nghệ, bạn thực sự đang nhìn vào - Tôi biết có hai loại đòn bẩy, để tạo ra loại kiến trúc thực sự cần thiết để đưa ra loại tốc độ có thể làm, như Aerospike, có thể thực hiện một triệu giao dịch môi giây. Bạn cần phải thực sự rất chính xác về mặt phát triển phần mềm. Bạn không thể hack đi. Bạn cần quan tâm về độ dài đường dẫn mã. Bạn cần sử dụng tuyệt vời trong bộ nhớ và bạn thực sự tối ưu hóa toàn bộ giao dịch. Bạn cần song song thông minh và bạn cũng cần song song không an toàn. Bạn cần mở rộng quy mô, thay vì mở rộng quy mô, vì ngay khi bạn liên quan đến mạng trong bất kỳ điều gì, nó sẽ trở thành con trỏ có khả năng cao nhất mà bạn sẽ gặp độ trễ và nó sẽ bắt đầu khiến các giao dịch trở nên quá chậm.
Bạn phải nhận được càng nhiều càng tốt vào bất kỳ mạng nào được biết trước khi bạn thực sự mở rộng quy mô và bạn thực sự không muốn mở rộng nhanh chóng, bạn thực sự không muốn nhiều quy trình. Bạn muốn một mạng không được sử dụng bởi bất kỳ ai khác. Và bạn muốn có một mạng cực kỳ nhanh.
Lưu trữ SSD tăng tốc là một cái gì đó - thực sự tôi nghĩ rằng hầu hết những điều này áp dụng cho những gì Aerospike làm. Một trong những điều thú vị là, đó là cơ sở dữ liệu NoQuery. Nó đã từng được tin - tôi không biết, một số năm trước - người ta thường tin rằng cơ sở dữ liệu quan hệ là cơ sở dữ liệu duy nhất và nó chi phối tất cả mọi thứ, và đó chỉ là tình huống nhỏ lẻ mà bạn không cần để đi quan hệ. Bây giờ là kiểu quay đầu của nó. Đó là cơ sở dữ liệu nhanh trên các cơ sở dữ liệu SQL đó và một trong những lý do cho điều đó, lý do chính cho điều đó là vì họ tránh tham gia dữ liệu, họ lưu trữ dữ liệu khá nhiều theo kiểu đối tượng. Khi bạn kết thúc với một đối tượng, bạn chỉ cần lưu trữ nó và sau đó bạn kéo toàn bộ đối tượng lại, nó không kết hợp mọi thứ lại với nhau để thực sự xử lý chúng. Đây là những gì tốc độ là về. Những loại kỹ thuật tạo ra tốc độ trong bối cảnh cơ sở dữ liệu.
Đây là dấu vết của nước mắt, đây là, những gì đã xảy ra với cơ sở dữ liệu. Câu chuyện hoặc tường thuật về cơ sở dữ liệu quan hệ là kết thúc của cơ sở dữ liệu thực sự không đúng. Ngay cả khi họ bắt đầu thống trị, nó vẫn cần thiết. Các cơ sở dữ liệu đối tượng đã thực hiện các giao dịch trong quá khứ vào những ngày đó, vì các cơ sở dữ liệu quan hệ thực sự không thể thực hiện được, và sau đó hóa ra các cơ sở dữ liệu quan hệ sử dụng các cửa hàng, chúng cũng không thể thực hiện các truy vấn nhanh, bạn cần lưu trữ cột. Và sau đó chúng tôi phát hiện ra rằng nếu bạn thực sự muốn thực hiện các truy vấn đồ họa trên dữ liệu, thì việc lưu trữ cột và cơ sở dữ liệu quan hệ sẽ không tốt, và bạn thực sự cần phải có một cơ sở dữ liệu nhận biết biểu đồ cụ thể được xây dựng cho bạn. Sau đó, cơ sở dữ liệu RDF xuất hiện và ngay khi bạn thực sự bắt đầu xem xét ý nghĩa của ngữ nghĩa và chúng tôi đã nhận được cơ sở dữ liệu NoQuery, rất, rất đặc biệt về tốc độ. Để gọi chúng là NoQuery gần như là bạn đang xây dựng thương hiệu cho tất cả các cơ sở dữ liệu này như thể chúng giống nhau, thực ra chúng hoàn toàn khác nhau ở những gì nằm bên dưới. Lý do duy nhất khiến họ mang cái tên NoQuery là vì họ không cho SQL chết tiệt vì nó quá đắt. Độ trễ giao dịch mà họ cần.
IoT - mà tôi nghĩ rằng tôi đã hoàn thành cùng một điểm mà Dez đã hoàn thành nó - nó chưa kết thúc, tất cả tình huống này về tốc độ và yêu cầu độ trễ, nó sẽ không kết thúc cho đến khi người phụ nữ béo bắt đầu làm mất dữ liệu này và nó chưa thực sự bắt đầu. Rất nhiều dữ liệu đó sẽ muốn có độ trễ mà tôi đã chỉ ra, vì vậy tôi nghĩ đó là tất cả những gì tôi phải nói. Hãy giao nó cho Aerospike và Brian Bulkowski.
Brian Bulkowski: Xin chào, cảm ơn rất nhiều vì đã tham gia Nhóm Bloor và bản thân tôi cho bài thuyết trình hôm nay. Khi nghĩ về những gì Dez và Robin vừa nói, tôi muốn kể cho bạn nghe một chút về con đường mà Aerospike đã thực hiện khi cung cấp công nghệ cơ sở dữ liệu mới và công nghệ cơ sở dữ liệu NoQuery cho một số ngành công nghiệp. Đó là một con đường tuyệt vời. Chúng tôi bắt đầu Aerospike vào năm 2008 khi thấy rất nhiều xu hướng mà Dez và Robin đã đề cập. Cụ thể về cơ sở dữ liệu trong bộ nhớ có thể tận dụng flash, cũng như loại hệ thống đám mây mở rộng quy mô và các loại quy mô cần thiết để cá nhân hóa, phân tích hành vi và loại trải nghiệm VIP nổi tiếng đã được thảo luận.
Khi chúng tôi tiếp cận vấn đề của cơ sở dữ liệu là cơ sở dữ liệu hoạt động ở mặt trước có khả năng cung cấp nền tảng cho các ứng dụng có thể được viết để giải quyết chúng, chúng tôi bắt đầu với vấn đề làm thế nào chúng ta có thể xây dựng một bảng băm phân tán, bộ nhớ bảng băm phân phối có tốc độ nhanh đáng kinh ngạc và có khả năng thực hiện những thứ như hàng triệu giao dịch mỗi giây, nhưng với giá cả hợp lý. Khi chúng tôi hoàn thành nguyên mẫu của mình, chúng tôi nhận ra rằng sau đó chúng tôi sẽ phải tìm ra ai có thể cần loại tốc độ này. Là một công ty ở Thung lũng Silicon, chúng tôi nhanh chóng nhận thấy rằng đó thực sự là ngành quảng cáo có khả năng tiêu thụ loại thông tin này và quan tâm đến nó, vì vậy tôi muốn dành một giây để nói về đấu thầu theo thời gian thực và cách thức này công trình thị trường.
Robin đã đề cập đến cách giao dịch tài chính hoạt động, giao dịch đầu tiên thường là giao dịch chiến thắng và về cơ bản là thời gian để thị trường có độ trễ và giá trị cho độ trễ. Theo một cách thú vị, ngành quảng cáo hơi khác một chút, bởi vì mục tiêu trong quảng cáo là đặc biệt - thứ gọi là ấn tượng, khả năng phân phối quảng cáo - là một phiên đấu giá và cuộc đấu giá diễn ra trong khoảng từ mười mili giây đến năm mươi mili giây. Tên của trò chơi, và thường có hàng trăm công ty hiện đang đấu thầu theo thời gian thực trên mỗi quảng cáo được đặt trên internet, để có được lượng dữ liệu nhiều nhất và mang lại các thuật toán tốt nhất trong vòng mười đến năm mươi mili giây trong lượng dữ liệu lớn nhất.
Sự thay đổi và thay đổi này đã xảy ra trong ngành quảng cáo, cứ sau một phần nghìn giây đó, có một sự phức tạp theo thời gian với các thuật toán tốt nhất với lượng dữ liệu lớn nhất và để làm được điều đó, bạn sẽ tập hợp được rất nhiều mẩu nhỏ dữ liệu. Thông tin địa chỉ IP gần đây, thông tin gần đây về một loại thiết bị cụ thể, thông tin gần đây về hành vi trang web, cụm từ tìm kiếm gần đây, tất cả sẽ đi vào nước sốt bí mật của thuật toán của một công ty cụ thể để xác định giá và giá thầu.
Đây là một thị trường hấp dẫn là một phần của. Lần đầu tiên chúng tôi đã triển khai lần đầu tiên tại Aerospike vào năm 2010 với một số công ty đầu tiên hoạt động nghiêm túc trong nền kinh tế đấu thầu thời gian thực, và sau đó đã đạt được, về cơ bản là kho dữ liệu hành vi, cho phần lớn các công ty trong đó không gian. Những gì chúng tôi đã tìm thấy kể từ đó, và là một kiến trúc cụ thể mà tôi sẽ trình bày chi tiết trong suốt quá trình trình bày này, đó là tất cả đã xảy ra vào năm 2010, 2011, 2013 và tiếp tục phát triển. Quảng cáo là một thị trường rất năng động.
Nhưng loại trải nghiệm VIP đó, bạn có thể nghĩ là đặt quảng cáo phù hợp, không đặt quảng cáo cho các sản phẩm của trẻ em, vì tôi không có con, vì vậy tôi sẽ không có quảng cáo hiệu quả nếu đó là quảng cáo hiệu quả. đặt trên đó, nhưng nếu đó là về những chiếc xe nhanh thì đó là loại quảng cáo được đặt cho Brian. Đó thực sự là loại trải nghiệm VIP trong các giao dịch, trong việc có nên giảm giá hay không, nếu bạn đang ở trên một trang web bán lẻ, ngay cả trong việc phát hiện gian lận. Đây có phải là mô hình bình thường của một người cụ thể, hoặc một thẻ tín dụng cụ thể? Tất cả các dạng công nghệ phân tích thời gian thực đó, dự đoán hành vi, phân tích dự đoán, hiện đang thoát ra khỏi ngành quảng cáo, hoạt động để giải trí và kiếm lợi nhuận trong một vài năm và thực sự được bán lẻ và ngân hàng, và phát hiện gian lận, vv, thông qua một kiến trúc cụ thể. Vì vậy, Aerospike đã được vinh dự là một phần của một số trường hợp đó.
Kiến trúc mà chúng ta thấy đang hoạt động và thực tế để thực hiện điều này, là một trong đó thay vì tạo một bộ truy vấn từ máy chủ ứng dụng, thay vì chuyển nhiều tính toán của bạn sang chính máy chủ ứng dụng, sau đó sử dụng cơ sở dữ liệu về cơ bản là lưu trữ động cơ cho loại đối tượng mà Robin đang nói đến. Trong trường hợp này, các kiến trúc này, trước hết đừng nhầm lẫn điều này với các phân tích thực tế của bạn ở đây. Bạn thấy ở phía bên phải của slide này vẫn còn phân tích ở đây để tạo thông tin chi tiết. Đây là những công việc thường làm việc trên petabyte, hàng chục petabyte dữ liệu, thậm chí exabyte trong trường hợp của một số khách hàng lớn của chúng tôi, sử dụng nhiều công nghệ. Bạn cần phải có một nhóm dữ liệu lớn, một nhóm phân tích, một nhóm định lượng ở đó để tìm ra điều gì, nói, tọa độ không gian địa lý, mô hình nào hoạt động trong việc tìm kiếm các mối quan hệ đó và tạo ra trải nghiệm VIP. Đó là toàn bộ vấn đề cho chính nó và không phải là vấn đề mà Aerospike đã trực tiếp tham gia, và có một loạt công nghệ tuyệt vời khi bạn xử lý loại hệ thống đó.
Điều chúng tôi rất hào hứng và làm việc với ngành công nghiệp là, khi bạn có những hiểu biết đó, làm thế nào để bạn tham gia vào loại giao dịch giữa máy với máy hoặc giao dịch nhanh với con người, nơi bạn có những hiểu biết đó và thực hiện Họ thực sự cho mỗi người, từng khoảnh khắc? Kiến trúc mà chúng ta đã thấy sử dụng đó là một máy chủ ứng dụng được viết và nó đang thực hiện tất cả các phép toán đó và xem qua các mô hình mà bạn đã tạo và xem xét hành vi gần đây và thực hiện điều đó về cơ bản là một mô hình chính hoặc ít nhất là loại ánh sáng truy vấn rất nhẹ của hệ thống.
Khi bạn đang xử lý các loại dữ liệu mà chúng ta đang nói đến, loại luồng mà chúng ta đang nói đến, với hàng triệu lần viết mỗi giây, hàng triệu lượt đọc mỗi giây, hàng triệu và hàng trăm nghìn quyết định mỗi Thứ hai, xây dựng các chỉ mục phức tạp, chỉ mục đa chiều, đơn giản là không hoạt động tốt, nó không thể mở rộng. Cách để đạt được hình thức quy mô này là tham gia nhiều hoạt động song song. Chúng ta sẽ nói một chút về cách chúng ta làm điều đó sau. Nhưng một phần trong đó là một máy chủ ứng dụng phi trạng thái được viết bằng ngôn ngữ của bạn.
Những gì chúng ta thường thấy là một dự án cụ thể giả định một khung ứng dụng mới dựa trên những người làm việc ở đó, công nghệ mà họ đang sử dụng và vấn đề mà họ đang tiếp cận. Chúng ta đã thấy mọi người sử dụng Python, rất nhiều người sử dụng Java, chúng ta vẫn thấy các lập trình viên C, bởi vì rất nhiều thứ này vẫn có hiệu suất cao, thậm chí có thể sử dụng những thứ như các thư viện MATLAB cũ. Và họ cần chạm vào hàng ngàn điểm hàng nghìn dữ liệu mỗi giây để đưa ra quyết định hiệu quả.
Một câu hỏi mà đôi khi tôi đã hỏi là, Well Well, Brian, nếu bạn có khả năng hàng triệu giao dịch mỗi giây, ai cần điều đó? Ví dụ, nếu bạn nhìn vào, ví dụ, xử lý thanh toán ở Bắc Mỹ và Aerospike có liên quan đến các giải pháp phát hiện gian lận trong hệ thống đó và hỗ trợ các nhà văn ứng dụng đang thực hiện một số điều rất sáng tạo trong phát hiện gian lận, chỉ có vài nghìn giao dịch thanh toán mỗi giây chảy qua cả bộ xử lý thanh toán lớn nhất. Tuy nhiên, khi công ty đầu tiên đến gặp chúng tôi và nói rằng họ đang xem xét sử dụng NoQuery và muốn xem giải pháp của chúng tôi sẽ như thế nào trong việc củng cố ứng dụng của họ, họ nói rằng họ muốn chạm vào 5.000 mẩu dữ liệu trong cửa sổ 750 mili giây. Giờ đây, đột nhiên bạn có vài trăm giao dịch kinh doanh và vài nghìn dữ liệu cần xem xét trong mỗi lần tính toán, và giờ bạn đang ở trong khu vực cần hàng triệu giao dịch mỗi giây.
Trường hợp - tạm gác quảng cáo sang một giây, trường hợp lừa đảo rất hấp dẫn bởi vì ở đó có tiền, có gian lận và phòng chống gian lận trong thời gian thực, trái ngược với việc cố gắng phân loại sau khi lừa đảo xảy ra, thực sự là một vấn đề đưa trực tuyến càng nhiều dữ liệu càng tốt, và bạn có thể nghĩ về nó như một sự phản ánh của trải nghiệm VIP đó. Có phải người này cư xử theo cách mà họ không thường cư xử? Và do đó, cơ hội của nó là một hệ thống lừa đảo, và không thực sự là người này, tăng lên. Người này có thường truy cập thông qua một thiết bị cụ thể hoặc một bộ thiết bị nào đó, với một bộ độ phân giải màn hình nhất định không? Họ có thường thể hiện một mô hình mua sắm hành vi cụ thể? Có lẽ chúng ta có thể xử lý gian lận trong quá trình giao dịch. Điều đó sẽ nhắc nhở bạn rất nhiều về những điều xảy ra trong một giao dịch trong hệ thống quảng cáo.
Các loại hệ thống chúng tôi giải quyết là những hệ thống mà mỗi bộ xử lý thanh toán riêng lẻ có một nhóm dữ liệu lớn, chúng có nhiều dữ liệu lịch sử, chúng đang tạo ra các mô hình mới, chúng không chia sẻ với chúng tôi tại Aerospike tất cả các mô hình, bởi vì chúng Đây thực sự là một loại nước sốt bí mật. Nếu bạn là người đăng ký với Gartner và bạn đã nghe Gartner nói về nền kinh tế thuật toán, thì đây là một thuật toán và một công ty chiến đấu trực tiếp để giảm gian lận và tăng số lượng giao dịch thành công, vì bạn cũng không ' t muốn chặn giao dịch. Đó là loại dự án mà chúng tôi tìm kiếm trong Hàng không vũ trụ ở các cấp độ quy mô này.
Một trường hợp khác mà chúng tôi đã làm việc với các công ty dịch vụ tài chính, đó là Hệ thống hồ sơ Intraday. Trong trường hợp này, những gì đang xảy ra là loại trải nghiệm phong phú hơn, ngay cả trong một hệ thống giao dịch bán lẻ, là một trong những nơi tôi muốn có thể nhìn vào vị trí cụ thể của mình và tôi muốn làm điều đó cực kỳ chính xác. Tôi không muốn có một lưu ý trước hệ thống DB2 của mình. Thay vào đó, tôi muốn xem xét dữ liệu chính xác và giữa điện thoại di động, nhưng cũng có những thứ như tính toán lại rủi ro, tính toán lại rủi ro nên được thực hiện trên cơ sở từng phút, bạn muốn có thể tính toán lại rủi ro của mọi người cũng như rủi ro toàn cầu, rủi ro hệ thống trên toàn bộ công ty trong vòng vài phút.
Và một lần nữa, đó là vấn đề tương tự. Mỗi một tài khoản là một tài khoản cụ thể, hãy coi đó là một tra cứu giá trị chính cho một đối tượng cụ thể, sau đó điều này có thể được thực hiện song song và quan trọng nhất là mô hình này cho phép bạn viết mã và thuật toán của mình bằng ngôn ngữ cấp cao, đó là dễ dàng hơn để gỡ lỗi và thời gian nhanh hơn để thị trường. Trong nền kinh tế thuật toán này, tôi cần có thể đưa các thuật toán của mình lên mạng ngay bây giờ. Đây là một vấn đề rất khác nhau cho mô hình hóa và mối quan hệ kinh doanh, đó là những gì các hệ thống quan hệ là tuyệt vời. Khi bạn có một bảng các bộ phận và các bộ phận đó được liên kết với các đơn đặt hàng và các đơn hàng đó được liên kết với mọi người, bạn đã có một quy trình kinh doanh có thể được mô hình hóa nghiêm ngặt và có thể sẽ không thay đổi trong suốt thời gian kinh doanh của bạn. Tuy nhiên, một thuật toán mới để tìm ra mô hình gian lận mới phải được viết chính xác và nhanh chóng, và trực tuyến, đưa ra quyết định kinh doanh trong vòng vài ngày, nếu không nhanh hơn. Một giải pháp NoQuery cho loại hệ thống bản ghi này thực sự là một hệ thống tuyệt vời cho những người này, bởi vì nó cho phép họ nhập dữ liệu rất nhanh, cũng như xây dựng các thuật toán mới, vì vậy không chỉ là trải nghiệm khách hàng mới trong việc xử lý di động, mà thực sự là xây dựng một loạt các ứng dụng mới.
Những gì chúng ta thấy trong dài hạn tại Aerospike là thực tế là mỗi loại cơ sở dữ liệu, mỗi bố cục dữ liệu vật lý trên đĩa đều có các thành phần riêng và tại Aerospike, chúng tôi thực sự tập trung vào giá trị quan trọng này hoặc hệ thống định hướng theo vai trò, như Robin nói., với tính nhất quán giao dịch cao và thực sự cho phép mọi người như các cửa hàng cột và hồ dữ liệu khối lượng lớn cũng như các hệ thống giao dịch khó tính cũng có các ràng buộc báo cáo về chúng. Chúng tôi thấy tất cả chúng cần phải cung cấp cho nhiều công cụ truy vấn khác nhau. Chúng tôi thấy một số công cụ truy vấn dựa trên JSON. Chúng tôi thấy những thứ như tìm kiếm đàn hồi, chúng tôi thấy Spark, tất cả đều cần các giống khác nhau vào những thời điểm khác nhau như các cửa hàng cột, cũng như các cửa hàng, đó là nơi Aerospike vượt trội.
Chúng tôi thực sự thấy rằng các loại khác nhau và ngành công nghiệp đang đi đến điểm mà việc chọn giống tốt nhất của mỗi loại sẽ là một điều cần thiết. Thật không may, do thực tế của phân tích dài hạn và các công việc theo đợt phân tích và các hạn chế hoạt động, có lẽ chúng ta sẽ không đến mức có một, một kích thước phù hợp với tất cả, nhưng chúng ta sẽ đi đến điểm có thể để chọn rõ ràng giữa một số bố trí dữ liệu cốt lõi.
Hãy nói một phút về sự đổi mới của đèn flash. Tôi vẫn nhận được câu hỏi, mặc dù như đã nhận xét trước đó, flash đã ở với chúng tôi trong một thời gian dài. Khi chúng tôi bắt đầu Aerospike vào năm 2009 là khi tôi tin rằng 2009, có lẽ, vâng, 2009 là khi Intel ra mắt X25, đây thực sự là ổ đĩa flash có người lái SATA trên thị trường đại chúng, và đã có một số hệ thống flash trước đó, nhưng thực sự đó là thứ đã phá vỡ rất nhiều ý thức của công nghệ. Fusion-io thực sự đã mang flash đến thị trường doanh nghiệp rộng lớn hơn sau đó.
Điều đang xảy ra bây giờ là sự ra đời của một hệ thống có tên NVMe. NVMe là một tiêu chuẩn tương tự như SATA hoặc SAS hoặc thậm chí SCSI, cho phép các nhà cung cấp thẻ khác nhau có thể tương tác với các trình điều khiển trong hệ điều hành với mức độ hiệu quả cao. Vì vậy, nó tạo ra một mức hiệu suất cao hơn, trước hết là vì NVMe dựa trên PCIE như là phương tiện vận chuyển cơ bản của nó, nhanh hơn nhiều so với SATA, SAS hoặc bất cứ thứ gì khác, nhưng nó cũng cho phép các trình điều khiển tốt nhất.
Ví dụ, trong Linux, anh chàng Jens này và Jens là hướng dẫn viên NVMe, Jens expo và anh ta làm việc tốt hơn bất kỳ cá nhân nào mà Intel hay Fusion-io có thể làm với trình điều khiển cá nhân của họ, bằng tất cả tài nguyên của họ. Khi bạn có sức mạnh của chính hệ điều hành để có thể xây dựng trình điều khiển tốt nhất, chúng ta sẽ thấy một số mức hiệu suất thực sự tuyệt vời. Tất cả điều này ủng hộ ý tưởng rằng flash thực sự có thể cung cấp rất nhiều độ trễ thấp của RAM.
Bây giờ, Aerospike vẫn là một cơ sở dữ liệu RAM tuyệt vời do mô hình cụm của nó, tuy nhiên, chúng tôi thấy rằng một khi bạn đang thực hiện một bước nhảy mạng, mà bạn cần có bộ nhớ có thể mở rộng, bạn đã dành ít nhất năm đến 50 micro giây thêm 70 micro giây của NAND thường không phải là trở ngại và bạn cũng có thể sử dụng flash, với điều kiện là flash NAND, với điều kiện là mạng đã tham gia vào đó. Nhiều người sau đó tự hỏi về cách - tất cả điều này nghe có vẻ tuyệt vời nếu bạn mua phần cứng của riêng mình, đám mây công cộng đang hoạt động như thế nào? Tôi nghĩ rằng bạn sẽ tìm thấy ngay bây giờ, bất kể bạn đang sử dụng đám mây công cộng nào, những đám mây công cộng đó có các dịch vụ flash rất mạnh. Nó khác một chút từ nhà cung cấp đám mây đến nhà cung cấp đám mây. Amazon có các phiên bản I2 đã ra mắt tôi nghĩ rằng một năm, hai năm nay, đó là những thiết kế flash chất lượng thực sự khá cao và Aerospike có mô hình triển khai trên đầu chúng.
Tôi muốn gọi riêng cho Google Compute, Google Compute Engine, Google Cloud, bởi vì theo kinh nghiệm của chúng tôi, cho đến nay họ có một số thiết bị hiệu suất cao nhất và một số tính linh hoạt nhất về các mẫu triển khai. Nhưng bạn cũng thấy các mẫu triển khai mới như Pivotal, là một loại công khai / riêng tư, vì vậy bạn có thể thực hiện đúng các ứng dụng Pivotal cả hai nơi hỗ trợ flash và hỗ trợ các thiết bị lưu trữ khác nhau cũng như các mẫu Docker. Vì vậy, thực sự, đây là một điểm trong lịch sử nơi flash không chỉ có sẵn để bạn mua và đưa vào trung tâm dữ liệu của mình, mà thực sự đã chìm trong tất cả các nhà cung cấp cơ sở hạ tầng, bởi vì đó thực sự là cách tốt nhất để có được các hệ thống IOPS cao tại độ trễ rất hợp lý.
Chỉ một khoảnh khắc về Aerospike - Aerospike là một cơ sở dữ liệu phân tán cụm, điều này làm cho nó rất phù hợp cho việc triển khai theo kiểu đám mây cũng như các trung tâm dữ liệu. Chúng tôi thấy rằng tính linh hoạt của việc có thể thêm nhiều dữ liệu hơn và hiệu suất cao hơn là hoàn toàn cần thiết trong các loại ứng dụng mới này vì bạn bắt đầu một dự án, bạn không biết nếu bạn cần năm mươi nghìn giao dịch mỗi giây, một trăm nghìn, một triệu, hai triệu, vì vậy bạn muốn tạo cho mình một khoảng trống để có thể thêm máy chủ. Tuy nhiên, bạn muốn mở rộng quy mô để mỗi máy chủ có thể tự chạy nhanh. Bạn không thực sự muốn kết thúc với năm trăm hoặc một nghìn máy chủ là máy chủ cơ sở dữ liệu chậm. Scale out không phải là trò chơi duy nhất trong thị trấn, quy mô của nó và mở rộng quy mô, như Dez đã nói trước đó, có một trục Z mới.
Hy vọng rằng sẽ cung cấp cho bạn một số ý tưởng mới về tốc độ và quy mô đang giải quyết các thị trường mới và có lẽ có những dự án bạn đang làm việc ở đó bạn sẽ có thể xem xét thực sự xây dựng các ứng dụng phong phú hơn và sử dụng khung ứng dụng với nhiều khóa hơn giá trị hoặc cơ sở dữ liệu NoQuery bên dưới nó. Tại Aerospike chắc chắn tôi đã thấy rất nhiều khách hàng của chúng tôi và rất nhiều người dùng nguồn mở của chúng tôi thành công với mô hình đó và tôi mong muốn ngành công nghiệp áp dụng nó ở mức độ lớn hơn.
Rebecca Jozwiak: Cảm ơn rất nhiều Brian, và tôi chắc chắn Dez và Robin có một số câu hỏi hay cho bạn. Robin?
Dez Blanchfield: Tôi rất vui khi nhảy vào. Robin, bạn có câu hỏi nào không? Nếu không, tôi có một cái nhanh chóng tôi có thể bắt đầu.
Robin Bloor: Xin lỗi, tôi đã bị câm. Tôi đã lặn xuống, nhưng không ai nghe thấy tôi. Câu hỏi ngay lập tức xảy ra với tôi, bởi vì đây là một bộ khả năng công nghệ rất tinh vi. Đối với các khách hàng hiện tại bạn có, loại leo thang hoặc tỷ lệ giao dịch mà bạn gặp phải liên quan đến một số ứng dụng quảng cáo này là gì? Là tỷ lệ giao dịch tiếp tục tăng? Và nếu vậy, với tỷ lệ nào?
Brian Bulkowski: Câu hỏi thú vị, Robin. Mỗi ngành có một đường cong riêng trong mỗi công ty. Hãy xem quảng cáo ở Bắc Mỹ, vào năm 2012, quảng cáo ở Bắc Mỹ đã chạy gần 200.000 quảng cáo mỗi giây, theo loại tiêu chuẩn, không phải thời gian của tôi, và giờ đây có thể leo thang lên khoảng 3-5 triệu quảng cáo mỗi giây. Nhưng sau đó, một điều thú vị đã xảy ra. Ngành quảng cáo bắt đầu giải quyết một số lo ngại về gian lận và các bộ phận của ngành có thể ngăn chặn gian lận, tỷ lệ giao dịch giảm một chút, về một yếu tố hai, trong một số khách hàng tinh vi hơn của chúng tôi có thể xác định gian lận. Tất nhiên họ phải thực hiện một số tra cứu cơ sở dữ liệu để ngăn chặn gian lận, vì vậy cuối cùng thì nó cũng giống như vậy.
Một trường hợp sử dụng thú vị là trong ngành viễn thông, tôi thực sự không đề cập rằng, viễn thông đã chứng kiến các giao dịch tăng lên do thanh toán dựa trên mỗi gói tin đi qua mạng điện thoại di động. Ngày xưa, chúng ta đã gọi các bản ghi chi tiết và cứ sau một phút, một cuộc gọi, bạn biết gì, một quả bóng bàn nhỏ sẽ lướt qua mạng và anh chàng này có còn một phút không? Bây giờ chúng tôi phải xây dựng và thậm chí định tuyến dựa trên mỗi gói trên internet. Đó là - xin lỗi trong một mạng di động, hiện đột nhiên hàng triệu gói mỗi giây và thứ gì đó cứ lặp đi lặp lại. Vì vậy, một trường hợp là mọi ứng dụng đang lái một loại nhỏ 2X mỗi năm. Trong một số khách hàng, chúng tôi thấy, nhưng Nhưng chờ đã, tôi có một ứng dụng mới. Tôi muốn thêm một số gian lận vào rủi ro của tôi. Tôi muốn thêm một số trải nghiệm khách hàng sâu sắc hơn vào gian lận và rủi ro của tôi. Mỗi người trong số họ tạo ra tải mới trên cơ sở dữ liệu cơ bản.
Robin Bloor: Vâng, ý tôi là tôi nghĩ đó là những gì tôi đã gợi ý trong bài trình bày ngắn gọn mà tôi đã đưa ra, rằng những điều này - chúng tôi từng nghĩ rằng một giao dịch là, ai đó làm gì đó và có thể có một loạt các sự kiện và tất cả đều được ghi lại và bây giờ rất nhiều giao dịch có số lượng tra cứu khổng lồ và bạn đã đưa ra một số ví dụ trong bản trình bày. Và do đó, bạn không thực sự thực hiện một giao dịch nữa, bạn thực sự đang thực hiện một loại ứng dụng có thể có nhiều, nhiều yếu tố cho nó.
Câu hỏi khác trước khi tôi trao cho Dez - vì rõ ràng chúng tôi đang gắn thẻ cho vấn đề này - câu hỏi khác mà tôi muốn bạn trả lời nếu bạn có câu trả lời hợp lý cho nó, cả Dez và tôi đều mong đợi Internet Mọi thứ, hay Internet của mọi thứ như đôi khi được gọi, để tạo ra một lưu lượng giao dịch khá ấn tượng. Bạn có thể nói chuyện đó không? Đó có phải là kinh nghiệm của bạn, bạn có khách hàng đến với bạn với loại vấn đề đặc biệt đó không, và quan điểm của bạn về vấn đề này vào lúc này là gì?
Brian Bulkowski: Chắc chắn, tôi nghĩ rằng có một chút nhầm lẫn, và đó là nói một cách nhẹ nhàng, về Internet of Things. Các khách hàng mà tôi thấy cho đến nay chỉ đơn giản là đưa internet đến những thứ mà họ có. Hãy nghĩ về các nút Amazon đó - tất cả đều là Amazon - các nút đó, bạn không thể tái sử dụng chúng và đưa chúng đến Walmart trực tuyến. Nó không giống như một trình duyệt mà bạn có thể trộn và kết hợp mọi thứ. Mặt khác, máy-to-machine đang xảy ra và khi bạn cắm chiếc xe Tesla của mình để sạc, Tesla sẽ gửi một luồng thông tin khổng lồ, từng cảm biến vào xe, nhưng nó chảy vào máy tính của Tesla để phân tích và cải thiện chất lượng. Những gì tôi thấy là, tất cả các máy này với máy khác, và tất cả các cảm biến trong một công ty riêng lẻ, tạo ra nhu cầu mới.
Ngày nay, chủ yếu là vào các hệ thống phân tích này, và lấy trường hợp của Tesla; Theo hiểu biết đầu tiên của Tesla, theo sự hiểu biết của tôi, là để cải thiện tuổi thọ pin, dưới quyền, Nhiệt độ hoạt động của chúng là bao nhiêu, tải là gì? Hãy nhìn xem, hãy thiết kế một loại pin tốt hơn. Sau đó, họ bắt đầu suy nghĩ, và điều đó thật tuyệt, đó là một vấn đề phân tích sâu sắc rất hấp dẫn, câu hỏi tiếp theo là, Làm thế nào để tôi cải thiện trải nghiệm từng khoảnh khắc ?
Bây giờ, hãy xem trường hợp như Nest, nơi bạn đang cố gắng phân tích dự đoán để thay đổi từng khoảnh khắc nhiệt độ trong nhà. Đó là loại trường hợp chúng ta bắt đầu nhìn thấy trong Hàng không vũ trụ, nơi có hồ dữ liệu khổng lồ này và có quá trình phân tích khổng lồ này, nhưng tôi sẽ làm gì bây giờ? Tôi sẽ cần phải giữ, nghĩ về nó như tiền mặt, một phần của tuần trước, tháng trước, thậm chí có thể chỉ là giá trị thông tin của ngày cuối cùng, có lẽ là ở mặt sau vì chúng ta đang xử lý cảm biến đơn giản các thiết bị và tôi sẽ thực hiện một bộ phân tích vào thời điểm đó để thay đổi trải nghiệm. Đó là những trải nghiệm giống như Nest, một trải nghiệm mà tôi thấy trong trường hợp sử dụng Aerospike.
Robin Bloor: Được rồi, điều mà tôi đang mong đợi với Internet of Things, là bạn sẽ bắt đầu có các trình kích hoạt ngưỡng và họ sẽ bắt đầu tạo ra các chuỗi sự kiện. Bạn đã thấy bất cứ điều gì như vậy, hoặc đó không phải là bất cứ điều gì bạn đã thấy?
Brian Bulkowski: Dez và tôi đã - Tôi chỉ hỏi ý kiến của Dez về điều đó khi chúng tôi trò chuyện trước buổi diễn. Điều tôi chưa thấy là loại thác dữ liệu của một công ty đổ vào một công ty khác, rằng tủ lạnh Samsung của tôi đang nói chuyện với máy giặt LG của tôi vì nó phát hiện ra rằng tôi đã đổ cả đống sô cô la khắp sàn nhà, vì vậy Đó là loại công ty đến thiết bị của công ty bằng thiết bị, tôi nghĩ rằng tôi vẫn đang chờ đợi điều đó về Internet of Things. Tôi nghĩ rằng có một số vấn đề trong kinh doanh và bảo mật chủ yếu là phi kỹ thuật cần được trả lời để thấy điều đó.
Robin Bloor: Được rồi, Dez?
Dez Blanchfield: Tôi có một số quan điểm rất mạnh mẽ về điểm cuối cùng cụ thể đó, rằng tôi chỉ cần nói ngắn gọn về cuộc trò chuyện. Tôi nghĩ rằng thường thì doanh nghiệp và công nghệ nghĩ rằng họ thực sự lái xe đến nơi có nhu cầu, nhưng khi chúng ta nhìn vào những gì đã xảy ra khi iPhone trở thành một thứ, và trong tâm trí tôi, đó là loại thiết bị di động đầu tiên, nếu bạn tha thứ chơi chữ, nhưng một thiết bị có thể mang theo thực sự có thể chạy rất nhiều ứng dụng nhỏ trong túi của bạn và nó mang lại một sự chuyển đổi đáng kể về những gì chúng ta nghĩ về việc trở thành một máy tính. Rất nhiều người nghĩ về iPhone hoặc điện thoại thông minh hoặc điện thoại Android là điện thoại, nhưng thực tế không phải vậy, chúng thực sự chỉ là một máy tính nhỏ chạy ứng dụng và một trong những ứng dụng mà nó chạy thực hiện cuộc gọi và chúng không phải là các cuộc gọi mà chúng ta nghĩ đến nữa, chúng không phải là một cuộc gọi điểm-điểm tương tự như Brian nhấn mạnh, chúng là các gói nhỏ được định tuyến xung quanh.
Nhưng thường xuyên hơn không, những gì chúng ta đã thấy là sự nổi dậy của điện thoại thông minh thực sự không được sử dụng để thực hiện cuộc gọi thường xuyên, xác suất 98% những gì tôi làm trên điện thoại thông minh của mình không thực hiện cuộc gọi. Đó là tất cả mọi thứ trừ các cuộc gọi, đó là các ứng dụng. Tôi nghĩ rằng hiệu ứng xếp tầng này - và tôi rất muốn nhanh chóng đưa ra câu hỏi này - nhưng hiệu ứng xếp tầng thực sự được mang đến bởi người tiêu dùng, và trên thực tế tôi có một lớp lót mà tôi thường xuyên ném ra để có được một loạt CXOs ngồi dậy trong phòng và chú ý nếu tôi nghĩ họ đang ngủ với bài thuyết trình tôi đang làm, điều đó không xảy ra quá thường xuyên, hy vọng là vậy.
Tôi đã nói điều đó trong sự gián đoạn mà bạn đang thấy trong doanh nghiệp của mình thực sự không bị điều khiển bởi công nghệ, điều đó thường xuyên hơn là không bị khách hàng của bạn điều khiển. Và họ ngồi dậy và thực sự tự hỏi, ý anh ta là gì? Vì vậy, khi tôi nghĩ về việc sử dụng công nghệ, ý tôi là chúng ta đã thấy USENET, chúng ta đã thấy tất cả những điều thú vị này xảy ra trên internet, nhưng không nhiều người dự đoán về xã hội và tác động của nó. Mọi người đều muốn nói với mọi người những gì họ đã có cho bữa sáng, và tiếng ồn tạo ra và công nghệ phụ trợ mà chúng tôi có, và dĩ nhiên quảng cáo đang cố gắng lấp đầy nó bằng mọi thứ.
Tôi nghĩ rằng chúng ta sẽ thấy một hiệu ứng xếp tầng đến điểm mà các thiết bị đang nói chuyện với các thiết bị, người tiêu dùng đang bắt kịp với những gì thực sự có nghĩa là gì và những gì có thể làm. Bạn nêu lên một điểm thú vị xung quanh lý do tại sao nút Amazon sẽ không nói chuyện với Walmart. Tôi sẽ đăng câu hỏi này, điều gì xảy ra khi Walmart có nút riêng của họ, và sau đó thì sao nếu hai mươi Amazons và Walmarts hàng đầu và các mạng phân phối và bán lẻ lớn khác đều có nút riêng? Điều đó đưa chúng ta đến đâu? Cụ thể, câu hỏi của tôi với Brian sẽ là, ở đâu chúng ta sẽ đi với mô hình hoàn toàn mới này? Bạn đang ở trong tình trạng khó khăn và bạn đang làm việc với các công ty đang thực hiện nó ở cả cấp độ cơ sở hạ tầng vật lý cũng như mức độ truyền dữ liệu. Điều này đưa chúng ta đến đâu, khi làn sóng lớn tiếp theo này đến? Bạn có thể chia sẻ cái nhìn sâu sắc nào xung quanh vấn đề đó với những gì đang diễn ra ở phần phụ trợ từ kinh nghiệm của bạn?
Brian Bulkowski: Chắc chắn, cách tôi nghĩ về rất nhiều những điều này là tập trung vào trải nghiệm người dùng và chính xác những gì bạn nói, đó là những người dùng điều khiển, mặc dù, là các nhà công nghệ và là doanh nhân, chúng tôi có thể đưa ra một ý tưởng thông minh mà chúng tôi nghĩ rằng người dùng thích và tôi sẽ quay trở lại ví dụ Nest. Khi chị tôi cài đặt Nest trong nhà, chị nói, Nhà tôi yên tĩnh hơn, tôi có thể nghe thấy mọi thứ. Thậm chí không chỉ là tôi trả ít tiền hơn cho sức mạnh, cô ấy là vậy, nhưng giờ bạn không thể tách Nest ra khỏi tay cô ấy vì cô ấy thích ở trong một ngôi nhà yên tĩnh hơn là ở nơi có hệ thống sưởi ấm tối đa và sau đó tắt đi.
Câu hỏi kết thúc là, những trải nghiệm người dùng mà chúng ta có thể trao quyền là gì? Cuối cùng, đó là trải nghiệm chất lượng cuộc sống, rằng nếu chúng ta có tiền và chúng ta ở thế giới đầu tiên, chúng ta sẽ trả rất nhiều tiền. Tôi sẽ cho bạn một ví dụ từ nhà riêng của tôi, bạn gái tôi thích sữa lạnh. Cô ấy thích sữa thực sự lạnh, và vì vậy chúng tôi thường phải cố gắng tìm ra nơi nào trong tủ lạnh sẽ đủ lạnh, và không có những thứ còn lại quá nóng. Chà, điều này thật tuyệt - và tôi đã nói với bạn gái của mình, Bạn có phải trả 10 đô la mỗi tháng để có sữa lạnh và không bị cắt lạnh không? "Cô ấy giống như, một cách tuyệt đối. Và nhận 10 đô la mỗi tháng từ bất kỳ người tiêu dùng nào là khó khăn.
Tôi nghĩ rằng trong những trải nghiệm này, chúng tôi thực sự phải để mắt đến trải nghiệm cuối cùng của người tiêu dùng thực sự có thể được thúc đẩy. Tôi nghĩ đó là một phần bí mật của iPhone. Tôi nghĩ đó là một phần bí mật của Tesla khi chế tạo một chiếc xe tốt hơn với tất cả dữ liệu, xóa bỏ ý tưởng về chu kỳ sản phẩm và phát hành hàng năm và cải tiến liên tục trên mọi bộ phận. Chúng ta sẽ phải đưa ra một số ý tưởng thông minh về cách thực sự sử dụng tất cả các dữ liệu này theo cách hấp dẫn từng khoảnh khắc với cuộc sống của mọi người.
Dez Blanchfield: Vâng, đó là cái nhìn sâu sắc tuyệt vời. Từ đó, ở phía bên kia của quang phổ, nó lặp lại chính xác với những thứ chúng ta đang thấy bây giờ với những gì người tiêu dùng đang yêu cầu, và tất cả chúng ta đều có thứ gì đó trong nhà lạnh lẽo và ấm áp về điều đó. Lúc đó, đầu kia của quang phổ là và chúng ta đã thấy điều này trong thế giới dữ liệu lớn truyền thống, nơi mà việc gán dữ liệu đang trở nên hiếm hơn răng của gà mái và những thứ trên thị trường đang được cung cấp nhiều hơn CIO đang kiếm được trong một số trường hợp, các loại công ty bạn đang làm việc và các loại phát triển bạn đã thấy, đó là trường hợp các loại nhà phát triển và loại kiến trúc sư dữ liệu và các đặc biệt mạng, chúng ngày càng khó tìm hơn ? Chúng ta có cần các tổ chức bắt đầu suy nghĩ về việc vượt lên trên đường cong của loại kỹ năng mà họ cần ở mặt sau cho loại nhà phát triển và kiến trúc sư dữ liệu không? Bạn đang thấy gì ở cấp độ đó đến mức tài nguyên kỹ năng mà họ sẽ hiểu làm thế nào để đưa công nghệ này vào sử dụng tốt bây giờ trông như thế nào?
Brian Bulkowski: Vâng, tôi nghĩ đó là một trong những thách thức mà các tổ chức tôi đã nói chuyện phải đối mặt. Cho dù đó là một - những vấn đề tồi tệ nhất mà tôi đã nghe nói thực sự là các loại doanh nghiệp lớn hơn, bởi vì nếu bạn nói, thì tôi đến từ ngân hàng lớn này, tôi đến từ Chase và tôi là một kiến trúc sư dữ liệu, đó là bạn Đã có thế giới hàu của bạn và tiền lương của bạn tăng lên, do đó, vấn đề khó khăn này là kiếm được một công việc ở một trong những nơi đó vì không có đủ người, và sau đó có thể chuyển từ công việc này sang công việc khác. Tôi không nghe thấy gì ngoài loại vấn đề đó và đó thực sự là một trong những lý do khiến tôi tập trung vào hàng không vũ trụ xung quanh việc sử dụng công cụ phù hợp với nhóm dự án cụ thể.
Thay vì cố gắng đi vào một nhóm dự án và nói, Hey Hey, bạn nên sử dụng ngôn ngữ truy vấn của chúng tôi. Nhìn này, nếu những kẻ đó, họ đang lái xe buýt những ngày này, những kẻ và các cô gái, và nếu họ sử dụng một ngôn ngữ truy vấn cụ thể và dụng cụ, họ sẽ gắn bó với điều đó, và tôi không thể nói chuyện với họ về bất cứ điều gì khác. Mục tiêu của tôi là có thể đặt loại năng lượng hàng không vũ trụ làm cơ sở dữ liệu đằng sau bất kỳ công cụ nào họ đang sử dụng và đó là một phần của ý tưởng này, các slide bạn đang thấy về cơ sở dữ liệu Poliglot trong tương lai. Tôi cần hỗ trợ các mô hình ứng dụng và phân tích giữa những người này, bởi vì rất khó để tìm những người có nền tảng toán học cũng như khả năng thống kê để điều hướng thế giới này.
Dez Blanchfield: Một điều thú vị khác mà mọi người có thể không nhận ra, ý tôi là Aerospike là một người chơi rất mạnh trong thế giới nguồn mở, tôi rất muốn có được cái nhìn sâu sắc rất nhanh về những gì có nghĩa là như thế nào kinh doanh hoạt động và những gì nó làm cho bạn. Bạn đã đề cập rằng bạn đã làm việc trực tiếp với dân gian, những người đang làm mọi thứ ngay đến cấp độ kernel bên trong, vì vậy kernel Linux. Có một số người chơi lớn đang ở trong không gian này, và có một số thương hiệu nổi tiếng mà chúng tôi sẽ không đề cập đến, nhưng một tổ chức như Aerospike, trong lịch sử gần đây hiện đại hơn của bạn, trải nghiệm nguồn mở, làm thế nào phù hợp với bức tranh lớn và những lợi thế cạnh tranh nào bạn đã thấy mang lại cho bạn?
Brian Bulkowski: Chắc chắn, khi chúng tôi chuyển sang nguồn mở vào năm 2014, chúng tôi đã làm điều đó bởi vì chúng tôi nhận ra rằng một cơ sở hạ tầng cốt lõi, giống như một cơ sở dữ liệu cần có sẵn, nó cần được tin cậy và cân bằng tự nhiên giữa thế giới đóng cửa cũ nguồn, và một khi bạn đầu tư vào một cơ sở dữ liệu cụ thể, những kẻ đó khiến bạn phải tự hào về chu kỳ công nghệ sau chu kỳ công nghệ, và phải có sự cân bằng. Chúng tôi cần có khả năng đưa ra các phiên bản làm những điều mới và có thể đó là phiên bản dành cho doanh nghiệp, chúng tôi cần có một mô hình giấy phép kép có phiên bản nguồn mở cho những người đang đá lốp xe đang làm việc phi lợi nhuận, cũng như phiên bản doanh nghiệp là giấy phép sở hữu và cho phép làm việc không giới hạn.
Và tất nhiên, chúng ta cũng sẽ có tốc độ và quy mô cao nhất, là phiên bản dành cho doanh nghiệp. Chúng tôi tin tưởng vào mô hình giấy phép đấu tay đôi và điều đó thật tuyệt vời cho hoạt động kinh doanh của chúng tôi. Chúng tôi muốn mọi người bắt đầu với Aerospike, chúng tôi muốn các dự án nhỏ khởi động lốp xe, thật dễ dàng để đến Amazon, khởi chạy một kịch bản xác nhận và có một cụm Aerospike chạy trong vòng năm phút. Mặt khác, chúng tôi muốn cung cấp nhiều hơn cho các khách hàng doanh nghiệp.
Dez Blanchfield: Chúng tôi sắp đến gần đầu giờ, vì vậy tôi sẽ quay trở lại Rebecca ngay lập tức, nhưng nếu chỉ có một lớp lót mà bạn sẽ ném ra ngoài đó, hãy đưa ra lời khuyên bạn sẽ cung cấp cho những người đang tìm cách thâm nhập vào không gian của công nghệ mà bạn đã đưa ra thị trường và họ sẽ áp dụng nó như thế nào, bạn sẽ nói bước đầu tiên đối với họ là ít nhất là nhúng chúng vào ngón chân và bắt đầu xem làm thế nào họ sẽ có được lợi thế cạnh tranh từ nền tảng của bạn?
Brian Bulkowski: Chắc chắn, một phần của thông điệp ở đây là có mức độ tốc độ và kỹ năng dễ dàng. Bạn không cần cụm Cassandra nghìn nút để đạt được hàng triệu giao dịch mỗi giây. Bạn có thể làm điều đó ngay cả trong các giai đoạn đầu tiên của dự án. Vì vậy, mọi thứ dễ dàng hơn nhiều so với trước đây. Sau đó, lời khuyên thứ hai là bạn sẽ phải đưa ra, giống như bạn đang nói, mô hình thu hút khách hàng của quy trình kinh doanh toán học sử dụng tất cả các dữ liệu này, vì vậy tin tốt là dữ liệu có sẵn, tin xấu là bạn thực sự phải đi tìm một số mô hình và một số trường hợp sử dụng hấp dẫn.
Dez Blanchfield: Vâng, lời khuyên tuyệt vời, vì vậy tôi sẽ quay trở lại với Rebecca ngay bây giờ. Cảm ơn bạn rất nhiều vì điều đó, đó là một cuộc trò chuyện nhỏ tuyệt vời về công nghệ, tôi đánh giá cao nó.
Rebecca Jozwiak: Cảm ơn, Dez. Tôi có một vài câu hỏi hay từ khán giả. Hãy để tôi ném lên slide này. Tôi biết bạn đã nói về hệ thống bản ghi và công cụ máy tính lớn, nhưng mức độ thường xuyên bạn thấy giảm tải tuyệt đối hay là bản sao một sự hòa giải cuối ngày, loại gì bạn thấy nhiều hơn?
Brian Bulkowski: Những gì chúng ta thấy trong Aerospike đang sử dụng cơ sở dữ liệu NoQuery trước hệ thống đối chiếu cuối ngày đó. Bạn cần trong ngày, câu trả lời chính xác. Bạn không thể có câu trả lời sai, và đó là những gì Robin nói về tài sản bị đánh giá thấp, nhưng các quy trình kinh doanh xung quanh các yêu cầu pháp lý của hòa giải có thể trở nên khá phức tạp và có hàng thập kỷ công nghệ và hàng thập kỷ thực hành luật pháp và hòa giải. Vì vậy, những gì chúng ta thấy ở Aerospike là, bạn sẽ thực hiện các thuật toán của mình trên cơ sở dữ liệu nóng hơn với nhiều giao dịch hơn mỗi giây. Nhưng vì lý do pháp lý, bạn hoàn toàn cần một hệ thống hòa giải đã thông qua các quy trình pháp lý đó. Chúng tôi thấy cả hai và chúng tôi thấy rằng về cơ bản, đây là hoạt động CNTT hai cấp được tiếp xúc bởi những người như Anderson Consulting và Gartner ở một mức độ nào đó. Chúng tôi thấy rất nhiều điều đó.
Rebecca Jozwiak: Được rồi, tốt. Một số người khác tỏ ra thích thú với slide đặc biệt này, anh nói rằng nó thực sự thú vị và tự hỏi liệu bạn có thể đi sâu hơn một chút so với flash so với trong bộ nhớ hay không.
Brian Bulkowski: Chắc chắn, hãy để tôi có một thanh bên nhanh chóng, một lần nữa, tôi biết chúng ta đã gần đến cuối thời gian. Flash cũng là bộ nhớ - đó là chip - tôi có xu hướng nghĩ về RAM. Vì vậy, RAM có những đặc điểm riêng, đòi hỏi nhiều năng lượng, nó rất tốt trong việc ghi ngẫu nhiên cũng như đọc ngẫu nhiên. Trong đó NAND có khả năng đọc ngẫu nhiên nhanh và công suất thấp hơn, nhưng nó rất tệ khi ghi ngẫu nhiên. Có một số khác biệt tinh tế trong cách hai con chip này hoạt động ở cấp độ in thạch bản, tạo ra một số khác biệt về kỹ thuật.
Trong trường hợp bạn đang thực hiện phân tích và bạn phải bỏ qua rất nhiều dữ liệu hoặc trong trường hợp của Không gian vũ trụ, nơi bạn có các chỉ mục, các chỉ mục vẫn rất tốt để sử dụng trong RAM vì truy cập song song và truy cập ngẫu nhiên. Một mức độ cao hơn của truy cập ngẫu nhiên được yêu cầu. Mặc dù trong Không gian vũ trụ, chúng tôi thấy việc sử dụng các chỉ mục đó để tìm một đối tượng hoặc khối dữ liệu cụ thể, đó là nơi thích hợp để tiếp cận với NAND vì nó trở thành một cửa hàng lớn hơn bên dưới các chỉ mục. Đó là một giao dịch cho một thiết bị lưu trữ, nhưng vẫn còn nhiều tiềm năng và bộ lọc trong hệ thống lập chỉ mục của bạn.
Rebecca Jozwiak: Được rồi, tốt. Và sau đó, tôi biết rằng chúng ta đã nói rất nhiều về IoT và một người nhận xét cho biết IoT phần lớn có lợi, nhưng các công ty, tổ chức chính phủ và nhà phát triển có tăng trưởng an toàn và bảo mật dữ liệu ở cùng một tỷ lệ không, bạn có nghĩ vậy không?
Brian Bulkowski: Có lẽ Dez, bạn có muốn nhảy vào không?
Dez Blanchfield: Vâng, tôi rất vui khi được nhảy vào đó. Tôi nghĩ rằng câu trả lời là không. Trên thực tế, một trong những dòng bỏ đi yêu thích của tôi về chủ đề này rất ngắn gọn là tôi nghĩ rằng sự bùng nổ của máy với máy và Internet nói chung, truyền thông và bảo mật, rủi ro xung quanh nó, chúng ta đang ở thời điểm hiện tại Chính phủ không thể theo kịp tốc độ thay đổi. Và trên thực tế, chúng tôi biết rất nhiều tổ chức không thể theo kịp tốc độ thay đổi. Trên thực tế, nếu tôi diễn giải nó, tốc độ thay đổi ngày nay lớn đến mức các tổ chức phải chạy nước rút chỉ để theo kịp, nhưng họ phải chạy nước rút trong nhiều cuộc đua. Tôi không nghĩ rằng luật pháp và tôi không nghĩ rằng chính phủ nói chung, ở cấp tiểu bang hoặc liên bang, có thể theo kịp tốc độ thay đổi.
Bây giờ, lời khuyên chung của tôi cho mọi người là loại hành động bây giờ và yêu cầu sự tha thứ sau này. Có rất nhiều ví dụ về điều đó trong quá khứ. Họ sẽ bắt kịp, nhưng tôi nghĩ rằng bây giờ các nhà cung cấp công nghệ và công nghệ phải đổi mới trong không gian này và để đảm bảo rằng chúng ta quen với các rủi ro bảo mật hoặc rủi ro riêng tư và chúng ta cần phải đối phó với những điều đó. Các ngân hàng nói riêng, như bạn đã đề cập, khi bạn nghĩ về những gì một tổ chức ngân hàng thường làm với những việc như chống rửa tiền và biết khách hàng của bạn, thách thức AML / KYC, cứ sau ba đến năm năm chúng ta sẽ thử và đáp ứng tuân thủ.
Bây giờ tôi nghĩ rằng cần phải được xây dựng trong mỗi giao dịch. Bạn luôn có thể làm điều đó ở cấp giá thầu với quảng cáo và giao dịch cổ phiếu và trái phiếu và cổ phiếu, tôi nghĩ chúng ta đang ở điểm mà hiệu suất bạn mang lại với nền tảng Aerospike cho phép chúng ta bây giờ nghĩ về cách chúng ta mang lại quyền riêng tư, làm thế nào để chúng tôi đưa bảo mật vào chuỗi quyết định thời gian thực ngay lập tức đó? Và vì vậy, câu trả lời là không, tôi không nghĩ rằng các chính phủ đang theo kịp. Tôi nghĩ các công ty cần phải theo kịp, và tôi nghĩ chúng ta cần phải hành động ngay bây giờ và yêu cầu sự tha thứ sau này.
Brian Bulkowski: Hãy để tôi thêm một vài điểm là tốt. Những người mà tôi giao dịch, các công ty công nghệ mà tôi giao dịch, rất nhận thức về việc đảm bảo họ đứng về phía pháp luật, và một số lượng lớn các cuộc thảo luận là, PII này, tôi có thể sử dụng cái này không Tôi sử dụng đoạn dữ liệu đặc biệt này? Sự quan tâm của nó là gì, và đây có phải là một quyết định hoặc kinh nghiệm được bảo vệ? Làm thế nào để tôi làm tất cả điều đó? Vì vậy, đó là tin tốt. Đôi khi tôi tự hỏi về cuộc thảo luận của chúng ta với tư cách là một xã hội xung quanh nơi chúng ta đang hướng tới, và thậm chí nếu cuộc thảo luận xã hội của chúng ta ở mức độ phù hợp về việc sử dụng các khả năng mới từ IoT cho đến học máy, đó là cách duy nhất để sắp xếp thông qua khối lượng dữ liệu chúng ta có. Nhưng tin tốt là, những người tôi đã nói chuyện thực sự ở phía bên phải của việc cố gắng làm đúng theo các quyết định pháp lý mà chúng tôi đã đưa ra.
Rebecca Jozwiak: Đó là một số câu trả lời thực sự tốt từ cả hai bạn, và tôi hoàn toàn đồng ý. Tôi không nghĩ rằng bảo mật đang phát triển với tốc độ nhanh hơn khi phát triển công nghệ, đặc biệt là khi nói đến Internet of Things, nhưng tôi phải nghĩ rằng mọi người đang cố gắng hết sức và hy vọng chúng ta sẽ đến đó. Luôn luôn khó khăn một chút để đi trước mười bước trước những tên trộm và tội phạm mạng, nhưng chúng ta sẽ đến đó.
Chà, mọi người, chúng ta đã đi được tám phút so với đầu giờ. Tôi muốn cảm ơn các vị khách của chúng tôi Brian Bulkowski từ Aerospike và Dez Blanchfield và Robin Bloor. Cảm ơn bạn rất nhiều. Bạn luôn có thể tìm thấy tài liệu lưu trữ của chúng tôi tại insideanalysis.com, SlideShare, YouTube, chúng tôi đã có rất nhiều webcast hay được phát hành, đó là một tháng bận rộn. Đây sẽ là một tháng bận rộn vào tháng tới, vì vậy hãy theo dõi và chúng tôi hy vọng sẽ gặp lại bạn vào lần tới. Cảm ơn mọi người, tạm biệt.