Trang Chủ Cơ sở dữ liệu Động lực về phía trước: di chuyển quan hệ vượt ra ngoài truyền thống

Động lực về phía trước: di chuyển quan hệ vượt ra ngoài truyền thống

Anonim

Bởi nhân viên Techopedia, ngày 8 tháng 6 năm 2016

Takeaway: Người dẫn chương trình Eric Kavanaugh thảo luận về những đổi mới trong công nghệ cơ sở dữ liệu với các chuyên gia Dez Blanchfield, Robin Bloor và Bert Scalzo.

Bạn hiện chưa đăng nhập. Vui lòng đăng nhập hoặc đăng ký để xem video.

Eric Kavanagh: Thưa quý vị và các bạn, hôm nay là thứ Tư, lúc bốn giờ phương Đông. Tôi đang ở New Orleans, mùa hè đang đến, điều đó có nghĩa là trời nóng! Đã đến lúc cho Hot Technologies, vâng, thực sự, vâng. Tên tôi là Eric Kavanagh, tôi sẽ là chủ nhà của bạn. Tôi sẽ đá bóng trở lại đây cho Hot Technologies. Chủ đề hôm nay là Tối cao Chuyển tiếp: Di chuyển quan hệ vượt ra ngoài truyền thống. Fol Folks, chúng tôi có ba chuyên gia cơ sở dữ liệu trên điện thoại ngày hôm nay, vì vậy, bất kỳ câu hỏi nào bạn có, hãy gửi cho họ những câu hỏi khó, đừng ngại. Chúng tôi có một loạt các nội dung tốt xếp hàng cho bạn ngày hôm nay. Có chỗ về bạn thật sự, đủ về tôi. Tất nhiên, năm nay là nóng. Chúng ta đang nói về tất cả các công nghệ nóng trong chương trình này, đó là sự hợp tác với bạn bè của chúng tôi từ Techopedia. Và chúng ta sẽ đi sâu vào nền tảng của quản lý thông tin ngày nay, tất nhiên đó là cơ sở dữ liệu. Chúng ta sẽ nói về cách chúng ta đến đây, những gì đang xảy ra hôm nay và những gì đang diễn ra. Rất nhiều thứ rất thú vị đang diễn ra.

Rõ ràng chúng ta có một số đổi mới nghiêm trọng trong không gian cơ sở dữ liệu. Đó là một loại yên tĩnh trong một thời gian; Nếu bạn nói chuyện với một số nhà phân tích trong doanh nghiệp, tôi có thể nói có lẽ từ năm như 2005, 2009 hoặc '10, có vẻ như không có quá nhiều thứ đang diễn ra về mặt đổi mới. Và đột nhiên nó bùng phát, như bẻ khóa hay gì đó, và bây giờ có đủ thứ thú vị xảy ra. Rất nhiều trong số đó là do quy mô của web và tất cả các thuộc tính web thú vị đang làm những điều thú vị khác nhau. Đó là nơi mà khái niệm NoQuery xuất phát. Và điều đó có nghĩa là hai điều khác nhau: nó có nghĩa là không có SQL, vì trong đó nó không hỗ trợ SQL, nó cũng có nghĩa là không chỉ SQL. Có một thuật ngữ mới, NewQuery mà một số người đã sử dụng. Nhưng rõ ràng, SQL - Ngôn ngữ truy vấn có cấu trúc - thực sự là nền tảng, nó là cơ sở của truy vấn.

Và thật thú vị khi tất cả các công cụ NoQuery này, chuyện gì đã xảy ra? Chà, họ đi ra, có rất nhiều hứng thú về nó, và rồi vài năm sau, tất cả chúng ta đã bắt đầu nghe thấy gì? Ồ, SQL trên Hadoop. Chà, tất cả các công ty này đã bắt đầu đưa các giao diện SQL vào các công cụ NoQuery của họ và bất kỳ ai trong thế giới lập trình đều biết rằng điều đó sẽ dẫn đến một số thách thức và một số khó khăn, và một số dây đan xen. Vì vậy, chúng ta sẽ tìm hiểu về rất nhiều thứ đó ngày hôm nay.

Có ba người thuyết trình của chúng tôi: chúng tôi đã nhận được Dez Blanchfield gọi từ Sydney, Robin Bloor của chúng tôi ở Texas, và Bert Scalzo cũng vậy, anh ấy cũng ở Texas. Vì vậy, trước hết chúng ta sẽ nghe từ Dez Blanchfield. Thưa các bạn, chúng tôi sẽ tweet tại hashtag của #HotTech, vì vậy, vui lòng gửi bình luận của bạn hoặc gửi câu hỏi của bạn thông qua thành phần Hỏi & Đáp của bảng điều khiển webcast hoặc thậm chí qua cửa sổ trò chuyện. Và với điều đó, Dez Blanchfield, mang nó đi.

Dez Blanchfield: Cảm ơn bạn, Eric. Chào mọi người. Vì vậy, tôi sẽ cố gắng đặt bối cảnh ở góc nhìn 30.000 feet về loại những gì đã xảy ra trong thập kỷ qua, và những thay đổi đáng kể mà chúng ta đã thấy - hoặc ít nhất là một thập kỷ rưỡi - hệ thống quản lý cơ sở dữ liệu và một số tác động từ quan điểm thương mại hoặc kỹ thuật và một số xu hướng mà chúng tôi đã chịu đựng muộn và dẫn chúng tôi vào cuộc trò chuyện mà chúng ta sắp có hôm nay xoay quanh chủ đề này.

Hình ảnh bìa của tôi ở đây là một cồn cát, và có gió thổi những hạt cát nhỏ li ti trên đỉnh của nó. Và kết quả là, điều gì xảy ra là cồn cát từ từ đi từ không gian này sang không gian khác. Và đó là một hiện tượng đáng kinh ngạc, nơi những ngọn núi cát khổng lồ cao 40 và 50 feet này thực sự di chuyển. Và chúng di chuyển rất chậm, nhưng chúng di chuyển chắc chắn, và khi chúng di chuyển, chúng thay đổi cảnh quan. Và đây là điều khá đáng để xem nếu bạn dành bất kỳ thời gian nào trong một khu vực nơi cồn cát là một điều tự nhiên. Bởi vì một ngày nào đó bạn có thể nhìn ra cửa sổ và nhận ra rằng ngọn núi cát khổng lồ này, những hạt nhỏ bé đã tự di chuyển, và gió từ từ chuyển từ nơi này sang nơi khác.

Và tôi nghĩ theo nhiều cách, đó là thế giới của các hệ thống cơ sở dữ liệu từ khá lâu. Cho đến rất, rất gần đây, sự dịch chuyển rất nhỏ đó dưới dạng những hạt cát di chuyển một ngọn núi cát khổng lồ dưới dạng cồn cát. Những thay đổi nhỏ đã xuất hiện trong các nền tảng cơ sở dữ liệu trong những năm qua và đó là một môi trường khá ổn định và vững chắc xung quanh các hệ thống và nền tảng cơ sở dữ liệu, thông qua máy tính lớn của kỷ nguyên tầm trung. Nhưng cuối cùng, chúng tôi đã có một số điều khá quan trọng xảy ra đối với nhu cầu thương mại và trình điều khiển kỹ thuật của chúng tôi. Tôi sẽ dẫn chúng tôi đi qua những cái đó.

Tôi có quan điểm rằng khái niệm cơ bản của cơ sở dữ liệu, như chúng ta đã biết về nó trong nhiều năm, và như bạn có thể đã nghe trong phần giới thiệu trước buổi diễn, hai chuyên gia của chúng tôi, những người đang gọi cho tôi hôm nay đã có cả cuộc đời không gian này và họ hoàn toàn đúng khi chia sẻ quyền khoe khoang ở đó khi tất cả bắt đầu vào đầu những năm 80. Nhưng chúng ta đã thấy sự thay đổi lớn này trong thập kỷ qua và một chút, và tôi sẽ nhanh chóng dẫn chúng tôi đi qua trước khi tôi trao nó cho Tiến sĩ Robin Bloor.

Chúng tôi đã trải qua những gì tôi gọi, kinh nghiệm lớn hơn, tốt hơn, nhanh hơn, rẻ hơn. Như tôi đã nói, định nghĩa của một cơ sở dữ liệu đã thay đổi. Cảnh quan trong đó các nền tảng cơ sở dữ liệu đã phải giải quyết hiệu suất, và các yêu cầu kỹ thuật và thương mại cũng đã thay đổi. Chúng tôi đã thấy sự gia tăng nhu cầu về các giải pháp để đối phó với các yêu cầu kỹ thuật phức tạp hơn hoặc phức tạp hơn. Và vì vậy, một cái nhìn thực sự nhanh chóng về ý nghĩa thực sự của tôi là chúng ta phải sắp xếp những năm 90 và chúng ta đã thấy công nghệ cơ sở dữ liệu bị ảnh hưởng bởi sự ra đời của internet và loại mà chúng ta gọi là internet tỉ lệ. Chúng tôi không chỉ nói về những người ngồi trước các thiết bị đầu cuối, ban đầu giống như các thiết bị đầu cuối teletype với máy in vật lý được tích hợp trong chúng và 132 cột văn bản xuất hiện trên giấy. Sau đó, các thiết bị đầu cuối màn hình màu xanh lá cây sớm, đấm với bàn phím.

Nhưng bạn có biết, thế giới của chúng ta là các thiết bị đầu cuối và cáp nối tiếp hoặc cáp mạng nói chuyện với máy tính trong một thời gian dài. Sau đó, xuất hiện internet và sự phát triển kết nối bùng nổ này, rằng bạn không cần phải cắm vào máy tính nữa. Để truy cập hệ thống cơ sở dữ liệu, bạn chỉ cần một trình duyệt web. Vì vậy, công nghệ cơ sở dữ liệu đã phải thay đổi đáng kể, để đối phó với quy mô của mọi thứ từ các công nghệ công cụ tìm kiếm cơ bản được sử dụng để lập chỉ mục trên thế giới và lưu trữ một chỉ mục thông tin, trong ví dụ về quy mô định dạng cơ sở dữ liệu. Và những người như Google và những người khác đã cung cấp một nền tảng để làm điều đó. Và tất cả các loại lưu trữ cơ sở dữ liệu mới và truy vấn và lập chỉ mục đã được sản xuất. Và sau đó chúng tôi đã có các trang web âm nhạc và các trang web phim đi cùng.

Và sau đó vào những năm 2000, chúng ta đã chứng kiến ​​sự bùng nổ của dot-com và điều đó đã tạo ra một vụ nổ thậm chí còn kịch tính hơn về số lượng người sử dụng các hệ thống được cung cấp bởi một cơ sở dữ liệu dưới dạng nào đó. Giai đoạn này, các cơ sở dữ liệu quan hệ vẫn phải đối phó với hầu hết tải, chúng tôi chỉ đưa chúng vào tin lớn hơn và chúng tôi đã đi đến các hệ thống tầm trung rất, rất lớn chạy các nền tảng Unix từ những người như IBM và Sun, v.v. . Sự bùng nổ dot-com chỉ làm cho mọi thứ lớn hơn và nhanh hơn từ quan điểm về phần cứng, hiệu năng và có một số thay đổi đáng kể trong các công cụ cơ sở dữ liệu, nhưng đối với phần tốt hơn, nó vẫn giống như những gì chúng ta đã thấy đối với thời gian dài.

Và sau đó chúng ta đã có kỷ nguyên của web 2.0, như chúng ta đã đề cập đến nó. Và đây là một sự thay đổi khủng khiếp, bởi vì đột nhiên chúng tôi cần các nền tảng cơ sở dữ liệu đơn giản hơn nhiều, và phải có một tỷ lệ ở dạng nằm ngang. Và đó là một sự thay đổi đáng kể trong cách chúng tôi tiếp cận ý tưởng về cơ sở dữ liệu là gì. Bây giờ chúng tôi vẫn đang thực sự bắt kịp trong quan điểm của tôi. Và bây giờ chúng ta đang đối phó với toàn bộ vũng lầy này, và tôi nói rằng với một sự quay vòng tích cực, không phải là một ý nghĩa tiêu cực, vũng lầy này của những gì chúng ta gọi là dữ liệu lớn, và một vụ nổ lớn, và ý tôi là vụ nổ. Sự thay đổi thái quá này theo chiều dọc trên biểu đồ số lượng tùy chọn chúng ta có khi nói về cơ sở dữ liệu và một số dạng khả năng truy vấn quan hệ.

Và thật thú vị, cá nhân tôi cho rằng tôi nghĩ rằng dữ liệu lớn thực sự chỉ là phần nổi của tảng băng chìm. Chúng tôi có xu hướng trở nên phấn khích một chút về tác động của dữ liệu lớn là gì và các loại lựa chọn mà chúng tôi hiện có. Chúng tôi đã có mọi thứ từ các công cụ NoQuery, chúng tôi có các công cụ đồ thị, chúng tôi có tất cả các loại nền tảng khác nhau mà chúng tôi có thể ném dữ liệu vào và làm mọi thứ với nó. Thậm chí đến mức trên thực tế, một trong những cuộc trò chuyện đầu tiên tôi có với Eric Kavanagh, người ở đây với chúng tôi hôm nay, là xung quanh cuộc trò chuyện liên quan đến một thứ gọi là Apache Drill, một dự án nguồn mở cho phép bạn truy vấn dữ liệu bên trong mô hình các loại dữ liệu khác nhau: mọi thứ từ các tệp CSE thô nằm trên ổ cứng, cho đến các hệ thống tệp HDFS ở quy mô petabyte. Và bạn biết đấy, nó cho phép bạn thực hiện các truy vấn kiểu SQL này về dữ liệu có cấu trúc và không cấu trúc của tất cả các loại cây thú vị.

Chúng ta sắp thấy tòa nhà thông minh của người Hồi giáo trở thành một thứ và chúng tôi muốn nghĩ rằng chúng ta có các tòa nhà thông minh về quản lý an ninh và nhiệt, nhưng tôi đang nói về các tòa nhà thông minh biết nhiều hơn về bạn là ai và bạn đang ở đâu khi bạn bước vào và làm tất cả mọi thứ gọn gàng ở cấp độ đó, thông qua các thành phố thông minh - toàn bộ hệ sinh thái ở cấp thành phố - biết cách làm mọi thứ một cách thông minh. Và hơn thế nữa, chúng ta đã có một điều đáng kinh ngạc mà tôi không nghĩ rằng bất kỳ ai trên thế giới nắm bắt hoàn toàn, và đó là hình thức của Internet vạn vật. Có tất cả những thay đổi khác nhau trong thập kỷ qua và một chút, có lẽ khoảng hai thập kỷ, nếu chúng ta làm tròn nó, điều đó đã tác động đến thế giới của những gì chúng ta coi là cơ sở dữ liệu, theo quan điểm của tôi.

Có một vài điều quan trọng đã làm cho điều này thậm chí có thể. Chi phí cho các ổ đĩa cứng đã giảm đáng kể và theo nhiều cách, điều đó đã giúp cho một số kiến ​​trúc tham khảo như mô hình Hadoop có thể lấy được nhiều dữ liệu và phát tán ra nhiều ổ đĩa cứng và làm những điều thông minh với nó Và trong thực tế, những gì đã trở thành shending, theo quan điểm của tôi, về cơ sở dữ liệu quan hệ hoặc mô hình đơn vị DB truyền thống. Và RAM có được rất, rất rẻ và điều đó đã cho chúng tôi cơ hội hoàn toàn mới để chơi với các kiến ​​trúc tham chiếu khác nhau như trong bộ nhớ và để thực hiện những việc như phân vùng dữ liệu rất lớn.

Và vì vậy, điều này đã cho chúng ta bức tranh nhỏ mà chúng ta đang xem bây giờ, đây là sơ đồ hiển thị các loại nền tảng có sẵn nếu bạn đang ở trong bối cảnh dữ liệu lớn. Và nó rất, rất khó đọc, và lý do cho điều đó, có quá nhiều thông tin về điều đó. Có rất nhiều tùy chọn thực hiện, mô hình hóa và sản xuất các cách để đưa dữ liệu vào các hệ thống cơ sở dữ liệu dưới bất kỳ hình thức nào, và truy vấn nó, và thực hiện đọc-ghi truyền thống. Và chúng không phải là tất cả tuân thủ, trên thực tế rất ít trong số chúng thậm chí tuân thủ bất kỳ tiêu chuẩn phong cách cơ bản nào, nhưng chúng vẫn coi mình là một cơ sở dữ liệu. Và tôi sẽ cho bạn thấy một vài màn hình trong một giây để cung cấp cho bạn một số bối cảnh xung quanh ý nghĩa của tôi khi chuyển từ quy mô thập niên 90 và internet, sang web 2.0, và sau đó là toàn bộ sự phát triển thông qua dữ liệu lớn. Nếu chúng tôi nghĩ rằng biểu đồ cảnh quan công nghệ dữ liệu lớn này rất thú vị bởi vì có rất nhiều tùy chọn trên đó, chúng ta hãy xem xét một phím dọc.

Hãy nhìn vào công nghệ tiếp thị. Dưới đây là các tùy chọn cho hệ thống quản lý cơ sở dữ liệu hoặc quản lý dữ liệu bên trong không gian mar-tech, vì vậy công nghệ liên quan đến tiếp thị. Bây giờ đây là vào năm 2011, vì vậy một vài năm trước; Năm năm trước, đây là những gì phong cảnh trông như thế nào. Nếu tôi chỉ quay lại một slide một cách ngắn gọn, thì đây là cảnh quan dữ liệu ngày nay trông giống như trong các thương hiệu và dịch vụ khác nhau mà chúng tôi có trong các công nghệ cơ sở dữ liệu. Đây là những gì một ngành dọc trông giống như năm năm trước, chỉ trong công nghệ tiếp thị.

Bây giờ nếu tôi đi đến quan điểm ngày nay, đây là những gì nó trông như thế nào, và nó hoàn toàn không thể xuyên thủng. Đây chỉ là bức tường của các thương hiệu và tùy chọn, và đó là hàng ngàn và hàng ngàn kết hợp phần mềm tự coi là thuộc lớp cơ sở dữ liệu, nó có thể nắm bắt, tạo hoặc lưu trữ và truy xuất dữ liệu dưới nhiều hình thức khác nhau. Và tôi nghĩ rằng bây giờ chúng ta đang bước vào một thời điểm rất, rất thú vị và dũng cảm, nơi mà ngày xưa bạn có thể biết các thương hiệu lớn, bạn có thể biết năm hoặc sáu nền tảng khác nhau từ Oracle và Informix, DB2 và vv gần như một chuyên gia về tất cả các thương hiệu đã có từ 20 năm trước. Mười năm trước, mọi chuyện trở nên dễ dàng hơn một chút vì một số thương hiệu đã sụp đổ, và không phải tất cả các thương hiệu đều có thể đối phó với quy mô của sự bùng nổ dot-com, và một số công ty đã bị phá vỡ.

Ngày nay, hoàn toàn không thể trở thành một chuyên gia về tất cả các công nghệ cơ sở dữ liệu tồn tại, cho dù đó là cơ sở dữ liệu quan hệ hay nền tảng quản lý cơ sở dữ liệu tiêu chuẩn mà chúng ta đã biết trong vài thập kỷ qua. Hoặc có thể là trường hợp, các động cơ hiện đại hơn như Neo4j và các loại. Và vì vậy tôi nghĩ rằng chúng ta đang bước vào một thế giới rất dũng cảm, nơi có rất nhiều tùy chọn có sẵn và chúng ta đã có các nền tảng ở quy mô ngang, trong bộ nhớ hoặc trên đĩa ngay bây giờ. Nhưng tôi nghĩ rằng đó là một thời gian đầy thách thức đối với các nhà hoạch định công nghệ và quyết định kinh doanh, bởi vì họ cần đưa ra một số quyết định rất lớn đối với các ngăn xếp công nghệ, rằng trong một số trường hợp chỉ mới xuất hiện trong nhiều tháng. Mười tám tháng tuổi không phải là một con số đáng sợ đối với một số nền tảng cơ sở dữ liệu nguồn mở mới và thú vị hơn. Và họ bắt đầu hợp nhất các nền tảng và trở nên mới hơn và thú vị hơn.

Tôi nghĩ rằng chúng ta sẽ có một cuộc trò chuyện tuyệt vời ngày hôm nay về việc tất cả những điều này đã ảnh hưởng đến nền tảng cơ sở dữ liệu truyền thống và cách họ phản ứng với nó, và các loại công nghệ đang bị ném vào đó. Và với ý nghĩ đó, bây giờ tôi sẽ chuyển cho Tiến sĩ Robin Bloor, và hiểu rõ hơn về anh ấy. Robin, qua bạn.

Robin Bloor: Được rồi, cảm ơn vì điều đó. Vâng, đây là một chủ đề quá lớn. Ý tôi là, nếu bạn chỉ lấy một trong những hình minh họa mà Dez vừa cho bạn xem, bạn có thể có một cuộc trò chuyện dài chỉ về một trong những mảnh. Nhưng bạn biết đấy, bạn có thể truy cập cơ sở dữ liệu - Tôi đã xem xét cơ sở dữ liệu, tôi không biết, từ những năm 1980 và bạn có thể xem cơ sở dữ liệu theo nhiều cách khác nhau. Và một trong những điều mà tôi nghĩ rằng tôi sẽ làm, chỉ cần tham gia vào cuộc trò chuyện ngày hôm nay, là nói về lý do những điều gây rối đã xảy ra ở cấp độ phần cứng. Và bạn phải nhớ rằng, rất nhiều điều khủng khiếp đã thực sự xảy ra ở cấp độ phần mềm, vì vậy đây không phải là bức tranh đầy đủ về bất cứ điều gì, đây chỉ là một phần cứng.

Tôi cũng sẽ không nói chuyện lâu, tôi chỉ muốn đưa cho bạn bức tranh phần cứng. Một cơ sở dữ liệu là các khả năng truy xuất dữ liệu bao trùm CPU, bộ nhớ và đĩa và điều đó đang thay đổi đáng kể. Và lý do tôi nói vậy, là tôi đã học cách hiểu cơ sở dữ liệu từ quan điểm của những gì bạn thực sự đã làm. Bạn biết đấy, có sự khác biệt về độ trễ giữa dữ liệu thực tế trên CPU và dữ liệu được kéo vào CPU từ bộ nhớ và dữ liệu được kéo từ đĩa vào bộ nhớ và qua CPU. Và các kiến ​​trúc cơ sở dữ liệu cũ chỉ cố gắng cân bằng điều đó. Bạn biết đấy, họ chỉ nói rằng, Vâng, việc này diễn ra rất chậm, chúng tôi sẽ lưu trữ dữ liệu trên đĩa để nó nằm trong bộ nhớ. Chúng tôi sẽ cố gắng và làm điều đó một cách thực sự chính xác để một tỷ lệ thực sự tốt của dữ liệu chúng tôi yêu cầu đã có trong bộ nhớ. Và chúng tôi sẽ di chuyển dữ liệu lên CPU nhanh nhất có thể.

Và cơ sở dữ liệu đã được viết trong những ngày xưa máy móc được viết cho các cụm nhỏ. Và bây giờ, cho những người không biết gì về song song. Bởi vì nếu bạn sẽ có được một số hiệu suất từ ​​một cụm, bạn sẽ phải làm nhiều việc khác nhau song song. Song song là một phần của trò chơi, không có gì giống như bây giờ. Tôi sẽ chỉ đi bộ qua những gì đã xảy ra.

Trước hết, đĩa. Vâng đĩa đã qua, thực sự. Đó là khá nhiều về cơ sở dữ liệu. Tôi nghĩ rằng có một số bối cảnh để lưu trữ dữ liệu và thậm chí các hồ dữ liệu rất lớn đang chạy trên Hadoop, đĩa quay tồi tệ nhất có lẽ là khả thi hiện nay. Thực sự, vấn đề với đĩa quay là tốc độ đọc không cải thiện nhiều. Và khi CPU tăng tốc độ định luật của Moore, loại độ lớn, nhanh hơn cứ sau sáu năm. Và trí nhớ đã theo sau, sau đó hai người đó hợp lý theo kịp nhau, nó không hoàn toàn suôn sẻ, nhưng họ đã làm được.

Nhưng ý nghĩa ngẫu nhiên đọc vào một đĩa nơi đầu bay về đĩa, ý tôi là, ngoài bất cứ điều gì khác, đó là một chuyển động vật lý. Và nếu bạn đang đọc ngẫu nhiên trên một đĩa, nó cực kỳ chậm so với đọc từ bộ nhớ, nó giống như chậm hơn 100.000 lần. Và gần đây, hầu hết các kiến ​​trúc cơ sở dữ liệu mà tôi đã xem xét ở bất kỳ chiều sâu nào thực sự chỉ là đọc từ các đĩa. Bằng cách này hay cách khác, bạn chỉ cần lưu trữ bộ nhớ cache càng nhiều càng tốt từ đĩa và kéo thiết bị chậm đó và đặt nó vào một thiết bị nhanh. Và có rất nhiều điều thông minh mà bạn có thể làm với điều đó, nhưng nó đã kết thúc.

Và đĩa trạng thái rắn, hoặc ổ đĩa flash, thực sự, là những gì chúng là, rất nhanh chóng thay thế đĩa quay. Và điều đó lại thay đổi hoàn toàn, bởi vì cách thức tổ chức dữ liệu trên đĩa, nó được tổ chức theo cách thức hoạt động của đĩa. Đó thực sự là về một cái đầu di chuyển trên một bề mặt kéo sợi, thực sự là nhiều cái đầu di chuyển trên nhiều bề mặt kéo sợi và nhặt dữ liệu khi chúng đi. Một ổ đĩa trạng thái rắn chỉ là một khối của những thứ mà bạn có thể đọc. Ý tôi là, điều đầu tiên là tất cả các cơ sở dữ liệu truyền thống được thiết kế để quay đĩa và hiện chúng đang được thiết kế lại cho SSD. Cơ sở dữ liệu mới có thể - bất kỳ ai đang viết cơ sở dữ liệu mới ngay bây giờ có thể bỏ qua đĩa quay, không nghĩ gì về nó cả. Nhưng Samsung, nhà sản xuất SSD lớn, nói với chúng tôi rằng SSD thực sự nằm trên đường cong pháp luật của Moore.

Chúng tôi nghĩ rằng chúng đã nhanh hơn khoảng ba hoặc bốn lần so với đĩa quay, nhưng về cơ bản giờ chúng sẽ nhanh hơn rất nhiều sau mỗi 18 tháng. Tăng gấp đôi tốc độ, và 10 lần về tốc độ lên tới khoảng sáu năm. Nếu đó chỉ là nó, tuy nhiên, đó không phải là nó, vì tôi sẽ nói với bạn trong giây lát. Quay đĩa tất nhiên đang trở thành một phương tiện lưu trữ.

Về trí nhớ. Điều đầu tiên trước tiên, RAM. Tỷ lệ CPU giữa RAM trên mỗi CPU chỉ tăng lên mọi lúc. Và điều đó, tất nhiên, theo một cách nào đó, mang lại tốc độ khủng khiếp hơn rất nhiều, bởi vì bộ nhớ mà bạn có thể có bây giờ có thể lưu trữ nhiều hơn nữa. Điều này thực sự là, nó giúp giảm áp lực cho loại ứng dụng MLTP hoặc ứng dụng đọc ngẫu nhiên, bởi vì nó dễ dàng hơn để phục vụ chúng, bởi vì giờ đây bạn có rất nhiều bộ nhớ, và bằng cách đó, bạn có thể lưu trữ mọi thứ mà có khả năng được đọc vào bộ nhớ. Nhưng bạn gặp vấn đề với một đống dữ liệu lớn hơn, vì vậy dữ liệu lớn thực sự không đơn giản như vậy.

Và sau đó chúng ta có Intel với 3D Xpoint và IBM với cái mà họ gọi là PCM, là bộ nhớ thay đổi pha, đang cung cấp thứ mà họ tin là - tốt hơn, nó nhanh hơn ít nhất 10 lần so với SSD hiện tại và họ tin rằng nó sẽ nhận được rất gần với tốc độ tương đương với RAM. Và tất nhiên nó ít tốn kém hơn. Vì vậy, trước đây, bạn có cấu trúc cơ sở dữ liệu về CPU, bộ nhớ và đĩa, và bây giờ chúng ta đang tiến tới một cấu trúc có bốn lớp. Nó có CPU, bộ nhớ hoặc RAM, và sau đó là loại bộ nhớ nhanh hơn SSD, thực sự không dễ bay hơi và sau đó là SSD. Và những công nghệ mới này không biến động.

Và có memristor của HP, chưa được biết, bởi vì nó đã được công bố khoảng bảy năm trước, nhưng nó chưa xuất hiện. Nhưng những tin đồn tôi nghe được là HP cũng sẽ thay đổi trò chơi một chút với một người ghi nhớ, vì vậy bạn vừa gặp phải một tình huống bộ nhớ mới. Đây không giống như chúng ta có những thứ nhanh hơn, giống như chúng ta đã có một lớp hoàn toàn mới. Và sau đó chúng ta đã có một thực tế là truy cập SSD, bạn có thể đọc nó song song. Bạn không thể đọc đĩa quay song song, ngoại trừ bằng cách có nhiều đĩa quay khác nhau. Nhưng một khối SSD, bạn thực sự có thể đọc song song. Và bởi vì bạn có thể đọc song song, nó đi nhanh hơn tốc độ đọc đơn giản của nó, nếu bạn thực sự thiết lập nhiều quy trình trên các quy trình khác nhau trên một CPU và chỉ có nó với SSD.

Ước tính bạn có thể đạt được tốc độ RAM gần như bằng cách đó. Và tất cả những gì điều này đang nói là, tương lai của kiến ​​trúc bộ nhớ là không rõ ràng. Ý tôi là, thực tế là các nhà cung cấp thống trị khác nhau, bất kể họ là ai, có lẽ sẽ xác định hướng của phần cứng. Nhưng không ai biết nó sẽ đi đâu vào thời điểm này. Tôi đã nói chuyện với một số kỹ sư cơ sở dữ liệu nói rằng, tôi không sợ những gì đang xảy ra, nhưng họ không biết cách tối ưu hóa nó ngay từ đầu. Và bạn luôn luôn làm như vậy, thật thú vị.

Và sau đó là CPU. Chà, CPU đa lõi không chỉ là CPU đa lõi. Chúng tôi cũng có khối lượng đáng kể của bộ đệm L1, L2 và L3, đặc biệt là L3, tùy theo tôi không biết, hàng chục megabyte. Bạn có thể đặt rất nhiều ở đó, bạn biết. Và do đó, bạn thực sự có thể sử dụng chip làm phương tiện lưu trữ. Vì vậy, điều đó đã thay đổi trò chơi. Và chắc chắn, xử lý vector và nén dữ liệu, một số nhà cung cấp đã thực sự làm điều đó, kéo công cụ đó vào CPU để làm cho tất cả diễn ra nhanh hơn rất nhiều ở CPU. Sau đó, bạn có một thực tế rằng, tốt, CPU có GPU thực sự tốt trong việc tăng tốc phân tích. Và họ thực sự khá giỏi trong một số loại truy vấn nhất định, nó chỉ phụ thuộc vào truy vấn của bạn là gì.

Bạn có thể tạo các bo mạch có CPU và GPU, hoặc như AMD đang làm ngay bây giờ, bạn sản xuất một thứ gọi là APU, một dạng kết hợp giữa CPU và GPU; Nó có cả hai loại khả năng trên đó. Vì vậy, đó là một loại bộ xử lý khác nhau. Và sau đó là thông báo gần đây của Intel rằng họ sẽ đặt một con chip vào chip, đó là loại đầu tôi đã nghĩ đến. Tôi đang nghĩ, nó sẽ xảy ra như thế nào? khả năng của CPU, GPU và bạn đã có khả năng về CPU, FPGA - và nhân tiện, nếu bạn thực sự muốn, trên cùng một bảng, bạn có thể đặt CPU, GPU và GPU và GPU. Tôi không biết làm thế nào bạn thực sự sẽ chạy bất cứ thứ gì theo cách đó, nhưng tôi biết các công ty đang làm những việc như thế này và họ đang nhận được các phản hồi truy vấn rất, rất nhanh. Đây không phải là thứ sẽ bị bỏ qua, đây có thể là thứ sẽ được sử dụng bởi các nhà cung cấp đã thành lập, và bởi các nhà cung cấp mới sắp ra mắt, có lẽ. Các DBMS luôn song song, nhưng bây giờ các khả năng song song đã bùng nổ, bởi vì điều này cho phép bạn song song điều này với điều đó, với điều đó, với điều đó theo nhiều cách khác nhau.

Cuối cùng, để tăng quy mô hay mở rộng quy mô? Mở rộng quy mô thực sự là giải pháp tốt nhất, nhưng đối với một điều. Bạn có hiệu suất nút tốt hơn nhiều nếu bạn hoàn toàn có thể tối ưu hóa hiệu suất của CPU và bộ nhớ trên đĩa trên một nút. Và bạn sẽ sử dụng ít nút hơn, vì vậy nó sẽ rẻ hơn, phải không? Và nó sẽ dễ quản lý hơn. Thật không may, đó là một thiết kế phụ thuộc vào phần cứng và khi phần cứng thay đổi, nó sẽ ngày càng ít có khả năng làm điều đó, trừ khi các kỹ sư của bạn sẽ có thể chạy nhanh như phần cứng đang thay đổi. Và bạn có vấn đề về khối lượng công việc, bởi vì khi bạn tăng quy mô, bạn đang đưa ra nhiều giả định khác nhau về khối lượng công việc sẽ làm.

Nếu bạn mở rộng quy mô, nghĩa là, nếu kiến ​​trúc của bạn nhấn mạnh tỷ lệ trước khi mở rộng - thực sự bạn phải làm cả hai, đó chỉ là bạn nhấn mạnh một. Sau đó, bạn sẽ có được hiệu suất mạng tốt hơn, bởi vì kiến ​​trúc sẽ đối phó với nó. Nó sẽ đắt hơn về mặt phần cứng bởi vì sẽ có nhiều nút hơn, nhưng sẽ có ít vấn đề về khối lượng công việc hơn, và sẽ có thiết kế linh hoạt hơn.

Và tôi chỉ nghĩ rằng tôi sẽ ném nó vào, bởi vì nếu bạn thực sự nghĩ về tất cả những thay đổi phần cứng tôi chỉ chỉ tay vào, và sau đó bạn nghĩ, làm thế nào bạn sẽ mở rộng quy mô và mở rộng ra những thứ đó? Sau đó, bạn nhận ra rằng các kỹ sư cơ sở dữ liệu, theo tôi, ít nhất là được trả lương thấp. Vì vậy, nếu bạn chỉ chiêm ngưỡng lớp phần cứng, các thách thức cơ sở dữ liệu là rõ ràng. Bây giờ tôi chuyển cái này cho Bert, người sẽ khiến tất cả chúng ta cảm thấy được giáo dục.

Eric Kavanagh: Thế thôi! Bậc thầy?

Bert Scalzo: Cảm ơn bạn rất nhiều. Hãy để tôi đi thẳng vào những slide này. Tôi có rất nhiều slide để đi qua, vì vậy trên một vài trong số chúng tôi có thể đi khá nhanh. Chúng ta sẽ nói về Khoảnh khắc Chuyển tiếp này: Di chuyển quan hệ vượt ra ngoài truyền thống. Đây không phải là cơ sở dữ liệu của cha bạn nữa. Mọi thứ đã thay đổi, và như một diễn giả trước đó đã nói, trong sáu đến bảy năm qua, cảnh quan đã thay đổi hoàn toàn.

Chính tôi, tôi đã làm cơ sở dữ liệu từ giữa những năm 80. Tôi đã viết sách về Oracle, SQL Server, điểm chuẩn và khá nhiều thứ khác. Thế giới đang thay đổi rất nhanh. Lớn sẽ không đánh nhỏ nữa. Nó sẽ là người nhanh chóng đánh bại sự chậm chạp. Tôi đã thêm vào bản nhạc để thích nghi. Đó là từ Rupert Murdoch. Tôi thực sự tin rằng điều này sẽ trở thành sự thật. Bạn sẽ không thể làm công cụ cơ sở dữ liệu theo cách bạn đã làm 10, 15, 20 năm trước. Bạn sẽ phải làm theo cách mà doanh nghiệp muốn bây giờ.

Tôi sẽ cố gắng giữ một chút chung chung trong những gì tôi đang trình bày, nhưng hầu hết các tính năng tôi đang nói về bạn sẽ tìm thấy trong Oracle, bạn sẽ tìm thấy trong SQL Server, MySQL, MariaDB và một số tính năng lớn khác người chơi. Cuộc cách mạng cơ sở dữ liệu quan hệ, tôi loại một lần nữa đồng ý với các diễn giả trước đó. Nếu bạn nhìn đúng vào khoảng năm 2010, chúng tôi đã đi từ xe đua màu đỏ sang xe đua màu vàng. Có một sự thay đổi đáng kể và đến năm 2020, tôi tin rằng bạn sẽ thấy một sự thay đổi căn bản khác. Chúng ta đang ở một thời điểm rất thú vị.

Bây giờ, slide này là chìa khóa, đó là lý do tại sao tôi đặt một phím lên đó. Có tất cả sự thay đổi này đang diễn ra, và ở phía bên trái tôi đã có công nghệ, và ở phía bên phải tôi đã có công việc. Và câu hỏi là, cái nào gây ra cái nào, và cái nào hỗ trợ cái nào? Chúng tôi có tất cả những thay đổi về phần cứng này: các đĩa đi xuống, kích thước đĩa tăng lên, các loại đĩa mới, do đó được bao phủ bởi các loa trước đó. Giá bộ nhớ giảm, tất cả các phiên bản mới hơn của cơ sở dữ liệu. Nhưng ở phía bên phải, chúng tôi có bảo vệ và tuân thủ dữ liệu, lưu trữ dữ liệu, kinh doanh thông minh, phân tích, lưu giữ dữ liệu bắt buộc. Cả hai mặt của phương trình đang lái xe, và cả hai mặt của phương trình sẽ sử dụng tất cả các tính năng mới này.

Trước hết, chúng tôi đã có đĩa quay SAS điển hình của chúng tôi, hiện tại chúng đã lên tới 10 terabyte. Nếu bạn chưa từng thấy, Western Digital, HGST có cái mà họ gọi là ổ helium của họ, tức là lên tới khoảng 10 terabyte ngay bây giờ. Chi phí đĩa quay đang trở nên khá thấp. Như đã đề cập trước đó, bạn có thể nhận được các đĩa trạng thái rắn lên đến khoảng hai terabyte, nhưng Samsung sẽ có một đơn vị 20 terabyte sắp ra mắt. Các chi phí đang trở nên hợp lý. Một điều tôi sẽ nói về những người khác đã không là, khái niệm về đĩa flash. PCIe, đó là PCI Express, so với NVMe, bạn có thể nghe thấy hoặc không biết về bộ nhớ không biến động này. Về cơ bản, NVMe sẽ là sự thay thế cho SAS và SATA, và nó thực sự là một giao thức truyền thông hơn bất kỳ thứ gì khác. Nhưng những đĩa đó hiện lên đến khoảng ba terabyte.

Bạn cũng có thể đã thấy rằng một số ổ đĩa SAS hiện nay đi kèm với các đầu nối U.2, đây là một loại đầu nối khác với SAS hoặc SATA, hỗ trợ NVMe với một đĩa tiêu chuẩn - dĩ nhiên, đĩa cũng phải hỗ trợ nó. Và sau đó là SATA với các đầu nối M.2, và những cái đó đang bắt đầu có NVMe. Trên thực tế, có những nhà cung cấp máy tính xách tay hiện đang bán máy tính xách tay có đĩa flash NVMe trong đó và những thứ đó sẽ hét lên so với công nghệ bạn đã sử dụng trước đây.

Rất nhiều người không biết tất cả những thứ chớp nhoáng này là gì. Nếu bạn nhìn ở góc dưới bên phải, đó là một ví dụ về M.2. Bạn có thể nói, Well Well gee, nó trông rất giống ổ đĩa mSATA ở bên trái của nó. Nhưng như bạn có thể thấy, nó có hai khoảng trống trong các chân so với một, và nó lớn hơn một chút. Ngoài ra, M.2 có thể có ba kích cỡ khác nhau.

Và sau đó là đèn flash PCI Express và đèn flash NVMe. Bây giờ, đèn flash NVMe cũng là PCI Express, nhưng PCI Express thường vẫn là thuật toán bộ điều khiển loại SAS hoặc SATA được viết cho đĩa quay và NVMe là thuật toán hoặc kỹ thuật được viết riêng cho flash. Và một lần nữa, bạn sẽ thấy tất cả những thứ này.

NVMe cung cấp khá nhiều thứ. Tôi nghĩ rằng hai cải tiến lớn nhất là, ở góc trên bên phải, độ trễ giảm tới 70%. Tôi thực sự đã nhìn thấy thậm chí cao hơn thế. Ngoài ra, nếu bạn nhìn ở góc dưới bên phải, khi hệ điều hành của bạn nói chuyện với đĩa NVMe, nó sẽ trải qua các cấp độ phần mềm ít hơn nhiều. Về cơ bản, bạn đi qua trình điều khiển NVMe hiện có trong hệ điều hành và nó nói chuyện trực tiếp với truyền thông. Có rất nhiều lý do tại sao công nghệ này sẽ thay đổi hoàn toàn thế giới cơ sở dữ liệu.

Và rất nhiều lần, mọi người sẽ nói, đó là, NVMe nhanh như thế nào? Bạn biết đấy, ngày xưa tốt đẹp, từ năm 2004 trở về trước, chúng tôi đã rất phấn khích nếu chúng tôi có Ultra-320 SCSI, 300 megabyte mỗi giây. Tốc độ ngày nay, rất nhiều bạn có lẽ là trên sợi hoặc InfiniBand, và những loại hàng đầu. NVMe đằng kia bên phải, bắt đầu từ nơi các công nghệ hiện tại kết thúc. Những gì tôi nhận được là, PCI Express 3.0 với liên kết tám làn bắt đầu ở mức gần 8000 và nó sẽ tăng lên khi chúng tôi có các phiên bản mới hơn của PCI Express, phiên bản bốn, v.v. NVMe không có nơi nào để đi ngoại trừ lên.

Bây giờ, một số điều thay đổi trong cơ sở dữ liệu là gì? Bây giờ ở góc trên bên phải của trang trình bày của tôi, tôi đặt lý do kinh doanh mà tôi nghĩ rằng công nghệ đã xuất hiện. Trong trường hợp này, vì lưu trữ dữ liệu và vì lý do quy định cho việc lưu giữ dữ liệu bắt buộc, cơ sở dữ liệu bắt đầu cung cấp tính năng nén trong đó. Bây giờ, một số cơ sở dữ liệu cung cấp nén như một tiện ích bổ sung, một số cơ sở cung cấp dưới dạng tích hợp theo tiêu chuẩn, giả sử phiên bản doanh nghiệp của cơ sở dữ liệu của họ và một số cơ sở dữ liệu, như trong Oracle, thậm chí còn có phiên bản nén tốt hơn giả sử, nền tảng Exadata của họ, vì vậy họ thực sự đã xây dựng phần cứng có thể hỗ trợ nén rất chuyên dụng và ví dụ như trong Exadata, có tốc độ nén 40x, và do đó, nó rất đáng kể. Và tôi nghĩ đó là việc lưu giữ dữ liệu bắt buộc, mọi người chỉ muốn dữ liệu lâu hơn. Các doanh nghiệp, để thực hiện phân tích và BI, họ cần dữ liệu có giá trị 5, 10, 15 năm qua.

Bây giờ một tính năng khác bắt đầu hiển thị ngay trong khoảng thời gian 2008, 2009 đó là phân vùng. Một lần nữa, bạn sẽ tìm thấy điều này trong các cơ sở dữ liệu như Oracle, SQL Server và trong cả hai cơ sở bạn phải trả tiền cho nó. Trong Oracle, bạn phải mua tùy chọn phân vùng và trong SQL Server, bạn phải có phiên bản trung tâm dữ liệu. Đó là kỹ thuật phân chia và chinh phục truyền thống của bạn và những gì bạn làm là bạn có khái niệm về một bàn lớn logic ở trên cùng và khi nó được đưa vào đĩa, nó thực sự bị vỡ thành các thùng. Và bạn có thể thấy rằng các nhóm đó được sắp xếp theo một số tiêu chí để phân tách, thường được tham chiếu hoặc được gọi là chức năng phân vùng của bạn, và sau đó, bạn cũng có thể phân vùng phụ trong một số nền tảng cơ sở dữ liệu và bạn có thể đi xa hơn nữa.

Một lần nữa, tôi nghĩ rằng cả lưu trữ dữ liệu và lưu trữ dữ liệu bắt buộc đã thúc đẩy điều này và trong một số cơ sở dữ liệu này, bạn có thể có tới 64.000 phân vùng và tôi tin vào một số cơ sở dữ liệu khác thậm chí lên tới 64.000 phân vùng phụ. Điều này cho phép bạn chia dữ liệu của bạn thành các phần có thể quản lý. Bạn cũng sẽ phân vùng các chỉ mục; đó là một tùy chọn, bạn không cần phải có, nhưng bạn cũng có thể phân vùng các chỉ mục của mình. Một trong những lý do để làm điều này có thể là bạn có một cửa sổ dữ liệu trượt. Bạn muốn giữ dữ liệu có giá trị 10 năm nhưng để giảm các chỉ mục để chạy tải hàng loạt tối nay, bạn không muốn phải giảm các chỉ mục trên mỗi hàng, chỉ trên các hàng trong nhóm hiện tại. Phân vùng thực sự là một công cụ quản trị rất tốt mặc dù hầu hết mọi người nghĩ rằng lợi ích tuyệt vời của nó là loại bỏ phân vùng trong kế hoạch của bạn và do đó tăng tốc các truy vấn của bạn. Đó thực sự là loại kem trên bánh.

Bây giờ có lẽ bạn đã nghe nói về shending và bạn có thể nghĩ rằng, À, tại sao bạn lại đặt slide này vào đây? Đây là một trong những NoQuery - đây là một trong những môi trường kiểu Hadoop. Oracle 12c đã phát hành hai bản, chưa phải là G8, nhưng bản đang được hiển thị hoặc xem trước thực sự có shending trong đó. Bạn sẽ có một hệ thống cơ sở dữ liệu truyền thống như Oracle và bạn sẽ có thể phân chia như bạn làm trong mô hình Hadoop, và vì vậy bạn sẽ có một kỹ thuật phân chia và chinh phục khác sẽ chia tách bạn sắp xếp hàng theo bảng thành các nhóm trên mỗi nút và điều này sẽ xảy ra - giống như những gì bạn thấy trong một số cơ sở dữ liệu NoQuery của bạn. Và thực sự là MySQL, bạn thực sự có thể thực hiện điều này khá nhiều bằng cách sử dụng một trong các kỹ thuật phân cụm của họ, nhưng nó đang đến với cơ sở dữ liệu truyền thống và tôi đoán là Microsoft sẽ không muốn bị bỏ lại phía sau. Cả hai đều chơi trò nhảy cóc với nhau mọi lúc, vì vậy tôi mong đợi sẽ thấy shending trong phiên bản tiếp theo của SQL Server.

Quản lý vòng đời dữ liệu, một lần nữa lưu giữ dữ liệu bắt buộc, nhưng cũng dành cho phân tích và thông minh kinh doanh. Thực sự, đây là một kỹ thuật phân chia và chinh phục, và thông thường các DBA làm điều này bằng tay, và đó là, tôi sẽ giữ dữ liệu của năm nay trên các đĩa nhanh, dữ liệu năm ngoái trên các đĩa chậm hơn một chút, có thể tôi sẽ để giữ hai năm trước đó trên các đĩa chậm hơn và sau đó tôi sẽ có một số phương pháp lưu trữ. Thông thường, nó không được ghi âm nữa, thông thường - bạn đã có một loại lưu trữ gắn mạng hoặc một số thiết bị có nhiều của lưu trữ và, bạn biết đấy, chi phí hiệu quả nhưng nó vẫn còn quay đĩa.

Và vì vậy, bây giờ bạn thực sự có thể - cả trên Oracle và SQL Server - bạn có thể mua một tùy chọn trong đó bạn xác định các quy tắc và điều này chỉ xảy ra tự động trong nền. Bạn không phải viết kịch bản nữa, bạn không phải làm gì cả. Và nếu bạn đã thấy SQL Server 2016, mới ra mắt vào tháng 6, có một tính năng mới có tên là Căng cơ sở dữ liệu căng thẳng, về cơ bản cho phép bạn làm - ở góc dưới bên phải ở đó - bạn có thể di chuyển trực tiếp từ nhiều lớp vào đám mây và một lần nữa, đây là một tính năng được tích hợp trong cơ sở dữ liệu, bạn chỉ cần nói một cái gì đó như, nếu Nếu dữ liệu đã hơn 365 ngày, vui lòng chuyển nó vào đám mây và, bạn biết đấy, hãy tự động làm điều đó cho tôi.

Đây sẽ là một tính năng thực sự thú vị, trên thực tế tôi đang nghĩ rằng đó có thể là những gì chúng ta sẽ thấy trong tương lai, đó là bạn sẽ có cơ sở dữ liệu lai nơi bạn sẽ giữ một số địa phương và một số trong đám mây. Trước đó, mọi người đã nghĩ rằng, Oh Oh, tôi sẽ làm tại chỗ hoặc tôi sẽ làm trên đám mây. Bây giờ chúng ta đang chứng kiến ​​cuộc hôn nhân của hai công nghệ theo kiểu lai này. Tôi nghĩ rằng điều này sẽ khá lớn và Microsoft đã đến đó trước.

Sự điều chỉnh, điều này là do bảo vệ dữ liệu và tuân thủ. Bây giờ, trong những ngày xưa tốt đẹp, chúng ta có thể đã nói, Hey Hey, nhà phát triển ứng dụng, khi bạn hiển thị điều này trong báo cáo, khi bạn hiển thị điều này trên màn hình, đây là một số điều bảo mật bạn nên kiểm tra và xin vui lòng, chỉ hiển thị dữ liệu họ được cho là nhìn thấy hoặc che giấu hoặc sắp xếp lại dữ liệu mà họ không nên nhìn thấy. Vâng, như thường lệ, khi bạn đẩy nó ra ứng dụng, nó không được thực hiện ở một nơi để nó được thực hiện theo cách khác hoặc nó không được thực hiện 't được thực hiện ở một số nơi. Và bây giờ bạn đã thực sự có khả năng này trong các hệ thống cơ sở dữ liệu của bạn.

Bây giờ trong SQL Server 2016, tính năng này được tích hợp để nó không phải là một mục chi phí tùy chọn chưa có trên phần bổ sung của trung tâm dữ liệu, tôi tin rằng; và trong Oracle 12, bạn phải mua tiện ích quản lý vòng đời của họ, nhưng đây là một cái gì đó mới và một lần nữa nó được điều khiển bởi doanh nghiệp. Và đặc biệt là vì hiện tại bạn đang giữ quá nhiều dữ liệu và bạn đang thực hiện khai thác dữ liệu, do đó BI và phân tích, bạn phải biết ai đang truy cập dữ liệu nào và đảm bảo rằng họ chỉ được phép xem những gì họ được phép xem.

Tương tự như vậy, một lần nữa nhìn vào đó, bảo vệ và tuân thủ dữ liệu. Bạn sẽ thấy rằng rất nhiều hệ thống cơ sở dữ liệu hiện đang xây dựng nén hoặc tôi xin lỗi, mã hóa trực tiếp vào cơ sở dữ liệu và điều quan trọng về mã hóa này, nếu bạn nhìn vào mũi tên xuống và mũi tên lên trên sơ đồ, nó sẽ ghi nó xuống đĩa được mã hóa và sau đó nó đọc lại vào bộ nhớ và giải mã nó. Đó thực sự là một mô hình, có một mô hình khác, mà bạn biết, thực sự chỉ làm điều đó khi nó truyền dữ liệu đó qua mạng đến ứng dụng khách thực tế.

Trong trường hợp đó, nó thậm chí vẫn còn trên máy chủ cơ sở dữ liệu trong bộ nhớ, nó có thể được mã hóa và chỉ được giải mã khi được gửi đến ứng dụng khách. Có hai mô hình khác nhau ở đây và bạn sẽ tìm thấy những mô hình này trong cơ sở dữ liệu và trên thực tế, một trong những cơ sở dữ liệu vừa thêm vào gần đây là MariaDB trong phiên bản 10.X của chúng; Tôi tin rằng họ đang ở trên 10.1 hoặc 10.2. Và tôi thực sự đã thực hiện một số điểm chuẩn cho mã hóa này và để có được mã hóa này, tôi chỉ trải qua việc giảm 8% thông lượng hoặc tốc độ. Trong một bài kiểm tra điểm chuẩn, mã hóa không gây ra nhiều và vì vậy đây là một tính năng rất hữu ích.

Bây giờ, chúng tôi đã đề cập trước đó về bộ nhớ flash và SSD và những thứ tương tự. Một trong những tính năng bạn có trong Oracle và SQL Server mà nhiều người không nhận ra là bạn có thể lấy flash hoặc SSD trên máy chủ cơ sở dữ liệu của mình và bạn có thể nói với cơ sở dữ liệu, sử dụng như thể chúng là bộ nhớ. Hãy coi RAM là ưu tiên, nhưng giả vờ như thế này là bộ nhớ chậm và sử dụng nó như một bộ đệm mở rộng. Hiện tại trong SQL Server 2014, nó đã xuất hiện và được gọi là Tiện ích mở rộng vùng đệm Buffer, miễn phí. Trong Oracle, nó đã xuất hiện vào 11g R2 và nó được gọi là cơ sở dữ liệu Flash Cache Cache và nó cũng miễn phí ở đó.

Tuy nhiên, lời khuyên của tôi là hãy lái thử tính năng này một cách cẩn thận. Mỗi khi bạn làm cho bộ đệm lớn hơn khi bạn thực hiện tra cứu, sẽ mất nhiều thời gian hơn. Nếu bạn đặt một thẻ flash ba terabyte và nói với cơ sở dữ liệu, thì Thêm vào bộ nhớ của bạn, bạn thực sự có thể thấy rằng một cái gì đó bị chậm lại do thời gian để nhìn vào và thấy nó trong flash, nó có bẩn hay không dọn dẹp? Có một điểm của sự trở lại giảm dần. Lời khuyên của tôi là một lần nữa lái thử cái này, xem cái gì phù hợp với bạn, nhưng một lần nữa, nó nằm trong cơ sở dữ liệu của bạn và trong trường hợp của Oracle, trong cả SQL Server và Oracle, nó đã ở đó được vài năm rồi.

Và sau đó điều đó đưa chúng ta đến với ông ngoại là cơ sở dữ liệu trong bộ nhớ và đó là do giá cơ sở dữ liệu đã giảm. Một lý do khác mà bạn có thể nghĩ rằng điều này đã xảy ra là rất nhiều phân tích yêu cầu dữ liệu phải được truy cập rất nhanh và do đó, nó cần phải nằm trong bộ nhớ. Xin lưu ý rằng các thuật toán mà cơ sở dữ liệu sử dụng để truy cập dữ liệu này, để nén nó, để mã hóa nó, để lưu trữ nó, bạn biết rằng trong một số trường hợp, một số cơ sở dữ liệu có thể tiếp tục lưu trữ trong bộ nhớ dưới dạng một hàng.

Trong một số trường hợp, một số cơ sở dữ liệu có thể chia dữ liệu này thành một cột được định hướng và lý do chúng làm điều đó là chúng có mức nén cao hơn nhiều, khoảng 11 đến 12X bằng cách lưu trữ theo thứ tự cột so với thứ tự hàng. Lần đầu tiên xuất hiện trong SQL Server 2014, nó được gọi là Hồi Hekaton. 'Nó được tăng lên triệt để trong SQL Server 2016, họ sẽ thấy nó được tham chiếu bởi một số tên khác nhau và nó xuất hiện trong Oracle 12c; Tôi nói bản phát hành thứ hai ở đây, không phải R2. Có hai bản phát hành khác nhau của Oracle 12c, 12.1.0.1 và 12.1.0.2. Đây là phiên bản thứ hai của phiên bản cơ sở dữ liệu R1.

Và cách bạn định nghĩa nó, đối tượng trong bộ nhớ là tương tự trong cả hai cơ sở dữ liệu. Ở đây bạn có thể thấy ở góc trên cùng bên phải, tôi đang tạo SQL Server và bạn có thể thấy nó nói với bộ nhớ được tối ưu hóa và độ bền chỉ là lược đồ. Tôi sẽ không đi qua tất cả các ý nghĩa cú pháp này và trong Oracle thực sự thậm chí còn đơn giản hơn, bạn chỉ cần thay đổi một bảng và nói trong bộ nhớ hoặc không và bạn có thể thay đổi điều đó. Tôi có thể nói hôm nay là trong trí nhớ và ngày mai thì không và vì vậy nó rất linh hoạt.

Tôi đã thực hiện một số thử nghiệm trên Oracle với các bảng trong bộ nhớ, tôi đã có một số thử nghiệm mất gần 40 phút để chạy, trên đó ở hàng trên cùng. Bây giờ điều quan trọng là khi tôi xuống hai hàng dưới cùng, tôi đã tăng thời gian chạy hoặc giảm nó, tôi nên nói, đến năm phút xấp xỉ và khi tôi nhìn vào hệ số nén, dữ liệu trong bộ nhớ thực sự là 3.6 nhỏ hơn 4, 6 lần. Điều đó quan trọng bởi vì trong trường hợp này tôi đã sử dụng định dạng cột và nó nén. Và đoán xem sao? Tôi thực sự đã lắp được gần gấp bốn đến năm lần dữ liệu trong bộ nhớ của mình. Tôi không chỉ nhận được lợi thế của bộ nhớ trong, lợi thế của định hướng cột, mà còn là lợi thế của dữ liệu nhiều hơn - gấp năm lần dữ liệu trong bộ nhớ cache, vì vậy đây là một kỹ thuật khá mạnh mẽ. Một lần nữa, Oracle và SQL Server, bạn muốn xem xét những thứ này, chúng thực sự là những tính năng tuyệt vời. Và với điều đó, tôi nghĩ rằng tôi sẽ mở nó ra cho câu hỏi.

Eric Kavanagh: Vâng, Bert, trước hết bạn đã rất vị tha trong nền giáo dục tuyệt vời này. Bạn có thể nói chỉ một phút về những gì các bạn làm không? Bởi vì bạn đã có một số công nghệ cho phép có thể tạo điều kiện cho những gì bạn đang nói về. Chỉ cần nói một phút về những gì các bạn làm và sau đó hãy đưa Dez và Robin xuống phương trình ở đây.

Bert Scalzo: Vâng, tôi làm việc cho một công ty tên là IDERA. Chúng tôi ở Texas, chúng tôi có trụ sở tại Houston và tôi thực sự đang ngồi ở Austin ngay bây giờ nhưng tôi có trụ sở tại Dallas. Chúng tôi tạo ra các công cụ cơ sở dữ liệu và chúng tôi tạo các công cụ cơ sở dữ liệu để giúp bạn giải quyết các vấn đề. Vấn đề đó có thể đơn giản như năng suất trong trường hợp chúng tôi có một công cụ gọi là DBArtisan cho phép bạn thực hiện các tác vụ quản trị cơ sở dữ liệu của mình và đó là một công cụ để cho phép bạn quản lý 12 nền tảng cơ sở dữ liệu khác nhau. Tôi có thể quản lý SQL Server, tôi có thể quản lý Oracle, tôi có thể quản lý MySQL, DB2, Postgres và tôi đang sử dụng một công cụ, một thực thi, một thiết kế GUI và một bộ quy trình công việc nhất quán. Chúng tôi cũng tạo ra các công cụ để thực hiện tuân thủ, chúng tôi có một công cụ gọi là Trình quản lý tuân thủ SQL để giúp bạn đáp ứng nhu cầu tuân thủ của bạn. Một công cụ khác có tên SQL Security, vì vậy chúng tôi cố gắng tạo ra các công cụ giúp bạn hiệu quả và hiệu quả, và điều gì thực sự tốt nếu bạn truy cập trang web của chúng tôi, chúng tôi có cả đống phần mềm miễn phí, vì vậy nếu không có gì khác, hãy tải xuống - Tôi nghĩ rằng chúng tôi đã có khoảng 20 hoặc 25 phần mềm miễn phí. Có một số phần mềm miễn phí thực sự tốt ngoài đó như có Máy chủ SQL và Kiểm tra trợ giúp Windows về cơ bản sẽ xem xét những gì bạn có và cho bạn biết liệu bạn có gặp sự cố hay sự việc không và nó hoàn toàn miễn phí.

Eric Kavanagh: Và bạn thực sự thuộc loại người khác

Bert Scalzo: Chắc chắn là thứ đầu tiên

Eric Kavanagh: Bạn đang nói về sự không đồng nhất trên thị trường ngày nay, đã từng có một phương trình một kích cỡ phù hợp với tất cả những gì mà trên thực tế tôi nhớ khi phỏng vấn Tiến sĩ Michael Stonebraker trở lại khi vào năm 2005, khi anh ấy tiếp tục một sự thúc đẩy lớn khi nói về phán quyết về phong trào cơ sở dữ liệu theo định hướng cột và anh ta đã nói tất cả về cách mô hình quan hệ một kích cỡ phù hợp với tất cả trong nhiều năm, và anh ta dự đoán rằng tất cả sẽ thay đổi, và anh ta đã đúng cái đó. Bây giờ chúng ta có môi trường thực sự đa dạng và thú vị này với nhiều lựa chọn và cơ hội khác nhau, nhưng bạn cần ai đó quản lý tất cả những điều đó và đối với tôi, công ty của bạn tập trung khá sâu sắc vào việc giải quyết các vấn đề toán học, do đó trở thành một kẻ gây ra tiêu đề của sự không đồng nhất, phải không?

Bert Scalzo: Hoàn toàn đúng. Ý tôi là luôn luôn có những DBA nói rằng, tôi không muốn sử dụng một công cụ GUI, tôi làm mọi thứ với các tập lệnh, bạn có biết không? Họ nghĩ rằng họ là loại DBA siêu nhân và điều đó tốt nhưng đối với hầu hết mọi người chúng ta, chúng tôi muốn hoàn thành công việc và - bạn biết đấy, tôi sử dụng Microsoft Word để viết tài liệu của mình. Tôi sử dụng Microsoft Outlook để làm email của mình. Ý tôi là, tôi có công cụ để thực hiện các nhiệm vụ. Chúng tôi đang xây dựng cùng một loại khái niệm, chúng tôi xây dựng các công cụ cho các nhà quản trị và nhà phát triển cơ sở dữ liệu để giúp họ tập trung vào những gì họ muốn làm chứ không phải họ phải làm như thế nào.

Eric Kavanagh: Điều đó có ý nghĩa, nhưng hãy để tôi chuyển bạn đến các chuyên gia của chúng tôi và mọi người cảm thấy thoải mái khi tham gia. Chúng tôi đã nhận được một vài bình luận từ khán giả. Có lẽ, Dez, một vài câu hỏi và Robin một vài câu hỏi?

Dez Blanchfield: Chắc chắn. Một trong những câu hỏi đầu tiên mà tôi muốn ném vào bạn, với khoảng kinh nghiệm khổng lồ mà bạn có được, bạn có thấy một thời điểm sớm khi bất kỳ điều này sẽ chậm lại không? Hay bạn có nghĩ rằng chúng ta thực sự chỉ ở điểm khởi đầu của dòng thay đổi tăng trưởng liên tục này? Tôi nghĩ rằng một trong những vấn đề lớn nhất mà các công ty đang phải đối mặt, và sau đó là những người cố gắng hỗ trợ công nghệ được cung cấp cho các công ty đó để điều hành doanh nghiệp của họ, đó là tốc độ thay đổi quá lớn đến nỗi họ không thể theo kịp tất cả các tính năng khác nhau, phần mềm và hệ thống cũng như khung và kiến ​​trúc cũng như mã mới sắp xuất hiện và sau đó phần cứng bên dưới đó, bạn có thấy tốc độ thay đổi hiện tại chậm lại ngay lập tức không? Ý tôi là, bạn đối phó với một loạt các nền tảng như vậy với toàn bộ bộ IDERA, chúng ta sẽ chậm lại hay chúng ta sắp xếp trên chuyến tàu chở hàng điên rồ này trong một thời gian dài chưa?

Bert Scalzo: Tôi nghĩ rằng chúng ta đang ở 20 phần trăm đầu tiên của đường cong tăng trưởng đó và chúng ta đã có một chặng đường dài để đi và có hai điều thúc đẩy nó. Công nghệ tiếp tục phát triển. Bạn đã đề cập đến một số loại bộ nhớ mới sắp ra mắt, điều đó sẽ rất tuyệt vời. Samsung sẽ sớm có một ổ đĩa flash 20 terabyte tại đây. Điều đó sẽ thay đổi mọi thứ. Chúng tôi đã có tất cả các cơ sở dữ liệu đám mây và NoQuery này, điều này sẽ tiếp tục. Tuy nhiên, một điều khá buồn cười là khi tôi nhìn vào các cơ sở dữ liệu như Oracle và SQL Server và một số khác, chúng thực sự không còn là cơ sở dữ liệu quan hệ nữa. Tôi có thể đưa dữ liệu phi cấu trúc vào Oracle và vẫn duy trì tuân thủ ACID. Nếu bạn đã nói với tôi rằng 20 năm trước, tôi chỉ nói rằng bạn đang sử dụng ma túy.

Dez Blanchfield: Vâng, vâng, họ thật tuyệt. Ngay cả bây giờ những động cơ đã có các ngành dọc khá tốt như GIS, chỉ tốt hơn khả năng bản địa bây giờ. Bạn đã đưa ra một số nhận xét tuyệt vời về những thách thức mà các DBA đang phải đối mặt và thời gian khác nhau của các DBA mà chúng ta hy vọng sẽ thấy ở khắp nơi, nhưng thế giới trông như thế nào với loại hình kinh doanh mà bạn đang đối phó? Ý tôi là, đây là những người sử dụng các nền tảng khác nhau từ trình quản lý chẩn đoán của bạn, cho đến các công cụ kiểm kê và tất cả các cách giải quyết vấn đề chống phân mảnh, làm thế nào các DBA đối phó với thay đổi này và cách họ sắp xếp - bạn biết không, họ đang làm gì với các công cụ của bạn để đối phó với sự thay đổi đáng kể này trong bối cảnh của họ?

Bert Scalzo: Chà, tôi sẽ quay trở lại gần 20 năm trước, sau đó tôi sẽ nói rằng các DBA giải quyết một vai trò rất cụ thể trong một tổ chức. Họ thường làm việc với một nền tảng cơ sở dữ liệu, có thể hai và họ quản lý một số lượng cơ sở dữ liệu tương đối nhỏ. Bây giờ nhanh chóng chuyển tiếp đến ngày hôm nay và quản trị viên cơ sở dữ liệu, anh ấy thực sự sẽ biết 10 nền tảng cơ sở dữ liệu. Anh ta đang quản lý, và đây không phải là trò đùa, trong một số trường hợp, hàng ngàn cơ sở dữ liệu; đó là nhiều hơn trên thế giới SQL Server hoặc thế giới MySQL. Nhưng vẫn trong thế giới Oracle, họ có thể quản lý hàng trăm cơ sở dữ liệu. Và vì vậy, họ đã có tất cả các tính năng mới này, họ đã có tất cả các nền tảng mới này và họ đã có tất cả các cơ sở dữ liệu mà họ chịu trách nhiệm. Họ đang tìm kiếm các công cụ để kích hoạt năng suất của họ và cũng để giúp họ tìm hiểu một số điều.

Và tôi sẽ cho bạn một ví dụ - nếu tôi muốn phân vùng bảng thì đó là một cú pháp khá khó hiểu và nếu tôi muốn phân vùng phụ nó, cú pháp lại càng khó hơn. Tôi biết những gì tôi muốn làm, tôi muốn tạo ra xô. Nếu tôi có một công cụ như DBArtisan nói, thì Hey Hey, đây là một màn hình đẹp cho phép bạn tập trung vào những gì bạn đang cố gắng làm hơn là cách bạn đang cố gắng thực hiện, và nhân tiện, hãy đẩy mạnh Hiển thị nút SQL khi bạn hoàn thành và chúng tôi sẽ cho bạn thấy SQL là gì để bạn có thể bắt đầu thực sự học và làm chủ điều này.

Các DBA đang tìm thấy các công cụ giúp họ hoàn thành công việc nhưng cũng giúp dạy cho họ tất cả những thứ mới mà họ đang sử dụng và điều tương tự cũng đúng - giả sử tôi là một người của Oracle và tôi tìm đến MySQL và nói, Được rồi, tạo một cơ sở dữ liệu, DBArtisan. Bây giờ hãy cho tôi xem SQL vì tôi tự hỏi việc tạo cơ sở dữ liệu trên MySQL là gì và tôi chỉ học cú pháp. Và chúng tôi không chỉ giúp họ làm việc trên cơ sở dữ liệu, chúng tôi còn giáo dục họ qua cơ sở dữ liệu.

Dez Blanchfield: Sẽ thú vị hơn nữa khi bạn tiếp cận với một số thứ hiện đại hơn - hoặc không hiện đại hơn, đó không phải là một điều công bằng để nói - nhưng đã có lúc cơ sở dữ liệu là cơ sở dữ liệu. Ngày nay tôi thấy mọi thứ bạn đang nói ở đó với thách thức bổ sung rằng các ngăn xếp công nghệ mà chúng ta thường thấy từ các nhà cung cấp và bạn sắp xếp nguồn mở vào đó và chúng cũng tốt. Không chỉ đối phó với các công cụ cơ sở dữ liệu và các ngôn ngữ truy vấn, mà chúng còn xử lý các kiểu dữ liệu, cấu trúc và không cấu trúc, bạn biết đấy, thách thức của việc phải xử lý mọi thứ từ đầu xa của phổ HDFS nhiều petabyte môi trường cho các thùng chứa nhỏ, và các tệp gói và các định dạng tệp nhật ký khác nhau.

Và tôi nghĩ rằng đó là thứ mà bây giờ chúng ta đang nhìn thấy nơi không có con người, bất kể là siêu nhân, nữ siêu nhân, bất kể họ nghĩ gì, họ về mặt thể chất, họ chỉ không thể đối phó với tốc độ thay đổi đó và quy mô của các biến thể. Tôi nghĩ rằng bộ công cụ mà bạn cung cấp bây giờ sẽ đi đến điểm mà chúng gần như sẽ được đặt trên một bộ mặc định theo nhiều cách để chúng tôi không thể chạy các môi trường cơ sở dữ liệu mà chúng tôi có mà không có chúng vì chúng chỉ là vật lý không thể ném nhiều cơ thể vào họ. Tôi thực sự rất thích bài thuyết trình của bạn. Tôi sẽ chuyển cho Tiến sĩ Robin Bloor, tôi chắc chắn rằng anh ta cũng có rất nhiều câu hỏi để ném vào bạn.

Robin Bloor: Được rồi. Vâng, tôi chắc chắn có câu hỏi. Bert, tôi không biết bạn đang đi đâu - Tôi đã có một cuộc trò chuyện thực sự thú vị vài ngày trước, nơi ai đó bắt đầu nói với tôi về việc bảo vệ dữ liệu DU mới nhất, và dường như tôi đã nói rằng đó là điều không thể tin được hà khắc về những điều họ nhấn mạnh vào. Tôi tự hỏi nếu bạn thực sự nhìn vào đó; nó có phải là thứ bạn quen thuộc không?

Bert Scalzo: Hoàn toàn đúng. Vâng.

Robin Bloor: 2016, Được rồi, hãy cho chúng tôi biết về nó.

Bert Scalzo: Và tôi thực sự là người

Robin Bloor: Rất thú vị.

Bert Scalzo: Tôi thực sự đã làm việc một thời gian cho một nhà cung cấp flash, trong khu vực cơ sở dữ liệu của họ giúp họ xây dựng các sản phẩm flash cho cơ sở dữ liệu và tôi có thể nói với bạn rằng hà khắc đã đi xuống. Ý tôi là, nếu bạn nhớ một slide của tôi, tôi đã nói trong một số cơ sở dữ liệu nó sẽ thực hiện mã hóa nhưng nó sẽ đưa nó vào bộ nhớ máy chủ và trong một số cơ sở dữ liệu mã hóa - nó vẫn được mã hóa trong bộ nhớ máy chủ, nó chỉ được giải mã khi nó được gửi cho khách hàng Vâng, những gì bạn cũng sẽ tìm thấy là một số tiêu chuẩn của chính phủ, đặc biệt là Bộ Quốc phòng hoặc quân đội ở Mỹ, họ cũng đi xuống cấp độ flash và họ muốn biết không chỉ bạn hỗ trợ mã hóa và giải mã phần cứng của bạn, nhưng nếu ai đó đã đánh cắp các con chip mà bạn biết, đã rút chúng ra khỏi máy chủ của bạn, rằng những gì ở đó được mã hóa và vì vậy mặc dù chúng có dung lượng lưu trữ và chúng sẽ không thể lưu trữ tất cả các cách thực tế - không phải là phần flash mà là các chip riêng lẻ. Họ muốn biết rằng chip bằng chip, mọi thứ đều được mã hóa.

Robin Bloor: Wow. Ý tôi là có rất nhiều điều - bạn biết đấy, tôi nghĩ rằng đó chỉ là một hoặc hai slide mà bạn đã đưa ra về điều này, nhưng đó là một điều, một kịch bản mà tôi nghĩ là thực sự thú vị. Chẳng hạn, việc sắp xếp lại thông tin, phải khéo léo hơn một chút so với việc che giấu các lĩnh vực khác nhau bởi vì đặc biệt với học máy hiện nay, bạn có thể thực hiện những điều suy diễn cho phép bạn thể hiện thông tin mà trước đây bạn không thể bề mặt.

Nếu bạn đang cố gắng bảo vệ, hãy nói thông tin về sức khỏe, đó là quy tắc rất hà khắc ở Hoa Kỳ liên quan đến thông tin sức khỏe, nhưng thực tế bạn có thể sử dụng các kỹ thuật học máy khác nhau, bạn thường có thể tìm ra thông tin y tế của ai đó Thực sự là. Tôi chỉ tự hỏi liệu bạn có bất cứ điều gì để nói về điều đó bởi vì tất cả họ đều nghĩ rằng đó là một khu vực thú vị.

Bert Scalzo: Vâng, hoàn toàn, và tôi chỉ sử dụng ví dụ này, tôi không cố nói một cơ sở dữ liệu tốt hơn cơ sở dữ liệu khác, nhưng đây là một ví dụ rất hay cho những gì bạn vừa hỏi. Trong Oracle, nếu tôi không được phép xem một hàng dữ liệu chẳng hạn, như tôi không được phép xem hồ sơ y tế của John Smith. Trong Oracle nếu tôi nói, thì Chọn bản ghi đó, tôi sẽ bị chặn hoặc tôi sẽ được phép xem những gì tôi được phép xem và nó sẽ được xử lý lại. Và nếu tôi nói, ngôi sao chọn tài khoản từ bảng có giá trị bằng John Smith, thì tôi sẽ nhận được số không.

Trong SQL Server, nó có thể thực hiện việc chỉnh sửa nhưng nó có một số lỗ hổng. Nếu tôi nói, Ngôi sao chọn tài khoản từ bảng có giá trị bằng John Smith, thì tôi thực sự sẽ lấy lại một tài khoản, vì vậy tôi biết có John Smith. Một cái an toàn hơn cái kia. Bây giờ tôi mong họ sửa nó, họ luôn chơi trò nhảy cóc với nhau. Và một lần nữa, tôi không cố phân biệt giữa các cơ sở dữ liệu ngoài việc đưa ra một ví dụ về - hãy nhìn vào những gì chúng ta đang nói bây giờ, một thứ đơn giản như tài khoản được chọn cũng phải được cắt giảm bởi mặc dù về mặt kỹ thuật nói, không có gì được tái định nghĩa ngoài sự tồn tại của hàng.

Robin Bloor: Vâng, đúng rồi. Điều đó thật thú vị. Ý tôi là, một câu hỏi chung khác bởi vì tôi không có nhiều thời gian, thực sự chỉ là về những cải tiến. Ý tôi là bạn đã ở một nơi mà tôi biết rằng bạn đã cho chúng tôi xem các ví dụ về các kết quả thử nghiệm khác nhau mà bạn đã chạy - bạn có nghĩ rằng các cơ sở dữ liệu truyền thống, hãy gọi chúng là cơ sở dữ liệu thống trị, SQL Server và Oracle, bạn có nghĩ rằng họ sẽ đi trước hoàn thành? Hoặc bạn có nghĩ rằng họ thực sự sẽ bị bắt bởi một hoặc một số loại gián đoạn khác nhau trên thị trường thực sự chạy cho họ? Ý kiến ​​của bạn là gì?

Bert Scalzo: Tôi có một ý kiến ​​và nó - bạn biết đấy, một lần nữa tôi sẽ nói đó là ý kiến ​​của tôi - ví dụ như Microsoft, trong kỷ nguyên hậu Ballmer chỉ gây ấn tượng với tôi. Ý tôi là cơ sở dữ liệu mở rộng này nhận SQL Server trên Linux, nhận .NET trên Linux, nhận PowerShell trên Linux; Tôi không nghĩ rằng các nhà cung cấp cơ sở dữ liệu truyền thống sẽ bị bỏ lại phía sau. Tôi nghĩ họ đã quyết định rồi, Hey Hey, hãy để những người mới, những người khởi nghiệp định nghĩa một cái gì đó. Hãy để họ tìm ra shending là gì và nó nên được hoàn thiện như thế nào, và một khi họ đã thực hiện tất cả các nghiên cứu và phát triển, chúng tôi biết chính xác những gì người dùng muốn, bây giờ hãy thêm shending vào Oracle. Tôi nghĩ họ đang trở nên thông minh và nói rằng, Hey Hey, đứng thứ hai hoặc thứ ba không phải là xấu khi bạn là người chơi thống trị bởi vì sau đó mọi người sẽ không di cư khỏi bạn.

Robin Bloor: Vâng, ý tôi là đó là một chiến lược đã được sử dụng. Ý tôi là IBM đã từng làm điều đó và toàn bộ - cho toàn bộ phạm vi sản phẩm của họ và nó đánh giá khá hợp lý cho đến khi ai đó nghĩ ra thứ gì đó hoàn toàn xa lạ mà không ai nghĩ tới, nhưng bạn không thể lập kế hoạch chống lại điều đó

Câu hỏi từ khán giả, Eric?

Eric Kavanagh: Vâng, nhưng bạn đã có thời gian tôi nghĩ chỉ vì một người có thể và tôi biết rằng Bert phải chạy. Có một cái gì đó ở đây về - được thôi, kiến ​​trúc shending trên Oracle 12c là một dấu hiệu của - hoặc đó là dấu hiệu gì trong quan điểm của bạn, bạn nghĩ điều gì đang xảy ra ở đó?

Bert Scalzo: Chà, Oracle đang tiếp thu hoặc / và cung cấp mọi thứ mà tất cả các nhà cung cấp cơ sở dữ liệu khác đang có. Ví dụ, tôi có thể đặt dữ liệu phi cấu trúc trong Oracle. Tôi không biết làm thế nào bạn có thể đặt dữ liệu phi cấu trúc và sau đó gọi nó là cơ sở dữ liệu quan hệ, vì vậy nó không có ý nghĩa gì, nhưng bạn có thể. Và bây giờ, Oracle đang thêm shending, vì vậy Oracle đang nói, Bạn biết gì không? Dù thị trường muốn gì, chúng tôi sẽ cung cấp cơ sở dữ liệu của mình vì thị trường muốn những gì thị trường muốn và chúng tôi muốn cung cấp giải pháp, chúng tôi muốn họ ở lại với chúng tôi.

Tôi nghĩ rằng bạn sẽ thấy các mục bổ sung. Tôi sẽ không ngạc nhiên khi thấy các cụm cơ sở dữ liệu giống như Hadoop không nằm trong một giá đỡ Oracle hoặc cụm ứng dụng thực, nhưng về cơ bản là trong một cụm phân loại kiểu Hadoop truyền thống đang thực hiện việc bảo vệ đó. Và vì vậy tôi nghĩ rằng bạn sẽ có thể triển khai một cơ sở dữ liệu như Oracle giống như Hadoop và những xu hướng này sẽ tiếp tục. Những nhà cung cấp cơ sở dữ liệu lớn này, họ kiếm được hàng tỷ đô la và họ không muốn mất thị trường, vì vậy họ sẵn sàng thích nghi với mọi thứ hoặc chấp nhận bất cứ điều gì.

Eric Kavanagh: Chà, bạn biết đấy, thật buồn cười vì tôi đã theo dõi các nhà cung cấp nguồn mở trong một thời gian khá lâu và đã tự hỏi tất cả những điều đó sẽ ảnh hưởng lớn đến công nghệ cửa đóng truyền thống như thế nào và trong một thời gian chắc chắn cảm giác như các nhà cung cấp nguồn mở đang thực hiện một số bước tiến nghiêm trọng, và bây giờ khi tôi nhìn vào thị trường, tôi thấy những gì bạn đang nói, rằng các ông lớn đã làm toán, đã gọt bút chì và họ đã tìm ra cách họ có thể dệt rất nhiều thứ đó vào kiến ​​trúc của mình. Cho dù đó là IBM, hay Oracle hay SAP - Tôi vừa tham dự Hội nghị SapphireNow vào tháng trước và Steve Lucas, người đứng đầu một nửa công ty đó, đã khoe rằng SAP hiện kết hợp trong nền tảng đám mây HANA của họ, nhiều thành phần nguồn mở hơn bất kỳ thành phần nào của họ đối thủ cạnh tranh. Nếu bạn làm toán trên đó, đó là một tuyên bố khá ấn tượng và nó cho tôi biết các ông lớn sẽ không đi đâu cả sớm.

Bert Scalzo: Không, tôi sẽ đặt cược tiền của mình vào cả hai. Ý tôi là nếu bạn nhìn, cổ phiếu của Microsoft gần đây ở mức khoảng 50 đô la và, bạn biết đấy, chỉ vài năm trước đây là 25. Bạn không tăng gấp đôi giá cổ phiếu của mình trong một thời gian ngắn trừ khi bạn làm việc tốt và, bạn biết rằng, từ việc làm mọi thứ từ Windows 10 miễn phí trong năm đầu tiên cho đến tất cả những điều thông minh khác mà họ đang làm, tính năng cơ sở dữ liệu mở rộng này tôi nghĩ chỉ là hiện tượng. Tôi nghĩ điều gì sẽ xảy ra là rất nhiều người sẽ kết thúc bằng Azure, không trực tiếp, không như họ nói, Cameron Hãy di chuyển cơ sở dữ liệu của tôi sang Azure. Đây sẽ di chuyển qua đó một cách kỳ diệu bởi vì nó sẽ được lưu trữ ở đó sử dụng tính năng cơ sở dữ liệu mở rộng mới này và do đó, việc áp dụng Azure sẽ tăng vọt.

Eric Kavanagh: Đó là một trong những xu hướng trên thị trường mà thậm chí tôi có thể thấy, ngay cả trên máy Mac của bạn. Khi bạn đi vào máy Mac của mình để lưu một số tài liệu, chúng bây giờ - và các máy Mac mới hơn chỉ đi theo đám mây, phải không? Ý tôi là, có rất nhiều ý nghĩa trong chiến lược đó và tôi cũng nhìn vào nó và đi, các bạn ạ, bạn đang cố gắng lôi kéo tôi từng mảnh vào môi trường đám mây của bạn, và rồi một ngày nào đó khi tôi muốn xem một vài bộ phim nếu Thẻ tín dụng của tôi đã hết hạn Tôi sẽ gặp rắc rối.

Bert Scalzo: Vâng, nhưng bạn làm điều đó trên Facebook.

Eric Kavanagh: Vâng. Đúng.

Bert Scalzo: Bạn đặt mọi thứ lên Facebook.

Eric Kavanagh: Chà, không hoàn toàn như vậy.

Bert Scalzo: Không, ý tôi là

Eric Kavanagh: Vâng, hãy tiếp tục.

Bert Scalzo: Những xu hướng xã hội này đang tiếp cận các doanh nghiệp. Bây giờ các doanh nghiệp vẫn còn rất nhiều việc khác họ phải làm, nhưng họ đang nhìn thấy những xu hướng này và họ đang làm những điều tương tự. Tôi không thấy Oracle hay Microsoft sẽ biến mất. Trên thực tế, tôi sẽ mua cổ phiếu trên cả hai lần.

Eric Kavanagh: Vâng, thực sự. Vâng, các bạn, hãy truy cập idera.com, IDERA dot com. Giống như Bert đã nói, họ có cả đống thứ miễn phí ở đó và đó là một trong những xu hướng mới trên thị trường - cung cấp cho bạn một số thứ miễn phí để chơi xung quanh, khiến bạn bị cuốn hút, và sau đó bạn đi mua đồ thật.

Các bạn, đây là một công nghệ nóng khác. Cảm ơn vì thời gian của bạn ngày hôm nay, tất nhiên là cả Bert, Dez và Robin. Chúng tôi sẽ nói chuyện với bạn vào tuần tới, mọi người, rất nhiều thứ đang diễn ra. Nếu bạn có bất kỳ ý tưởng nào, vui lòng gửi email của bạn thực sự, . Chúng tôi sẽ nói chuyện với bạn lần sau, bảo trọng. Tạm biệt.

Động lực về phía trước: di chuyển quan hệ vượt ra ngoài truyền thống