Trang Chủ Cơ sở dữ liệu Xây dựng kiến ​​trúc dữ liệu theo định hướng kinh doanh

Xây dựng kiến ​​trúc dữ liệu theo định hướng kinh doanh

Anonim

Bởi nhân viên Techopedia, ngày 28 tháng 9 năm 2016

Takeaway: Host Rebecca Jozwiak thảo luận về các giải pháp kiến ​​trúc dữ liệu với Eric Little của OSTHUS, Malcolm Chisholm của First San Francisco Partners và Ron Huizenga của IDERA.

Bạn hiện chưa đăng nhập. Vui lòng đăng nhập hoặc đăng ký để xem video.

Rebecca Jozwiak: Thưa quý vị và các bạn, xin chào, và chào mừng đến với Công nghệ nóng của năm 2016. Hôm nay chúng ta đang thảo luận về việc xây dựng Kiến trúc dữ liệu hướng đến doanh nghiệp, chắc chắn là một chủ đề nóng. Tên tôi là Rebecca Jozwiak, tôi sẽ là người dẫn chương trình của bạn cho webcast ngày hôm nay. Chúng tôi đã tweet với hashtag # HotTech16 vì vậy nếu bạn đã ở Twitter, xin vui lòng tham gia vào đó. Nếu bạn có câu hỏi bất cứ lúc nào, vui lòng gửi chúng vào khung Hỏi & Đáp ở phía dưới bên phải màn hình của bạn và chúng tôi sẽ đảm bảo họ được trả lời. Nếu không, chúng tôi sẽ đảm bảo rằng khách của chúng tôi nhận được chúng cho bạn.

Vì vậy, hôm nay chúng tôi đã có một đội hình thực sự hấp dẫn. Rất nhiều người tuyệt vời với chúng tôi ngày hôm nay. Chúng tôi có Eric Little, VP khoa học dữ liệu từ OSTHUS. Chúng tôi có Malcolm Chisholm, giám đốc đổi mới, một tiêu đề thực sự tuyệt vời cho First San Francisco Partners. Và chúng tôi có Ron Huizenga, giám đốc sản phẩm cao cấp của IDERA. Và, bạn biết đấy, IDERA là một bộ giải pháp mô hình hóa và quản lý dữ liệu thực sự đầy đủ. Và hôm nay anh ấy sẽ cho chúng tôi một bản demo về cách giải pháp của anh ấy hoạt động. Nhưng trước khi chúng ta đạt được điều đó, Eric Little, tôi sẽ chuyền bóng cho bạn.

Eric Little: Được rồi, cảm ơn rất nhiều. Vì vậy, tôi sẽ đi qua một vài chủ đề ở đây mà tôi nghĩ sẽ liên quan đến cuộc nói chuyện của Ron một chút và hy vọng sẽ tạo tiền đề cho một số chủ đề này, một số câu hỏi và trả lời.

Vì vậy, điều khiến tôi quan tâm với những gì IDERA đang làm là tôi nghĩ rằng họ chỉ ra chính xác rằng môi trường phức tạp thực sự đang thúc đẩy rất nhiều giá trị kinh doanh hiện nay. Và bởi các môi trường phức tạp, chúng tôi có nghĩa là môi trường dữ liệu phức tạp. Và công nghệ đang thực sự phát triển rất nhanh và thật khó để theo kịp môi trường kinh doanh ngày nay. Vì vậy, những người làm việc trong không gian công nghệ thường sẽ thấy rằng bạn có những khách hàng đang gặp vấn đề với, Làm thế nào để tôi sử dụng dữ liệu lớn? Làm thế nào để tôi kết hợp ngữ nghĩa? Làm cách nào để liên kết một số nội dung mới này với dữ liệu cũ của tôi? Và v.v., và loại đó dẫn chúng ta ngày nay vào bốn v dữ liệu lớn mà nhiều người khá quen thuộc và tôi hiểu rằng có thể có hơn bốn đôi khi - tôi đã thấy tới tám hoặc chín - nhưng thông thường, khi mọi người nói về những thứ như dữ liệu lớn hoặc nếu bạn đang nói về dữ liệu lớn thì bạn thường nhìn vào thứ gì đó có quy mô doanh nghiệp. Và vì vậy mọi người sẽ nói, được thôi, hãy nghĩ về khối lượng dữ liệu của bạn, thường là trọng tâm - đó chỉ là số tiền bạn có. Vận tốc của dữ liệu phải làm với tốc độ tôi có thể di chuyển xung quanh hoặc tốc độ tôi có thể truy vấn nó hoặc nhận được câu trả lời, v.v. Và cá nhân tôi nghĩ rằng mặt trái của nó là thứ gì đó đang được giải quyết và xử lý tương đối nhanh chóng bằng nhiều cách tiếp cận khác nhau. Nhưng ở phía bên phải, tôi thấy rất nhiều khả năng để cải thiện và rất nhiều công nghệ mới đang thực sự đi đầu. Và đó thực sự phải làm với cột thứ ba, sự đa dạng dữ liệu.

Vì vậy, nói cách khác, hầu hết các công ty hiện nay đang xem xét dữ liệu có cấu trúc, bán cấu trúc và không cấu trúc. Dữ liệu hình ảnh đang bắt đầu trở thành một chủ đề nóng, vì vậy có thể sử dụng thị giác máy tính, nhìn vào pixel, có thể cạo văn bản, NLP, trích xuất thực thể, bạn có thông tin biểu đồ xuất phát từ mô hình thống kê hoặc sắp ra khỏi ngữ nghĩa các mô hình, bạn có dữ liệu quan hệ tồn tại trong các bảng, v.v. Và do đó, việc kết hợp tất cả các dữ liệu đó lại với nhau và tất cả các loại khác nhau này thực sự là một thách thức lớn và bạn sẽ thấy điều này, trong Gartner và những người khác đang theo xu hướng trong ngành.

Và sau đó, điều cuối cùng mà mọi người nói đến trong dữ liệu lớn thường là khái niệm về sự phàm ăn, đây thực sự là sự không chắc chắn của dữ liệu của bạn, sự mờ nhạt của nó. Làm thế nào để bạn biết dữ liệu của bạn là gì, bạn hiểu những gì trong đó và, bạn biết không? Khả năng sử dụng số liệu thống kê và khả năng sử dụng một số loại thông tin xung quanh những gì bạn có thể biết hoặc sử dụng một số bối cảnh, có thể có giá trị ở đó. Và vì vậy, khả năng xem dữ liệu theo cách này về mức độ bạn có, tốc độ bạn cần di chuyển hoặc nhận dữ liệu, tất cả các loại dữ liệu bạn có thể có trong doanh nghiệp của mình và mức độ chắc chắn của bạn về nơi nó là gì, nó là gì, chất lượng như thế nào, v.v. Điều này thực sự đòi hỏi một nỗ lực lớn, phối hợp giữa nhiều cá nhân để quản lý dữ liệu của họ một cách hiệu quả. Mô hình hóa dữ liệu, do đó, ngày càng quan trọng trong thế giới ngày nay. Vì vậy, các mô hình dữ liệu tốt đang thực sự thúc đẩy rất nhiều thành công trong các ứng dụng doanh nghiệp.

Bạn có nguồn dữ liệu từ nhiều nguồn khác nhau, như chúng tôi đã nói, điều này thực sự đòi hỏi rất nhiều loại tích hợp khác nhau. Vì vậy, kéo tất cả lại với nhau thực sự hữu ích để có thể chạy các truy vấn, ví dụ, qua nhiều loại nguồn dữ liệu và kéo thông tin trở lại. Nhưng để làm được điều đó, bạn cần có các chiến lược ánh xạ tốt và vì vậy việc lập bản đồ các loại dữ liệu đó và theo kịp các ánh xạ đó có thể là một thách thức thực sự. Và sau đó bạn có vấn đề này, làm thế nào để tôi liên kết dữ liệu kế thừa của mình với tất cả các nguồn dữ liệu mới này? Vì vậy, giả sử tôi có biểu đồ, tôi có lấy tất cả dữ liệu quan hệ của mình và đưa nó vào biểu đồ không? Thông thường đó không phải là một ý tưởng tốt. Vậy làm thế nào mà mọi người có thể quản lý tất cả các loại mô hình dữ liệu này đang diễn ra? Phân tích thực sự phải được chạy trên nhiều loại nguồn dữ liệu và kết hợp khác nhau. Vì vậy, những câu trả lời được đưa ra từ đây, những câu trả lời mà mọi người cần để thực sự đưa ra quyết định kinh doanh tốt là rất quan trọng.

Vì vậy, đây không chỉ là xây dựng công nghệ vì lợi ích của công nghệ, mà thực sự, tôi sẽ làm gì, tôi có thể làm gì với nó, tôi có thể chạy loại phân tích nào và khả năng, vì vậy, như tôi đã đã nói về, để kéo những thứ này lại với nhau, để tích hợp nó thực sự, thực sự quan trọng. Và một trong những loại phân tích này sau đó chạy trên những thứ như tìm kiếm và truy vấn được liên kết. Điều đó thực sự trở thành phải. Các truy vấn của bạn thường phải được phân luồng qua nhiều loại nguồn và kéo thông tin trở lại một cách đáng tin cậy.

Yếu tố chính mà thường, đặc biệt là mọi người sẽ xem xét những thứ chính như công nghệ ngữ nghĩa - và đây là điều mà tôi hy vọng Ron sẽ nói về một chút trong phương pháp IDERA - là cách bạn tách hoặc quản lý mô hình lớp dữ liệu của bạn từ chính lớp dữ liệu, từ dữ liệu thô đó? Vì vậy, ở lớp dữ liệu bạn có thể có cơ sở dữ liệu, bạn có thể có dữ liệu tài liệu, bạn có thể có dữ liệu bảng tính, bạn có thể có dữ liệu hình ảnh. Nếu bạn ở trong các lĩnh vực như ngành công nghiệp dược phẩm, bạn đã có một lượng lớn dữ liệu khoa học. Và sau đó, trên hết mọi người thường tìm cách xây dựng một mô hình cho phép họ nhanh chóng tích hợp dữ liệu đó và thực sự khi bạn đang tìm kiếm dữ liệu bây giờ bạn không muốn kéo tất cả dữ liệu vào lớp mô hình của bạn, những gì bạn đang nhìn vào lớp mô hình sẽ làm là cung cấp cho bạn một biểu diễn logic tuyệt vời về những thứ, từ vựng thông thường, các loại thực thể và mối quan hệ phổ biến và khả năng tiếp cận dữ liệu thực sự. Vì vậy, nó phải nói nó là gì, và nó phải nói nó ở đâu, và nó phải nói làm thế nào để lấy nó và mang nó trở lại.

Vì vậy, đây là một cách tiếp cận khá thành công trong việc thúc đẩy các công nghệ ngữ nghĩa tiến lên, đó là một lĩnh vực mà tôi làm việc rất nhiều. Vì vậy, một câu hỏi mà tôi muốn đặt ra cho Ron, và tôi nghĩ rằng nó sẽ hữu ích trong phần Hỏi & Đáp, là để xem điều này được nền tảng IDERA thực hiện như thế nào? Vì vậy, lớp mô hình thực sự tách biệt với lớp dữ liệu? Chúng có tích hợp hơn không? Làm thế nào nó hoạt động và một số kết quả và lợi ích mà họ đang thấy từ phương pháp của họ là gì? Do đó dữ liệu tham khảo đang thực sự trở nên quan trọng. Vì vậy, nếu bạn sẽ có các loại mô hình dữ liệu này, nếu bạn có thể liên kết và tìm kiếm mọi thứ, bạn thực sự phải có dữ liệu tham khảo tốt. Nhưng vấn đề là dữ liệu tham khảo có thể thực sự khó để duy trì. Vì vậy, thông thường việc đặt tên theo tiêu chuẩn là một thử thách khó khăn. Một nhóm sẽ gọi một cái gì đó X và một nhóm sẽ gọi một cái gì đó Y và bây giờ bạn có vấn đề làm thế nào một người tìm thấy X và Y khi họ đang tìm kiếm loại thông tin này? Bởi vì bạn không muốn chỉ cung cấp cho họ một phần dữ liệu, bạn muốn cung cấp cho họ mọi thứ liên quan. Đồng thời thay đổi các điều khoản, phần mềm trở nên không dùng nữa, v.v., làm thế nào để bạn theo kịp và duy trì dữ liệu tham chiếu đó theo thời gian?

Và, một lần nữa, các công nghệ ngữ nghĩa, cụ thể là sử dụng những thứ như phân loại và từ vựng, từ điển dữ liệu, đã cung cấp một cách thức không gian tiêu chuẩn để thực hiện điều này, thực sự rất mạnh mẽ, nó sử dụng một số loại tiêu chuẩn nhất định, nhưng cộng đồng cơ sở dữ liệu đã thực hiện điều này cho thời gian dài là tốt, chỉ trong những cách khác nhau. Tôi nghĩ một trong những chìa khóa ở đây là suy nghĩ về cách sử dụng các mô hình có liên quan đến thực thể, cách sử dụng các mô hình đồ thị hoặc một số cách tiếp cận ở đây thực sự sẽ mang đến cho bạn hy vọng cách xử lý dữ liệu tham chiếu của bạn. Và dĩ nhiên, một khi bạn có dữ liệu tham chiếu, các chiến lược ánh xạ phải quản lý nhiều loại tên và thực thể. Vì vậy, các chuyên gia vấn đề thường thích sử dụng các thuật ngữ riêng của họ.

Vì vậy, một thách thức trong vấn đề này luôn là, làm thế nào để bạn cung cấp thông tin cho ai đó nhưng làm cho nó phù hợp với cách họ nói về nó? Vì vậy, một nhóm có thể có một cách nhìn vào một cái gì đó, ví dụ, bạn có thể là một nhà hóa học làm việc về một loại thuốc và bạn có thể là một nhà sinh học cấu trúc làm việc trên cùng một loại thuốc và bạn có thể có các tên khác nhau cho cùng một loại thực thể có liên quan đến lĩnh vực của bạn. Bạn phải tìm ra cách mang các thuật ngữ được cá nhân hóa lại với nhau, bởi vì cách tiếp cận khác là, bạn phải buộc mọi người bỏ thuật ngữ của họ và sử dụng thuật ngữ của người khác mà họ thường không thích. Một điểm khác ở đây là việc xử lý số lượng lớn từ đồng nghĩa trở nên khó khăn, do đó, có rất nhiều từ khác nhau trong dữ liệu của nhiều người có thể đề cập đến cùng một điều. Bạn có một vấn đề tham chiếu ở đó bằng cách sử dụng một tập hợp quan hệ nhiều-một. Các thuật ngữ chuyên ngành khác nhau tùy theo từng ngành, vì vậy nếu bạn sẽ đưa ra một giải pháp bao quát cho loại quản lý dữ liệu này, thì nó có thể dễ dàng di chuyển từ dự án này hay ứng dụng này sang dự án khác? Đó có thể là một thách thức khác.

Tự động hóa là quan trọng và nó cũng là một thách thức. Thật tốn kém khi tự xử lý dữ liệu tham chiếu. Thật tốn kém khi phải lập bản đồ thủ công và thật tốn kém khi các chuyên gia về chủ đề ngừng làm công việc hàng ngày của họ và phải tiếp tục sửa chữa từ điển dữ liệu và cập nhật lại các định nghĩa, v.v. Từ vựng có thể lặp lại thực sự cho thấy rất nhiều giá trị. Vì vậy, đó là những từ vựng thường xuyên mà bạn có thể tìm thấy bên ngoài tổ chức của mình. Ví dụ, nếu bạn đang làm việc trong dầu thô, sẽ có một số loại từ vựng nhất định bạn có thể mượn từ các không gian nguồn mở, cùng với dược phẩm, cùng với ngành ngân hàng và tài chính, cùng với rất nhiều lĩnh vực này. Mọi người đang đưa những từ vựng có thể tái sử dụng, chung chung, có thể nhân rộng ra để mọi người sử dụng.

Và, một lần nữa, nhìn vào công cụ IDERA, tôi tò mò muốn xem họ xử lý việc này như thế nào về việc sử dụng các loại tiêu chuẩn. Trong thế giới ngữ nghĩa, bạn thường thấy những thứ như mô hình SKOS cung cấp các tiêu chuẩn ít nhất rộng hơn / hẹp hơn các mối quan hệ và những điều đó có thể khó thực hiện trong các mô hình ER, nhưng, bạn biết đấy, không phải là không thể, nó chỉ phụ thuộc vào mức độ đó máy móc và liên kết mà bạn có thể xử lý trong các loại hệ thống.

Vì vậy, cuối cùng tôi chỉ muốn so sánh với một số công cụ ngữ nghĩa mà tôi thấy trong ngành, và hỏi Ron và nói với anh ấy một chút để nói về việc có lẽ hệ thống của IDERA đã được sử dụng kết hợp với bất kỳ công nghệ ngữ nghĩa nào. Có khả năng được tích hợp với ba cửa hàng, cơ sở dữ liệu đồ thị? Làm thế nào dễ dàng để sử dụng các nguồn bên ngoài bởi vì những loại điều đó trong thế giới ngữ nghĩa thường có thể được mượn bằng cách sử dụng Điểm cuối SPARQL? Bạn có thể nhập trực tiếp các mô hình RDF hoặc OWL vào mô hình của mình - tham khảo lại chúng - vì vậy, ví dụ, bản thể học gen hoặc bản thể học protein, có thể sống ở đâu đó trong không gian của riêng nó với cấu trúc quản trị riêng và tôi có thể chỉ cần nhập tất cả hoặc một phần trong đó khi tôi cần nó vào các mô hình của riêng tôi. Và tôi tò mò muốn biết IDERA tiếp cận vấn đề này như thế nào. Bạn có phải duy trì mọi thứ bên trong, hoặc có cách nào để sử dụng các loại mô hình tiêu chuẩn khác và kéo chúng vào và cách thức hoạt động không? Và điều cuối cùng tôi đề cập ở đây là có bao nhiêu công việc thủ công thực sự liên quan để xây dựng các thuật ngữ và kho lưu trữ siêu dữ liệu?

Vì vậy, tôi biết Ron sẽ cho chúng ta thấy một số bản demo về những thứ này sẽ thực sự thú vị. Nhưng vấn đề mà tôi thường thấy khi tư vấn với khách hàng là rất nhiều lỗi xảy ra nếu mọi người viết theo định nghĩa riêng hoặc siêu dữ liệu của riêng họ. Vì vậy, bạn nhận được lỗi chính tả, bạn nhận được lỗi ngón tay béo, đó là một điều. Bạn cũng nhận được những người có thể lấy thứ gì đó từ, bạn biết, chỉ Wikipedia hoặc một nguồn không nhất thiết phải là chất lượng bạn có thể muốn trong định nghĩa của bạn, hoặc định nghĩa của bạn chỉ từ quan điểm của một người nên chưa hoàn chỉnh, và sau đó không rõ ràng quy trình quản trị hoạt động như thế nào. Quản trị, tất nhiên, là một vấn đề rất, rất lớn bất cứ khi nào bạn nói về dữ liệu tham chiếu và bất cứ khi nào bạn nói về cách dữ liệu này có thể phù hợp với dữ liệu chính của ai đó, cách họ sẽ sử dụng siêu dữ liệu của họ và Sớm.

Vì vậy, tôi chỉ muốn đưa một số chủ đề này ra khỏi đó. Đây là những mục mà tôi thấy trong không gian kinh doanh qua rất nhiều loại tham gia tư vấn khác nhau và rất nhiều không gian khác nhau, và tôi thực sự quan tâm để xem Ron sẽ cho chúng tôi thấy những gì về IDERA để chỉ ra một số chủ đề này . Cảm ơn bạn rất nhiều.

Rebecca Jozwiak: Cảm ơn rất nhiều, Eric và tôi thực sự thích nhận xét của bạn rằng nhiều lỗi có thể xảy ra nếu mọi người đang viết định nghĩa hoặc siêu dữ liệu của riêng họ. Tôi biết trong thế giới báo chí có một câu thần chú mà nhiều mắt mắc phải vài lỗi, nhưng khi nói đến các ứng dụng thực tế, quá nhiều tay trong hũ bánh quy có xu hướng khiến bạn bị hỏng rất nhiều bánh quy, phải không?

Eric Little: Vâng, và vi trùng.

Rebecca Jozwiak: Vâng. Với điều đó tôi sẽ tiếp tục và chuyển nó cho Malcolm Chisholm. Malcolm, sàn là của bạn.

Malcolm Chisholm: Cảm ơn bạn rất nhiều, Rebecca. Tôi muốn nhìn một chút về những gì Eric đang nói và thêm vào, một vài quan sát mà bạn biết, Ron có thể quan tâm để trả lời, khi nói về Kiến trúc dữ liệu hướng về doanh nghiệp hướng tới Xấu - có nghĩa là gì được thúc đẩy kinh doanh và tại sao điều đó quan trọng? Hay nó chỉ là một hình thức cường điệu? Tôi không nghĩ rằng nó là.

Nếu chúng ta nhìn vào những gì đang diễn ra kể từ đó, bạn biết đấy, máy tính máy tính lớn thực sự đã có sẵn cho các công ty - giả sử, khoảng năm 1964 - cho đến ngày nay, chúng ta có thể thấy rằng đã có rất nhiều thay đổi. Và những thay đổi này tôi sẽ tóm tắt là sự thay đổi từ trung tâm quá trình sang trung tâm dữ liệu. Và đó là những gì làm cho kiến ​​trúc dữ liệu theo định hướng kinh doanh trở nên quan trọng và phù hợp cho ngày hôm nay. Và tôi nghĩ, bạn biết đấy, nó không chỉ là một từ thông dụng, nó là thứ hoàn toàn có thật.

Nhưng chúng ta có thể đánh giá cao nó hơn một chút nếu chúng ta đi sâu vào lịch sử, vì vậy quay ngược thời gian, quay trở lại những năm 1960 và trong một thời gian sau đó, các máy tính lớn chiếm ưu thế. Sau đó, chúng nhường chỗ cho PC nơi bạn thực sự nổi loạn của người dùng khi PC xuất hiện. Cuộc nổi loạn chống lại CNTT tập trung, những người mà họ cho rằng không đáp ứng nhu cầu của họ, không đủ nhanh nhẹn. Điều đó nhanh chóng làm phát sinh điện toán phân tán, khi các PC được liên kết với nhau. Và sau đó internet bắt đầu xảy ra, điều này đã làm mờ ranh giới của doanh nghiệp - giờ đây nó có thể tương tác với các bên ngoài về mặt trao đổi dữ liệu, điều chưa từng xảy ra trước đây. Và bây giờ chúng ta đã đi vào kỷ nguyên của đám mây và dữ liệu lớn, trong đó đám mây là nền tảng thực sự đang hàng hóa hóa cơ sở hạ tầng và vì vậy chúng ta sẽ rời đi, vì nó cần phải điều hành các trung tâm dữ liệu lớn bởi vì, bạn biết đấy, chúng ta Chúng tôi đã có khả năng đám mây có sẵn cho chúng tôi và đồng thời với dữ liệu lớn mà Eric có, bạn biết đấy, nên đã thảo luận một cách hùng hồn. Và nhìn chung, như chúng ta thấy, khi sự thay đổi trong công nghệ xảy ra, nó đã trở nên tập trung vào dữ liệu hơn, chúng ta quan tâm nhiều hơn đến dữ liệu. Giống như với internet, dữ liệu được trao đổi như thế nào. Với dữ liệu lớn, bốn hoặc nhiều v của dữ liệu.

Đồng thời, và có lẽ quan trọng hơn, các trường hợp sử dụng kinh doanh đã thay đổi. Khi máy tính được giới thiệu lần đầu tiên, chúng được sử dụng để tự động hóa những thứ như sách và hồ sơ. Và bất cứ điều gì là một quá trình thủ công, liên quan đến sổ cái hoặc những thứ tương tự, đã được lập trình, về cơ bản, trong nhà. Điều đó đã thay đổi trong thập niên 80 sang sự sẵn có của các gói hoạt động. Bạn không cần phải viết bảng lương của mình nữa, bạn có thể mua thứ gì đó đã làm nó. Điều đó dẫn đến một sự thu hẹp lớn tại thời điểm đó, hoặc tái cấu trúc, trong nhiều bộ phận CNTT. Nhưng sau đó là kinh doanh thông minh, với những thứ như kho dữ liệu xuất hiện, chủ yếu là vào những năm 90. Tiếp theo là các mô hình kinh doanh dotcom, tất nhiên, là một sự điên cuồng lớn. Rồi MDM. Với MDM, bạn bắt đầu thấy rằng chúng tôi không nghĩ về tự động hóa; chúng tôi chỉ thực sự tập trung vào việc quản lý dữ liệu dưới dạng dữ liệu. Và sau đó phân tích, đại diện cho giá trị bạn có thể lấy ra khỏi dữ liệu. Và trong phân tích, bạn thấy các công ty rất thành công có mô hình kinh doanh cốt lõi xoay quanh dữ liệu. Google, Twitter, Facebook sẽ là một phần của điều đó, nhưng bạn cũng có thể tranh luận rằng Walmart là.

Và vì vậy, doanh nghiệp hiện đang thực sự nghĩ về dữ liệu. Làm thế nào chúng ta có thể nhận được giá trị từ dữ liệu? Làm thế nào dữ liệu có thể thúc đẩy doanh nghiệp, chiến lược và chúng ta đang trong thời đại hoàng kim của dữ liệu. Vì vậy, những gì xảy ra trong kiến ​​trúc dữ liệu của chúng tôi, nếu dữ liệu không còn được coi là đơn giản là khí thải ra khỏi mặt sau của ứng dụng, nhưng có thực sự là trung tâm của mô hình kinh doanh của chúng tôi không? Chà, một phần của vấn đề chúng ta gặp phải đó là CNTT thực sự bị mắc kẹt trong quá khứ với vòng đời phát triển hệ thống, đó là hậu quả của việc phải xử lý nhanh chóng với giai đoạn tự động hóa quá trình đó trong thời kỳ đầu của CNTT và làm việc trong các dự án là một điều tương tự. Đối với CNTT - và đây là một chút biếm họa - nhưng điều tôi đang cố gắng nói là một số rào cản để có được kiến ​​trúc dữ liệu hướng đến doanh nghiệp là bởi vì chúng ta, loại, chấp nhận một cách không chính thức một nền văn hóa trong CNTT bắt nguồn từ một thời đã qua.

Vì vậy, mọi thứ là một dự án. Hãy cho tôi biết yêu cầu của bạn một cách chi tiết. Nếu mọi thứ không hoạt động, đó là vì bạn đã không cho tôi biết yêu cầu của bạn. Chà, ngày nay không hoạt động với dữ liệu vì chúng tôi không bắt đầu với các quy trình thủ công không tự động hoặc, bạn biết đấy, một chuyển đổi kỹ thuật của quy trình kinh doanh, chúng tôi bắt đầu rất thường xuyên với dữ liệu sản xuất hiện có mà chúng tôi đang thử để có được giá trị ra. Nhưng không ai tài trợ cho một dự án tập trung vào dữ liệu thực sự hiểu sâu về dữ liệu đó. Chúng tôi phải khám phá dữ liệu, chúng tôi phải phân tích dữ liệu nguồn. Và điều đó không thực sự phù hợp với sự phát triển của hệ thống, bạn biết đấy - thác nước, vòng đời SDLC - mà Agile, tôi sẽ duy trì, là một phiên bản tốt hơn của điều đó.

Và những gì đang được tập trung vào là công nghệ và chức năng, không phải dữ liệu. Chẳng hạn, khi chúng tôi thử nghiệm trong giai đoạn thử nghiệm, thông thường chức năng của tôi sẽ hoạt động, giả sử ETL của tôi, nhưng chúng tôi không kiểm tra dữ liệu. Chúng tôi sẽ không kiểm tra các giả định của chúng tôi về dữ liệu nguồn đến. Nếu chúng tôi làm như vậy, có lẽ chúng tôi sẽ ở trạng thái tốt hơn và vì ai đó đã thực hiện các dự án kho dữ liệu và chịu đựng những thay đổi ngược dòng, phá vỡ các ETL của tôi, tôi sẽ đánh giá cao điều đó. Và trên thực tế, những gì chúng tôi muốn thấy là thử nghiệm như một bước sơ bộ để giám sát chất lượng dữ liệu sản xuất liên tục. Vì vậy, chúng tôi đã có ở đây rất nhiều thái độ, nơi rất khó để đạt được kiến ​​trúc dữ liệu theo định hướng kinh doanh bởi vì chúng ta bị quy định bởi thời đại tập trung vào quá trình. Chúng ta cần thực hiện chuyển đổi sang tập trung vào dữ liệu. Và đây không phải là một quá trình chuyển đổi hoàn toàn, bạn biết đấy, vẫn còn rất nhiều công việc phải thực hiện ở đó, nhưng chúng tôi không thực sự suy nghĩ về các thuật ngữ tập trung vào dữ liệu khi chúng tôi cần và các tình huống xảy ra khi chúng tôi thực sự bắt buộc phải làm điều đó

Bây giờ doanh nghiệp nhận ra giá trị của dữ liệu, họ muốn mở khóa dữ liệu, vậy chúng ta sẽ làm điều đó như thế nào? Vậy làm thế nào để chúng ta thực hiện quá trình chuyển đổi? Vâng, chúng tôi đặt dữ liệu vào trung tâm của quá trình phát triển. Và chúng tôi để cho doanh nghiệp dẫn đầu với các yêu cầu thông tin. Và chúng tôi hiểu rằng không ai hiểu được dữ liệu nguồn hiện có khi bắt đầu dự án. Bạn có thể lập luận rằng cấu trúc dữ liệu và chính dữ liệu đã đạt được thông qua CNTT và hoạt động tương ứng, vì vậy chúng ta nên biết điều đó, nhưng thực sự, chúng ta không. Đây là sự phát triển tập trung vào dữ liệu. Vì vậy, chúng tôi phải suy nghĩ về việc chúng ta sẽ làm gì và làm thế nào để mô hình hóa dữ liệu trong một thế giới tập trung vào dữ liệu, chúng ta phải có các vòng phản hồi cho người dùng về việc tinh chỉnh các yêu cầu thông tin của họ, khi chúng ta khám phá dữ liệu và lập hồ sơ dữ liệu, thấy trước phân tích dữ liệu nguồn và khi chúng ta dần dần nhận được ngày càng chắc chắn hơn về dữ liệu của mình. Và bây giờ tôi đang nói về một dự án truyền thống hơn như trung tâm MDM hoặc kho dữ liệu, không nhất thiết là các dự án dữ liệu lớn, mặc dù điều này vẫn còn, tôi duy trì, khá gần với điều đó. Và vì vậy, các vòng phản hồi đó bao gồm các nhà lập mô hình dữ liệu, bạn biết, dần dần nâng cao mô hình dữ liệu của họ và tương tác với người dùng để đảm bảo các yêu cầu thông tin được tinh chỉnh dựa trên những gì có thể, những gì có sẵn, từ dữ liệu nguồn khi họ hiểu rõ hơn về nó, vì vậy họ hiểu rõ hơn về nó. Nó không còn là trường hợp nữa của mô hình dữ liệu, bạn biết đấy, ở trạng thái không có hoặc hoàn thành, nó dần dần tập trung vào nó.

Tương tự, phần hạ lưu của chúng tôi có đảm bảo chất lượng nơi chúng tôi xây dựng các quy tắc để kiểm tra chất lượng dữ liệu để đảm bảo rằng dữ liệu nằm trong các tham số mà chúng tôi đưa ra giả định. Đi vào, Eric đã đề cập đến những thay đổi trong dữ liệu tham khảo, điều này có thể xảy ra. Vì vậy, bạn không muốn trở thành nạn nhân của sự thay đổi không được quản lý trong khu vực đó, vì vậy các quy tắc đảm bảo chất lượng có thể đi vào hậu kỳ, giám sát chất lượng dữ liệu liên tục. Vì vậy, bạn có thể bắt đầu xem liệu chúng ta sẽ tập trung vào dữ liệu hay không, cách chúng tôi phát triển tập trung vào dữ liệu hoàn toàn khác với SDLC và Agile dựa trên chức năng. Và sau đó chúng ta phải chú ý đến quan điểm kinh doanh là tốt. Chúng tôi có - và một lần nữa điều này lặp lại những gì Eric đang nói - chúng tôi có một mô hình dữ liệu xác định kế hoạch chi tiết câu chuyện dữ liệu cho cơ sở dữ liệu của chúng tôi, nhưng đồng thời chúng tôi cần những mô hình khái niệm đó, những quan điểm kinh doanh về dữ liệu mà theo truyền thống vẫn chưa được thực hiện quá khứ. Đôi khi, tôi nghĩ, đã nghĩ rằng mô hình dữ liệu có thể làm tất cả, nhưng chúng ta cần có cái nhìn khái niệm, ngữ nghĩa và nhìn vào dữ liệu, đưa nó qua một lớp trừu tượng để dịch mô hình lưu trữ vào doanh nghiệp lượt xem. Và, một lần nữa, tất cả những điều mà Eric đã nói về ngữ nghĩa, trở nên quan trọng để làm điều đó, vì vậy chúng tôi thực sự có thêm các nhiệm vụ mô hình hóa. Tôi nghĩ rằng, bạn biết đấy, thật thú vị nếu bạn đứng trong hàng ngũ như một người lập mô hình dữ liệu như tôi đã làm, và một lần nữa, một cái gì đó mới.

Và cuối cùng tôi muốn nói rằng kiến ​​trúc lớn hơn cũng đã phản ánh thực tế mới này. Chẳng hạn, MDM của khách hàng truyền thống là loại, được thôi, hãy đưa dữ liệu khách hàng của chúng tôi vào một trung tâm nơi chúng tôi có thể, bạn biết, về mặt thực sự chỉ là chất lượng dữ liệu cho các ứng dụng văn phòng. Mà theo quan điểm chiến lược kinh doanh là một cái ngáp. Tuy nhiên, ngày nay, chúng tôi đang xem xét các trung tâm MDM của khách hàng có dữ liệu hồ sơ khách hàng bổ sung trong đó, không chỉ là dữ liệu tĩnh, mà sau đó thực sự có giao diện hai chiều với các ứng dụng giao dịch của khách hàng. Vâng, họ vẫn hỗ trợ văn phòng hỗ trợ, nhưng bây giờ chúng tôi cũng biết về những hành vi này của khách hàng. Điều này là tốn kém hơn để xây dựng. Điều này là phức tạp hơn để xây dựng. Nhưng nó được định hướng kinh doanh theo cách mà MDM khách hàng truyền thống không có. Bạn đang kinh doanh một định hướng cho doanh nghiệp chống lại các thiết kế đơn giản dễ thực hiện hơn, nhưng đối với doanh nghiệp, đây là những gì họ muốn thấy. Chúng ta thực sự đang ở một kỷ nguyên mới và tôi nghĩ rằng có một số cấp độ mà chúng ta phải đáp ứng với kiến ​​trúc dữ liệu thúc đẩy kinh doanh và tôi nghĩ rằng đây là thời điểm rất thú vị để làm việc.

Vì vậy, cảm ơn bạn, trở lại với bạn Rebecca.

Rebecca Jozwiak: Cảm ơn Malcolm, và tôi thực sự thích những gì bạn nói về các mô hình dữ liệu phải nuôi quan điểm kinh doanh, bởi vì, không giống như những gì bạn đang nói, nơi CNTT giữ dây cương quá lâu và nó không còn là vấn đề nữa và rằng văn hóa không cần phải thay đổi. Và tôi khá chắc chắn rằng có một con chó trong nền đã đồng ý với bạn 100%. Và với điều đó tôi sẽ chuyền bóng cho Ron. Tôi thực sự vui mừng khi thấy bản demo của bạn. Ron, sàn là của bạn.

Ron Huizenga: Cảm ơn bạn rất nhiều và trước khi chúng tôi nhảy vào đó, tôi sẽ xem qua một vài slide và sau đó là một chút bản demo vì, như Eric và Malcolm đã chỉ ra, đây là một chủ đề rất rộng và sâu sắc, và với những gì chúng ta đang nói về ngày hôm nay, chúng ta chỉ tìm hiểu về bề mặt của nó bởi vì có rất nhiều khía cạnh và rất nhiều điều mà chúng ta thực sự cần phải xem xét và xem xét từ một kiến ​​trúc hướng kinh doanh. Và cách tiếp cận của chúng tôi là thực sự làm cho giá trị đó dựa trên mô hình và lấy được giá trị thực từ các mô hình bởi vì bạn có thể sử dụng chúng như một phương tiện truyền thông cũng như một lớp để kích hoạt các hệ thống khác. Cho dù bạn đang thực hiện kiến ​​trúc hướng dịch vụ hay những thứ khác, mô hình thực sự trở thành huyết mạch của những gì đang diễn ra, với tất cả các siêu dữ liệu xung quanh nó và dữ liệu bạn có trong doanh nghiệp của mình.

Tuy nhiên, điều tôi muốn nói gần như là lùi một bước, bởi vì Malcolm đã chạm vào một số lịch sử của các giải pháp đã phát triển và loại điều đó. Một cách để thực sự chỉ ra tầm quan trọng của kiến ​​trúc dữ liệu âm thanh là trường hợp sử dụng mà tôi thường gặp phải khi tôi tư vấn trước khi tôi vào vai trò quản lý sản phẩm và đó là, tôi sẽ tham gia vào các tổ chức cho dù họ đang thực hiện chuyển đổi kinh doanh hay chỉ thay thế một số hệ thống hiện có và loại điều đó, và nó trở nên rõ ràng rất nhanh về cách các tổ chức nghèo hiểu dữ liệu của chính họ. Nếu bạn sử dụng một trường hợp sử dụng cụ thể như trường hợp này, cho dù bạn là chuyên gia tư vấn hay có thể là người mới bắt đầu với một tổ chức, hoặc tổ chức của bạn đã được xây dựng qua nhiều năm với việc mua lại các công ty khác nhau, bạn sẽ kết thúc như thế nào với một môi trường rất phức tạp rất nhanh, với một số công nghệ mới khác nhau, cũng như công nghệ kế thừa, giải pháp ERP và mọi thứ khác.

Vì vậy, một trong những điều mà chúng ta thực sự có thể làm với phương pháp mô hình hóa của mình là trả lời câu hỏi, làm thế nào để tôi hiểu được tất cả những điều này? Chúng tôi thực sự có thể bắt đầu ghép các thông tin lại với nhau, vì vậy doanh nghiệp có thể tận dụng thông tin mà chúng tôi có đúng cách. Và nó xuất hiện, những gì chúng ta có trong môi trường đó là gì? Làm cách nào tôi có thể sử dụng các mô hình để loại bỏ thông tin mà tôi cần và hiểu thông tin đó tốt hơn? Và sau đó chúng ta có các loại siêu dữ liệu truyền thống cho tất cả những thứ khác nhau như mô hình dữ liệu quan hệ và chúng ta thường thấy những thứ như định nghĩa và từ điển dữ liệu, bạn biết, loại dữ liệu và loại điều đó. Nhưng những gì về siêu dữ liệu bổ sung mà bạn muốn nắm bắt để thực sự mang lại nhiều ý nghĩa hơn cho nó? Chẳng hạn như, các thực thể nào thực sự là ứng cử viên nên là đối tượng dữ liệu tham chiếu, phải là đối tượng quản lý dữ liệu chính và các loại sự vật đó và liên kết chúng lại với nhau. Và làm thế nào để thông tin chảy qua tổ chức? Dữ liệu chảy từ cách chúng được tiêu thụ từ cả hai khía cạnh quy trình, mà cả dòng dữ liệu về hành trình thông tin thông qua các doanh nghiệp của chúng tôi và cách nó đi qua các hệ thống khác nhau hoặc thông qua các cửa hàng dữ liệu, vì vậy chúng tôi biết khi chúng tôi xây dựng các giải pháp I, hoặc những loại điều đó, chúng tôi thực sự đang tiêu thụ thông tin chính xác cho nhiệm vụ trong tay.

Và sau đó, rất quan trọng là, làm thế nào chúng ta có thể khiến tất cả các bên liên quan đó hợp tác, và đặc biệt là các bên liên quan kinh doanh bởi vì họ là những người cung cấp cho chúng ta ý nghĩa thực sự của dữ liệu đó là gì. Doanh nghiệp, vào cuối ngày, sở hữu dữ liệu. Họ cung cấp các định nghĩa cho các từ vựng và những thứ mà Eric đang nói đến, vì vậy chúng tôi cần một nơi để gắn kết tất cả những điều đó lại với nhau. Và cách chúng tôi làm điều đó là thông qua mô hình hóa dữ liệu và kiến ​​trúc kho dữ liệu của chúng tôi.

Tôi sẽ chạm vào một vài điều. Tôi sẽ nói về ER / Studio Enterprise Edition Edition. Chủ yếu tôi sẽ nói về sản phẩm kiến ​​trúc dữ liệu nơi chúng tôi thực hiện mô hình hóa dữ liệu và loại điều đó, nhưng có rất nhiều thành phần khác của bộ phần mềm mà tôi sẽ chạm vào rất nhanh. Bạn sẽ thấy một đoạn của Kiến trúc sư kinh doanh, nơi chúng ta có thể thực hiện các mô hình khái niệm, nhưng chúng ta cũng có thể thực hiện các mô hình quy trình kinh doanh và chúng ta có thể buộc các mô hình quy trình đó để liên kết dữ liệu thực tế mà chúng ta có trong các mô hình dữ liệu của mình. Nó thực sự giúp chúng ta mang lại sự ràng buộc đó với nhau. Kiến trúc sư phần mềm cho phép chúng tôi thực hiện các cấu trúc bổ sung như mô hình hóa UML và các loại điều đó để cung cấp logic hỗ trợ cho một số hệ thống và quy trình khác mà chúng tôi đang nói đến. Nhưng rất quan trọng khi chúng tôi di chuyển xuống, chúng tôi có kho lưu trữ và máy chủ nhóm, và tôi sẽ nói về điều đó như một nửa của cùng một thứ. Kho lưu trữ là nơi chúng tôi lưu trữ tất cả các siêu dữ liệu được mô hình hóa cũng như tất cả các siêu dữ liệu kinh doanh theo các thuật ngữ và thuật ngữ kinh doanh. Và bởi vì chúng tôi có môi trường dựa trên kho lưu trữ này, sau đó chúng tôi có thể kết hợp tất cả những thứ khác nhau lại với nhau trong cùng một môi trường và sau đó chúng tôi thực sự có thể cung cấp những thứ đó cho các giả định, không chỉ cho dân kỹ thuật mà còn cho cả doanh nhân. Và đó là cách chúng tôi thực sự bắt đầu thúc đẩy sự hợp tác.

Và sau đó, phần cuối cùng mà tôi sẽ nói ngắn gọn là, khi bạn bước vào những môi trường này, nó không chỉ là cơ sở dữ liệu mà bạn có ngoài đó. Bạn sẽ có một số cơ sở dữ liệu, cửa hàng dữ liệu, bạn cũng sẽ có rất nhiều, những gì tôi sẽ gọi, các tạo tác kế thừa. Có thể mọi người đã sử dụng Visio hoặc các sơ đồ khác để vạch ra một số điều. Có lẽ họ đã có các công cụ mô hình hóa khác và loại điều đó. Vì vậy, những gì chúng ta có thể làm với MetaWizard thực sự là trích xuất một số thông tin đó và đưa nó vào các mô hình của chúng ta, làm cho nó hiện tại và có thể sử dụng nó, tiêu thụ nó, theo cách hiện tại một lần nữa, thay vì chỉ ngồi ngoài đó. Bây giờ nó trở thành một phần tích cực của các mô hình làm việc của chúng tôi, điều này rất quan trọng.

Khi bạn bước vào một tổ chức, như tôi đã nói, rất nhiều hệ thống khác nhau ở ngoài kia, rất nhiều giải pháp ERP, giải pháp bộ phận không phù hợp. Nhiều tổ chức cũng đang sử dụng các giải pháp SaaS, cũng được kiểm soát và quản lý bên ngoài, vì vậy chúng tôi không kiểm soát cơ sở dữ liệu và các loại vật chủ trong các máy chủ đó, nhưng tất nhiên chúng tôi vẫn cần biết dữ liệu đó trông như thế nào và dĩ nhiên, siêu dữ liệu xung quanh đó. Những gì chúng ta cũng tìm thấy là rất nhiều hệ thống di sản lỗi thời chưa được làm sạch vì cách tiếp cận dựa trên dự án mà Malcolm đã nói đến. Thật đáng ngạc nhiên khi những năm gần đây, các tổ chức sẽ quay vòng các dự án, họ sẽ thay thế một hệ thống hoặc một giải pháp, nhưng thường không đủ ngân sách dự án để giải phóng các giải pháp lỗi thời, vì vậy giờ đây họ đang gặp khó khăn. Và chúng ta phải tìm ra những gì chúng ta thực sự có thể thoát khỏi trong môi trường của chúng ta cũng như những gì hữu ích trong tương lai. Và điều đó liên quan đến chiến lược ngừng hoạt động kém. Đó là một phần và bưu kiện của điều tương tự.

Những gì chúng tôi cũng tìm thấy, bởi vì rất nhiều tổ chức đã được xây dựng từ tất cả các giải pháp khác nhau này, là chúng tôi thấy rất nhiều giao diện điểm-điểm với rất nhiều dữ liệu di chuyển ở một số nơi. Chúng ta cần có khả năng hợp lý hóa điều đó và tìm ra dòng dữ liệu mà tôi đã đề cập ngắn gọn trước đây để có thể có một chiến lược gắn kết hơn như sử dụng kiến ​​trúc hướng dịch vụ, xe buýt dịch vụ doanh nghiệp và các loại điều đó, để cung cấp thông tin chính xác đến một loại mô hình xuất bản và đăng ký mà chúng tôi sử dụng một cách chính xác trong suốt quá trình kinh doanh của chúng tôi. Và sau đó, tất nhiên, chúng ta vẫn cần thực hiện một số loại phân tích, cho dù chúng ta đang sử dụng kho dữ liệu, dữ liệu với ETL truyền thống hay sử dụng một số hồ dữ liệu mới. Tất cả đều đến cùng một điều. Đó là tất cả dữ liệu, cho dù đó là dữ liệu lớn, cho dù đó là dữ liệu truyền thống trong cơ sở dữ liệu quan hệ, chúng ta cần mang tất cả dữ liệu đó lại với nhau để có thể quản lý dữ liệu đó và biết chúng ta đang xử lý những gì trong các mô hình của mình.

Một lần nữa, sự phức tạp chúng ta sẽ làm là chúng ta có một số bước mà chúng ta muốn có thể làm. Trước hết, bạn bước vào và bạn có thể không có những bản thiết kế đó về cảnh quan thông tin đó trông như thế nào. Trong một công cụ mô hình hóa dữ liệu như ER / Studio Data Architect, trước tiên bạn sẽ thực hiện nhiều kỹ thuật đảo ngược về mặt hãy chỉ vào các nguồn dữ liệu ngoài đó, đưa chúng vào và sau đó thực sự gắn kết chúng lại với nhau thành đại diện hơn mô hình đại diện cho toàn bộ doanh nghiệp. Điều quan trọng là, chúng tôi muốn có thể phân tách các mô hình đó dọc theo các ngành nghề kinh doanh để chúng tôi có thể liên hệ với chúng trong các phần nhỏ hơn, mà những người kinh doanh của chúng tôi cũng có thể liên quan đến, và các nhà phân tích kinh doanh của chúng tôi và các bên liên quan khác đang làm việc trên đó

Các tiêu chuẩn đặt tên là cực kỳ quan trọng và tôi đang nói về nó theo một vài cách khác nhau ở đây. Đặt tên tiêu chuẩn theo cách chúng tôi đặt tên mọi thứ trong các mô hình của chúng tôi. Việc thực hiện các mô hình logic khá dễ dàng, trong đó chúng ta có một quy ước đặt tên tốt và một từ điển dữ liệu tốt cho các mô hình của chúng ta, nhưng sau đó, chúng ta cũng thấy các quy ước đặt tên khác nhau cho rất nhiều mô hình vật lý mà chúng ta đang đưa vào. kỹ sư đảo ngược, khá thường xuyên chúng ta thấy tên viết tắt và loại điều mà tôi sẽ nói về. Và chúng ta cần dịch lại những tên tiếng Anh có ý nghĩa có ý nghĩa đối với doanh nghiệp để chúng ta có thể hiểu tất cả những phần dữ liệu này là gì trong môi trường. Và sau đó ánh xạ phổ quát là cách chúng ta gắn chúng lại với nhau.

Trên hết, sau đó chúng tôi sẽ ghi lại và xác định thêm và đó là nơi chúng tôi có thể phân loại dữ liệu của mình hơn nữa bằng một thứ gọi là Tệp đính kèm, tôi sẽ chỉ cho bạn một vài slide. Và sau đó kết thúc vòng lặp, chúng tôi muốn áp dụng ý nghĩa kinh doanh đó, đó là nơi chúng tôi gắn kết các thuật ngữ kinh doanh của mình và có thể liên kết chúng với các tạo phẩm mô hình khác nhau của chúng tôi, vì vậy chúng tôi biết, khi chúng tôi nói về một thuật ngữ kinh doanh nhất định, trong đó đó là thực hiện trong dữ liệu của chúng tôi trong toàn tổ chức. Và cuối cùng, tôi đã nói về thực tế rằng chúng ta cần tất cả những thứ này để trở thành kho lưu trữ dựa trên nhiều khả năng hợp tác và xuất bản, vì vậy các bên liên quan của chúng tôi có thể sử dụng nó. Tôi sẽ nói về kỹ thuật đảo ngược khá nhanh. Tôi đã loại cho bạn một điểm nổi bật rất nhanh về điều đó. Tôi sẽ chỉ cho bạn thấy trong một bản demo thực tế chỉ để cho bạn thấy một số điều mà chúng tôi có thể mang vào đó.

Và tôi muốn nói về một số loại mô hình và sơ đồ khác nhau mà chúng ta sẽ tạo ra trong loại kịch bản này. Rõ ràng chúng ta sẽ thực hiện các mô hình khái niệm trong nhiều trường hợp; Tôi sẽ không dành nhiều thời gian cho việc đó. Tôi thực sự muốn nói về các mô hình logic, mô hình vật lý và các loại mô hình chuyên dụng mà chúng ta có thể tạo ra. Và điều quan trọng là chúng ta có thể tạo tất cả những thứ này trong cùng một nền tảng mô hình để chúng ta có thể gắn chúng lại với nhau. Điều đó bao gồm các mô hình thứ nguyên và cả các mô hình sử dụng một số nguồn dữ liệu mới, chẳng hạn như NoQuery mà tôi sẽ chỉ cho bạn. Và sau đó, mô hình dòng dữ liệu trông như thế nào? Và làm thế nào để chúng ta ghép dữ liệu đó vào một mô hình quy trình kinh doanh, là những gì chúng ta sẽ nói về tiếp theo.

Tôi sẽ chuyển sang môi trường người mẫu ở đây chỉ để cung cấp cho bạn một cái nhìn tổng quan rất cao và nhanh chóng. Và tôi tin rằng bạn sẽ có thể nhìn thấy màn hình của tôi bây giờ. Trước hết tôi muốn nói về chỉ một kiểu mô hình dữ liệu truyền thống. Và cách chúng tôi muốn tổ chức các mô hình khi chúng tôi đưa chúng vào, là chúng tôi muốn có thể phân hủy chúng. Vì vậy, những gì bạn nhìn thấy ở phía bên trái là chúng ta có các mô hình logic và vật lý trong tệp mô hình cụ thể này. Điều tiếp theo là, chúng ta có thể chia nhỏ nó cùng với các phân tách kinh doanh, vì vậy đó là lý do tại sao bạn nhìn thấy các thư mục. Những cái màu xanh nhạt là mô hình logic và những cái màu xanh là mô hình vật lý. Và chúng tôi cũng có thể đi sâu vào, vì vậy trong ER / Studio, nếu bạn có phân tách doanh nghiệp, bạn có thể đi sâu bao nhiêu cấp hoặc mô hình con tùy thích và các thay đổi bạn thực hiện ở cấp thấp hơn sẽ tự động phản ánh ở mức cao hơn cấp độ. Vì vậy, nó trở thành một môi trường mô hình rất mạnh mẽ rất nhanh chóng.

Một điều mà tôi cũng muốn chỉ ra rằng điều rất quan trọng để bắt đầu thu thập thông tin này là chúng ta có thể có nhiều mô hình vật lý tương ứng với một mô hình logic. Rất thường xuyên bạn có thể có một mô hình logic nhưng bạn có thể có các mô hình vật lý trên các nền tảng khác nhau và loại điều đó. Có thể là một phiên bản SQL Server của nó, có thể là một phiên bản Oracle khác. Chúng tôi có khả năng kết nối tất cả những thứ đó lại với nhau trong cùng một môi trường mô hình. Và một lần nữa, những gì tôi có ở đây là một mô hình kho dữ liệu thực tế, một lần nữa, có thể trong cùng một môi trường mô hình hoặc chúng ta có thể có nó trong kho lưu trữ và liên kết nó với nhiều thứ khác nhau.

Những gì tôi thực sự muốn cho bạn thấy trên đây là một số trong những điều khác và các biến thể khác của các mô hình mà chúng tôi nhận được. Vì vậy, khi chúng ta tham gia vào một mô hình dữ liệu truyền thống như thế này, chúng ta thường thấy các thực thể điển hình với các cột và siêu dữ liệu và loại điều đó, nhưng quan điểm đó thay đổi rất nhanh khi chúng ta bắt đầu đối phó với một số công nghệ NoQuery mới hơn này hoặc như một số người vẫn thích gọi họ là những công nghệ dữ liệu lớn.

Vì vậy, bây giờ hãy nói rằng chúng ta cũng đã có Hive trong môi trường của chúng ta. Nếu chúng ta đảo ngược kỹ sư từ môi trường Hive - và chúng ta có thể chuyển tiếp và đảo ngược kỹ sư từ Hive bằng công cụ mô hình chính xác này - chúng ta sẽ thấy một cái gì đó hơi khác một chút. Chúng tôi vẫn xem tất cả dữ liệu là các cấu trúc ở đó, nhưng TDL của chúng tôi khác nhau. Những người bạn đã từng thấy SQL, những gì bạn sẽ thấy bây giờ là Hive QL, rất giống với SQL nhưng giờ đây bạn có thể bắt đầu làm việc với các ngôn ngữ script khác nhau. Vì vậy, bạn có thể mô hình hóa trong môi trường này, tạo ra môi trường Hive, nhưng cũng quan trọng, trong kịch bản mà tôi đã mô tả, bạn có thể đảo ngược tất cả và hiểu ý nghĩa của nó và cũng bắt đầu gắn kết nó lại với nhau .

Chúng ta hãy lấy một cái khác một chút khác nhau. MongoDB là một nền tảng khác mà chúng tôi hỗ trợ nguyên bản. Và khi bạn bắt đầu tham gia vào các loại môi trường JSON nơi bạn có kho lưu trữ tài liệu, JSON là một động vật khác và có các cấu trúc trong đó, không tương ứng với các mô hình quan hệ. Bạn sớm bắt đầu đối phó với các khái niệm như các đối tượng nhúng và các mảng đối tượng được nhúng khi bạn bắt đầu thẩm vấn JSON và các khái niệm đó không tồn tại trong ký hiệu quan hệ truyền thống. Những gì chúng tôi đã làm ở đây là chúng tôi thực sự đã mở rộng ký hiệu và danh mục của chúng tôi để có thể xử lý điều đó trong cùng một môi trường.

Nếu bạn nhìn qua bên trái ở đây, thay vì nhìn thấy những thứ như các thực thể và bảng, chúng ta đang gọi chúng là các đối tượng. Và bạn thấy các ký hiệu khác nhau. Bạn vẫn thấy các loại ký hiệu tham chiếu điển hình ở đây, nhưng các thực thể màu xanh mà tôi đang hiển thị trong sơ đồ cụ thể này thực sự là các đối tượng nhúng. Và chúng tôi cho thấy các hồng y khác nhau. Cardinality kim cương có nghĩa là nó là một đối tượng ở một đầu, nhưng cardinality của một nghĩa là chúng ta có, trong nhà xuất bản nếu chúng ta theo mối quan hệ đó, chúng ta có một đối tượng địa chỉ được nhúng. Khi thẩm vấn JSON, chúng tôi đã tìm thấy chính xác cấu trúc của các đối tượng được nhúng trong người bảo trợ, nhưng đó thực sự được nhúng dưới dạng một mảng các đối tượng. Chúng ta đang thấy điều đó, không chỉ thông qua các trình kết nối, mà nếu bạn nhìn vào các thực thể thực tế, bạn sẽ thấy rằng bạn thấy các địa chỉ dưới người bảo trợ cũng phân loại nó như một mảng các đối tượng. Bạn có một quan điểm rất mô tả về cách bạn có thể mang nó vào.

Và một lần nữa, bây giờ những gì chúng ta đã thấy cho đến nay chỉ trong vài giây là các mô hình quan hệ truyền thống đa cấp, chúng ta có thể làm điều tương tự với Hive, chúng ta có thể làm điều tương tự với MongoDB và các nguồn dữ liệu lớn khác như tốt. Những gì chúng ta cũng có thể làm, và tôi sẽ chỉ cho bạn thấy điều này rất nhanh là, tôi đã nói về thực tế mang mọi thứ từ các khu vực khác nhau. Tôi sẽ giả định rằng tôi sẽ nhập một mô hình từ cơ sở dữ liệu hoặc thiết kế ngược nó, nhưng tôi sẽ đưa nó vào từ siêu dữ liệu bên ngoài. Chỉ để cung cấp cho bạn một quan điểm rất nhanh về tất cả các loại khác nhau mà chúng ta có thể bắt đầu đưa vào.

Như bạn thấy, chúng ta có vô số thứ mà chúng ta thực sự có thể mang siêu dữ liệu vào môi trường mô hình hóa của mình. Bắt đầu với những thứ như ngay cả Amazon Redshift, Cassandra, rất nhiều nền tảng dữ liệu lớn khác, vì vậy bạn thấy rất nhiều trong số này được liệt kê. Đây là theo thứ tự bảng chữ cái. Chúng ta đang thấy rất nhiều nguồn dữ liệu lớn và loại điều đó. Chúng ta cũng đang thấy rất nhiều môi trường mô hình truyền thống hoặc cũ hơn mà chúng ta thực sự có thể mang siêu dữ liệu đó đi qua. Nếu tôi đi qua đây - và tôi sẽ không dành thời gian cho mỗi người trong số họ - chúng tôi sẽ thấy rất nhiều điều khác nhau mà chúng tôi có thể mang lại từ đó, về mặt nền tảng mô hình hóa và nền tảng dữ liệu. Và một điều rất quan trọng cần nhận ra ở đây là một phần khác mà chúng ta có thể làm khi bắt đầu nói về dòng dữ liệu, trên Phiên bản nhóm doanh nghiệp, chúng ta cũng có thể thẩm vấn các nguồn ETL, cho dù đó là những ánh xạ như Talend hay SQL Server Information Services, chúng ta có thể thực sự mang điều đó vào để bắt đầu sơ đồ dòng dữ liệu của chúng tôi và vẽ một bức tranh về những gì đang xảy ra trong các biến đổi đó. Hoàn toàn ngoài hộp, chúng tôi có hơn 130 cây cầu khác nhau này thực sự là một phần của sản phẩm Enterprise Team Edition, vì vậy nó thực sự giúp chúng tôi nhanh chóng kết hợp tất cả các tạo tác vào một môi trường mô hình hóa.

Cuối cùng nhưng không kém phần quan trọng, tôi cũng muốn nói về thực tế rằng chúng ta không thể đánh mất sự thật rằng chúng ta cần các loại cấu trúc khác nếu chúng ta đang lưu trữ dữ liệu hoặc bất kỳ loại phân tích nào. Chúng tôi vẫn muốn có khả năng thực hiện những thứ như mô hình thứ nguyên nơi chúng tôi có các bảng thực tế và chúng tôi có kích thước và các loại sự vật đó. Một điều tôi muốn cho bạn thấy là chúng tôi cũng có thể có các tiện ích mở rộng cho siêu dữ liệu của mình để giúp chúng tôi phân loại các loại kích thước và mọi thứ khác. Vì vậy, nếu tôi nhìn vào tab dữ liệu thứ nguyên ở đây, chẳng hạn, trên một trong số đó, nó thực sự sẽ tự động phát hiện, dựa trên mẫu mô hình mà nó nhìn thấy và cung cấp cho bạn một điểm bắt đầu để xem nó nghĩ đó là thứ nguyên hay bảng thực tế. Nhưng ngoài ra, những gì chúng ta có thể làm là trong các kích thước và loại điều chúng ta thậm chí có các loại kích thước khác nhau mà chúng ta có thể sử dụng để phân loại dữ liệu trong loại môi trường lưu trữ dữ liệu. Vì vậy, các khả năng rất mạnh mẽ mà chúng tôi đang kết hợp hoàn toàn với điều này.

Tôi sẽ nhảy vào cái này vì tôi đang ở trong môi trường demo ngay bây giờ và cho bạn thấy một vài thứ khác trước khi tôi quay trở lại các slide. Một trong những điều gần đây chúng tôi đã thêm vào ER / Studio Data Architect là chúng tôi gặp phải tình huống - và đây là trường hợp sử dụng rất phổ biến khi bạn làm việc trên các dự án - nhà phát triển nghĩ về các đối tượng, trong khi dữ liệu của chúng tôi người lập mô hình có xu hướng suy nghĩ về các bảng và thực thể và loại điều đó. Đây là một mô hình dữ liệu rất đơn giản, nhưng nó đại diện cho một vài khái niệm cơ bản, trong đó các nhà phát triển hoặc thậm chí các nhà phân tích kinh doanh hoặc người dùng doanh nghiệp, có thể coi chúng là các đối tượng hoặc khái niệm kinh doanh khác nhau. Cho đến bây giờ rất khó để phân loại những thứ này nhưng những gì chúng ta thực sự đã làm trong ER / Studio Enterprise Edition Edition, trong phiên bản 2016, giờ đây chúng ta có một khái niệm gọi là Đối tượng dữ liệu kinh doanh. Và những gì cho phép chúng ta làm là nó cho phép chúng ta gói gọn các nhóm thực thể hoặc bảng thành các đối tượng kinh doanh thực sự.

Ví dụ, những gì chúng ta có ở đây trên chế độ xem mới này là tiêu đề Đơn đặt hàng và Dòng đơn hàng đã được kết hợp với nhau, chúng được gói gọn như một đối tượng, chúng ta sẽ coi chúng như một đơn vị công việc khi chúng ta duy trì dữ liệu và chúng tôi kết hợp chúng lại với nhau để giờ đây rất dễ dàng liên hệ điều đó với các đối tượng khác nhau. Chúng có thể tái sử dụng trong toàn bộ môi trường mô hình. Chúng là một đối tượng thực sự, không chỉ là một bản vẽ, mà chúng tôi còn có thêm lợi ích là khi chúng tôi thực sự giao tiếp từ góc độ mô hình hóa, chúng tôi có thể thu gọn hoặc mở rộng chúng để chúng có thể tạo ra một cái nhìn tóm tắt cho các cuộc đối thoại với các đối tượng bên liên quan nhất định, và tất nhiên chúng ta cũng có thể giữ chế độ xem chi tiết hơn như chúng ta đang thấy ở đây để biết thêm đối tượng kỹ thuật. Nó thực sự mang đến cho chúng ta một phương tiện giao tiếp thực sự tốt. Những gì chúng ta thấy bây giờ là kết hợp nhiều loại mô hình khác nhau, làm tăng chúng với khái niệm về các đối tượng dữ liệu kinh doanh và bây giờ tôi sẽ nói về cách chúng ta thực sự áp dụng một số ý nghĩa hơn cho các loại điều này và cách chúng ta gắn kết chúng lại với nhau môi trường tổng thể.

Tôi chỉ đang cố gắng tìm WebEx của tôi trở lại đây để tôi có thể làm điều đó. Và ở đó chúng tôi đi, trở lại các slide Hot Tech. Tôi sẽ nhanh chóng chuyển tiếp một vài slide ở đây vì bạn đã thấy những điều này trong bản trình diễn mô hình. Tôi muốn nói về tiêu chuẩn đặt tên rất nhanh. Chúng tôi muốn áp dụng và thực thi các tiêu chuẩn đặt tên khác nhau. Những gì chúng tôi muốn làm là, chúng tôi có khả năng thực sự lưu trữ các mẫu tiêu chuẩn đặt tên trong kho của chúng tôi để xây dựng ý nghĩa đó thông qua các từ hoặc cụm từ hoặc thậm chí viết tắt và gắn chúng lại với một loại từ tiếng Anh có ý nghĩa. Chúng tôi sẽ sử dụng các thuật ngữ kinh doanh, các từ viết tắt cho mỗi từ và chúng tôi có thể chỉ định thứ tự, các trường hợp và thêm tiền tố và hậu tố. Trường hợp sử dụng điển hình cho trường hợp này thường là khi mọi người đang xây dựng một mô hình logic và sau đó thực sự tiến lên để tạo ra một mô hình vật lý nơi họ có thể đã sử dụng chữ viết tắt và mọi thứ khác.

Điều tuyệt vời là nó cũng mạnh mẽ, thậm chí còn mạnh mẽ hơn ngược lại, nếu chúng ta có thể chỉ ra một số tiêu chuẩn đặt tên trên một số cơ sở dữ liệu vật lý mà chúng ta đã thiết kế ngược lại, chúng ta có thể viết tắt chúng, biến chúng thành dài hơn từ, và đưa chúng ngược vào các cụm từ tiếng Anh. Bây giờ chúng ta thực sự có thể lấy được tên thích hợp cho dữ liệu của chúng ta trông như thế nào. Giống như tôi nói, trường hợp sử dụng điển hình là chúng ta sẽ tiến về phía trước, logic đến vật lý và ánh xạ các kho lưu trữ dữ liệu và loại điều đó. Nếu bạn nhìn vào ảnh chụp màn hình ở phía bên tay phải, bạn sẽ thấy rằng có những tên viết tắt từ tên nguồn và khi chúng tôi áp dụng mẫu tiêu chuẩn đặt tên, chúng tôi thực sự có nhiều tên đầy đủ hơn. Và chúng ta có thể đặt không gian và mọi thứ như thế nếu muốn, tùy thuộc vào mẫu tiêu chuẩn đặt tên mà chúng ta đã sử dụng. Chúng tôi có thể làm cho nó trông tuy nhiên chúng tôi muốn nó trông giống như đưa vào các mô hình của chúng tôi. Chỉ khi chúng ta biết cái gì được gọi là chúng ta mới thực sự có thể bắt đầu gắn các định nghĩa với nó, bởi vì trừ khi chúng ta biết nó là gì, làm thế nào chúng ta có thể áp dụng một ý nghĩa cho nó?

Điều tốt đẹp là, chúng ta thực sự có thể gọi điều này khi chúng ta đang làm tất cả mọi thứ. Tôi đã nói về kỹ thuật đảo ngược, chúng ta thực sự có thể gọi các mẫu tiêu chuẩn đặt tên đồng thời khi chúng ta thực hiện kỹ thuật đảo ngược. Vì vậy, trong một tập hợp các bước thông qua trình hướng dẫn, những gì chúng ta có thể làm là, nếu chúng ta biết các quy ước là gì, chúng ta có thể đảo ngược cơ sở dữ liệu vật lý, nó sẽ đưa nó trở lại như mô hình vật lý trong môi trường mô hình hóa và nó cũng sẽ áp dụng những quy ước đặt tên. Vì vậy, chúng ta sẽ thấy những cách biểu thị tên giống như tiếng Anh trong mô hình logic tương ứng trong môi trường. Chúng tôi cũng có thể làm điều đó và kết hợp nó với việc tạo Lược đồ XML để chúng tôi có thể lấy một mô hình và thậm chí đẩy nó ra bằng các chữ viết tắt của chúng tôi, cho dù chúng tôi đang thực hiện các khung công tác SOA hoặc loại điều đó, do đó chúng tôi cũng có thể đưa ra các quy ước đặt tên khác nhau mà chúng ta thực sự đã lưu trữ trong chính mô hình. Nó cho chúng ta rất nhiều khả năng rất mạnh mẽ.

Một lần nữa, đây là một ví dụ về việc nó sẽ trông như thế nào nếu tôi có một mẫu. Điều này thực sự cho thấy rằng tôi đã có EMP cho nhân viên của thành phố, mức lương SAL SAL cho mức lương của người nghèo, người PLN cho kế hoạch của người Hồi giáo trong một quy ước đặt tên. Tôi cũng có thể áp dụng chúng để chúng chạy tương tác khi tôi xây dựng mô hình và đưa mọi thứ vào. Nếu tôi đang sử dụng từ viết tắt này và tôi đã gõ vào Tên nhân viên Salary Plan Salary trên tên thực thể, nó sẽ hoạt động với mẫu tiêu chuẩn đặt tên Tôi đã xác định ở đây, nó sẽ cho tôi EMP_SAL_PLN khi tôi đang tạo các thực thể và đặt cho tôi các tên vật lý tương ứng ngay lập tức.

Một lần nữa, rất tốt khi chúng ta thiết kế và chuyển tiếp kỹ thuật. Chúng tôi có một khái niệm rất độc đáo và đây là nơi chúng tôi thực sự bắt đầu mang những môi trường này lại với nhau. Và nó được gọi là Universal Mappings. Khi chúng tôi đã mang tất cả các mô hình này vào môi trường của chúng tôi, chúng tôi có thể làm gì, giả sử rằng chúng tôi hiện đã áp dụng các quy ước đặt tên này và chúng rất dễ tìm, giờ đây chúng tôi có thể sử dụng cấu trúc có tên là Ánh xạ phổ quát trong ER / Xưởng. Chúng tôi có thể liên kết các thực thể trên các mô hình. Bất cứ nơi nào chúng ta thấy khách hàng của người dùng - có lẽ chúng ta sẽ có khách hàng của người dùng ở nhiều hệ thống khác nhau và rất nhiều cơ sở dữ liệu khác nhau - chúng ta có thể bắt đầu liên kết tất cả các hệ thống đó với nhau để khi tôi làm việc với nó trong một mô hình tôi có thể thấy đâu là những biểu hiện của khách hàng trong các mô hình khác. Và bởi vì chúng ta đã có lớp mô hình đại diện cho điều đó, chúng ta thậm chí có thể gắn nó vào các nguồn dữ liệu và đưa nó xuống nơi mà các câu hỏi được sử dụng trong đó cơ sở dữ liệu nào cũng cư trú. Nó thực sự mang đến cho chúng ta một khả năng gắn kết tất cả những thứ này lại với nhau rất gắn kết.

Tôi đã cho bạn thấy các đối tượng dữ liệu kinh doanh. Tôi cũng muốn nói về các phần mở rộng siêu dữ liệu, mà chúng tôi gọi là Tệp đính kèm, rất nhanh chóng. Những gì nó làm là cho chúng ta khả năng tạo siêu dữ liệu bổ sung cho các đối tượng mô hình của chúng ta. Tôi thường xuyên thiết lập các loại thuộc tính này để điều khiển nhiều thứ khác nhau từ góc độ quản trị dữ liệu và chất lượng dữ liệu, và cũng để giúp chúng tôi quản lý chính sách quản lý dữ liệu và lưu trữ dữ liệu. Ý tưởng cơ bản là bạn tạo các phân loại này và bạn có thể đính kèm chúng bất cứ nơi nào bạn muốn, ở cấp độ bảng, cấp cột, các loại điều đó. Tất nhiên, trường hợp sử dụng phổ biến nhất là các thực thể là các bảng và sau đó tôi có thể xác định: các đối tượng dữ liệu chủ của tôi là gì, các bảng tham chiếu của tôi là gì, các bảng giao dịch của tôi là gì? Từ góc độ chất lượng dữ liệu, tôi có thể phân loại theo mức độ quan trọng đối với doanh nghiệp để chúng tôi có thể ưu tiên các nỗ lực làm sạch dữ liệu và loại điều đó.

Một cái gì đó thường bị bỏ qua là, chính sách lưu giữ cho các loại dữ liệu khác nhau trong tổ chức của chúng tôi là gì? Chúng tôi có thể thiết lập chúng và chúng tôi thực sự có thể gắn chúng vào các loại tạo tác thông tin khác nhau trong môi trường mô hình hóa của chúng tôi và tất nhiên, cả kho lưu trữ của chúng tôi nữa. Cái hay là, các tệp đính kèm này có trong từ điển dữ liệu của chúng tôi nên khi chúng tôi sử dụng từ điển dữ liệu doanh nghiệp trong môi trường, chúng tôi có thể đính kèm chúng vào nhiều mô hình. Chúng ta chỉ phải xác định chúng một lần và chúng ta có thể tận dụng chúng nhiều lần trên các mô hình khác nhau trong môi trường của chúng ta. Đây chỉ là một ảnh chụp màn hình nhanh để cho thấy rằng bạn thực sự có thể chỉ định khi bạn thực hiện một tệp đính kèm, tất cả các phần mà bạn muốn đính kèm là gì. Và ví dụ này ở đây thực sự là một danh sách các giá trị, vì vậy khi chúng vào, bạn có thể chọn từ danh sách các giá trị, bạn có nhiều quyền kiểm soát trong môi trường mô hình hóa của những gì được chọn và thậm chí bạn có thể đặt mặc định giá trị là nếu một giá trị không được chọn. Vì vậy, rất nhiều quyền lực ở đó. Họ sống trong từ điển dữ liệu.

Một cái gì đó tôi muốn cho bạn thấy một chút nữa trên màn hình này, ngoài ra bạn thấy các loại tệp đính kèm hiển thị ở phần trên cùng, bên dưới nó bạn thấy thông tin bảo mật dữ liệu. Chúng tôi thực sự có thể áp dụng các chính sách bảo mật dữ liệu cho các phần thông tin khác nhau trong môi trường. Đối với các ánh xạ tuân thủ khác nhau, phân loại bảo mật dữ liệu, chúng tôi sẽ gửi một số trong số chúng ra khỏi hộp mà bạn có thể tạo và bắt đầu sử dụng, nhưng bạn cũng có thể xác định ánh xạ và tiêu chuẩn tuân thủ của riêng mình. Cho dù bạn đang thực hiện HIPAA hay bất kỳ sáng kiến ​​nào khác ngoài đó. Và bạn thực sự có thể bắt đầu xây dựng bộ siêu dữ liệu rất phong phú này trong môi trường của mình.

Và sau đó là Thuật ngữ và Điều khoản - đây là nơi gắn liền với ý nghĩa kinh doanh. Chúng tôi thường có các từ điển dữ liệu ngoài kia mà một tổ chức thường sử dụng làm điểm bắt đầu để loại bỏ các thuật ngữ, nhưng thuật ngữ và phiên bản là thường rất kỹ thuật. Vì vậy, những gì chúng ta có thể làm là chúng ta có thể, nếu chúng ta muốn, sử dụng chúng như một điểm khởi đầu để loại bỏ các thuật ngữ, nhưng chúng ta thực sự muốn doanh nghiệp sở hữu những thứ này. Những gì chúng tôi đã làm trong môi trường máy chủ nhóm là chúng tôi đã cung cấp cho mọi người khả năng tạo định nghĩa kinh doanh và sau đó chúng tôi có thể liên kết chúng với các tạo phẩm mô hình khác nhau mà chúng tương ứng trong môi trường mô hình hóa. Chúng tôi cũng nhận ra điểm đã được thảo luận trước đó, đó là bạn càng gõ nhiều người, càng có nhiều khả năng xảy ra lỗi của con người. Những gì chúng tôi cũng làm trong cấu trúc bảng chú giải của chúng tôi là, một, chúng tôi hỗ trợ một hệ thống thuật ngữ, vì vậy chúng tôi có thể có các loại bảng chú giải khác nhau hoặc các loại khác nhau trong tổ chức, nhưng cũng quan trọng là, nếu bạn đã có một số nguồn này ngoài các điều khoản và mọi thứ được xác định, chúng tôi thực sự có thể thực hiện nhập CSV để kéo chúng vào môi trường mô hình hóa và máy chủ nhóm của chúng tôi hoặc bảng chú giải của chúng tôi, sau đó bắt đầu liên kết từ đó. Và mỗi khi có gì đó thay đổi, sẽ có một bản kiểm toán đầy đủ về hình ảnh trước và sau, về mặt định nghĩa và mọi thứ khác, và những gì bạn sẽ thấy trong tương lai rất gần cũng là một quy trình ủy quyền vì vậy chúng tôi thực sự có thể kiểm soát những người chịu trách nhiệm về nó, sự chấp thuận của các ủy ban hoặc cá nhân và loại điều đó, để làm cho quá trình quản trị trở nên mạnh mẽ hơn khi chúng tôi tiến lên.

Điều này cũng làm cho chúng tôi là khi chúng tôi có các thuật ngữ thuật ngữ này trong bảng thuật ngữ máy chủ nhóm của chúng tôi, đây là một ví dụ về chỉnh sửa trong một thực thể trong chính mô hình mà tôi đã đưa lên đây. Nó có thể có các thuật ngữ được liên kết, nhưng những gì chúng tôi cũng làm là nếu có những từ trong bảng chú giải đó xuất hiện trong ghi chú hoặc mô tả về những gì chúng tôi có trong các thực thể của chúng tôi ở đây, chúng sẽ tự động được hiển thị bằng màu siêu liên kết nhẹ hơn và nếu chúng tôi di chuột qua chúng, chúng ta thực sự có thể thấy định nghĩa từ bảng thuật ngữ kinh doanh là tốt. Nó thậm chí còn cung cấp cho chúng tôi thông tin phong phú hơn khi chúng ta tiêu thụ thông tin đó, với tất cả các thuật ngữ thuật ngữ được đưa ra. Nó thực sự giúp làm phong phú thêm trải nghiệm và áp dụng ý nghĩa cho mọi thứ chúng tôi đang làm việc.

Vì vậy, một lần nữa, đó là một chuyến bay rất nhanh. Rõ ràng là chúng ta có thể dành nhiều ngày cho việc này khi chúng ta đi sâu vào các phần khác nhau, nhưng đây là một cú bay rất nhanh trên bề mặt. Những gì chúng tôi thực sự phấn đấu để làm là hiểu những môi trường dữ liệu phức tạp đó trông như thế nào. Chúng tôi muốn cải thiện khả năng hiển thị của tất cả các tạo phẩm dữ liệu đó và hợp tác để loại bỏ chúng với ER / Studio. Chúng tôi muốn kích hoạt mô hình dữ liệu tự động và hiệu quả hơn. Và đó là tất cả các loại dữ liệu mà chúng ta đang nói đến, cho dù đó là dữ liệu lớn, dữ liệu quan hệ truyền thống, kho lưu trữ tài liệu hay bất cứ thứ gì khác. Và một lần nữa, chúng tôi đã hoàn thành điều đó bởi vì chúng tôi có khả năng kỹ thuật chuyển tiếp và đảo ngược mạnh mẽ cho các nền tảng khác nhau và các công cụ khác mà bạn có thể có ngoài đó. Và đó là tất cả về việc chia sẻ và liên lạc trên toàn tổ chức với tất cả các bên liên quan. Đó là nơi chúng tôi áp dụng ý nghĩa thông qua các tiêu chuẩn đặt tên. Sau đó chúng tôi áp dụng các định nghĩa thông qua các thuật ngữ kinh doanh của chúng tôi. Và sau đó chúng tôi có thể phân loại thêm cho tất cả các khả năng quản trị khác của mình bằng các tiện ích mở rộng siêu dữ liệu như tiện ích mở rộng chất lượng dữ liệu, phân loại để quản lý dữ liệu chính hoặc bất kỳ loại phân loại nào khác mà bạn muốn áp dụng cho dữ liệu đó. Và sau đó chúng ta có thể tóm tắt hơn nữa và tăng cường giao tiếp hơn nữa với các đối tượng dữ liệu kinh doanh, với các đối tượng bên liên quan khác nhau, đặc biệt là giữa người lập mô hình và nhà phát triển.

Và một lần nữa, điều rất quan trọng về điều này là, đằng sau tất cả là một kho lưu trữ tích hợp với khả năng quản lý thay đổi rất mạnh mẽ. Tôi không có thời gian để trình bày nó hôm nay vì nó khá phức tạp, nhưng kho lưu trữ có khả năng quản lý thay đổi và kiểm toán thay đổi rất mạnh mẽ. Bạn có thể thực hiện các bản phát hành có tên, bạn có thể thực hiện các phiên bản được đặt tên và chúng tôi cũng có khả năng cho những người bạn đang thực hiện quản lý thay đổi, chúng tôi có thể gắn quyền đó vào nhiệm vụ của bạn. Hôm nay chúng tôi có khả năng đưa các tác vụ vào và liên kết các thay đổi mô hình của bạn với các tác vụ, giống như các nhà phát triển sẽ liên kết các thay đổi mã của họ với các tác vụ hoặc câu chuyện người dùng mà họ đang làm việc cùng.

Một lần nữa, đó là một tổng quan rất nhanh. Tôi hy vọng nó đã đủ để kích thích sự thèm ăn của bạn để chúng ta có thể tham gia vào các cuộc trò chuyện sâu sắc hơn nhiều về việc tách ra một số chủ đề này khi chúng ta tiến lên trong tương lai. Cảm ơn bạn đã dành thời gian và trở lại với bạn, Rebecca.

Rebecca Jozwiak: Cảm ơn, Ron, điều đó thật tuyệt vời và tôi có khá nhiều câu hỏi từ khán giả, nhưng tôi muốn cho các nhà phân tích của chúng tôi cơ hội đắm mình vào những gì bạn đã nói. Eric, tôi sẽ đi trước và có lẽ nếu bạn muốn giải quyết slide này, hoặc một cái khác, tại sao bạn không đi trước? Hoặc bất kỳ câu hỏi khác.

Eric Little: Chắc chắn rồi. Xin lỗi, câu hỏi là gì, Rebecca? Bạn muốn tôi hỏi điều gì đó cụ thể hay?

Rebecca Jozwiak: Tôi biết ban đầu bạn có một số câu hỏi cho Ron. Nếu bạn muốn yêu cầu anh ấy giải quyết bất kỳ vấn đề nào trong số đó, hoặc một vài trong số họ thoát khỏi slide của bạn hoặc bất cứ điều gì khác khơi gợi sự quan tâm của bạn mà bạn muốn hỏi về? Về các chức năng mô hình hóa của IDERA.

Eric Little: Vâng, vậy một trong những điều, Ron, vậy các bạn, có vẻ như các sơ đồ mà bạn đang hiển thị là các loại sơ đồ quan hệ thực thể chung như bạn thường sử dụng trong xây dựng cơ sở dữ liệu, đúng không?

Ron Huizenga: Vâng, nói chung, nhưng tất nhiên chúng tôi có các loại mở rộng cho các cửa hàng tài liệu và loại điều đó là tốt. Chúng tôi thực sự đã thay đổi từ chỉ ký hiệu quan hệ thuần túy, chúng tôi thực sự đã thêm các ký hiệu bổ sung cho các cửa hàng khác.

Eric Little: Có cách nào để các bạn có thể sử dụng các kiểu mô hình hóa dựa trên đồ thị, vì vậy, có cách nào để tích hợp, ví dụ, giả sử rằng tôi có một cái gì đó giống như một công cụ soạn thảo hàng đầu, TopBear hoặc tôi đã làm gì đó trong Protégé hay, bạn biết, như những người tài chính trong FIBO, họ đang làm rất nhiều công việc về ngữ nghĩa, công cụ RDF - có cách nào để đưa mô hình loại biểu đồ mối quan hệ thực thể đó vào công cụ này và sử dụng nó không

Ron Huizenga: Chúng tôi thực sự đang xem xét cách chúng ta có thể xử lý các biểu đồ. Chúng tôi không xử lý rõ ràng cơ sở dữ liệu đồ thị và loại điều đó ngày hôm nay, nhưng chúng tôi đang xem xét các cách mà chúng tôi có thể làm điều đó để mở rộng siêu dữ liệu của mình. Ý tôi là, chúng ta có thể đưa mọi thứ vào thông qua XML và loại điều đó ngay bây giờ, nếu ít nhất chúng ta có thể thực hiện một số loại biểu hiện XML để đưa nó vào làm điểm bắt đầu. Nhưng chúng tôi đang xem xét các cách thanh lịch hơn để đưa nó vào.

Và tôi cũng cho bạn thấy danh sách các cây cầu kỹ thuật đảo ngược mà chúng tôi cũng có ở đó, vì vậy chúng tôi luôn xem xét việc mở rộng các cầu đó cho các nền tảng cụ thể. Đó là một nỗ lực liên tục, liên tục, nếu điều đó có ý nghĩa, để bắt đầu nắm lấy rất nhiều các cấu trúc mới này và các nền tảng khác nhau ngoài kia. Nhưng tôi có thể nói rằng chúng tôi chắc chắn đi đầu trong việc đó. Ví dụ, những thứ tôi đã trình bày trên MongoDB và loại điều đó, chúng tôi là nhà cung cấp mô hình hóa dữ liệu đầu tiên thực sự làm điều đó tự nhiên trong sản phẩm của chúng tôi.

Eric Little: Được rồi, vâng. Vì vậy, câu hỏi khác mà tôi dành cho bạn, sau đó, là về mặt quản trị và việc duy trì - giống như khi bạn sử dụng ví dụ, khi bạn đưa ra ví dụ về người là nhân viên của người dùng, tôi tin rằng đó là một người Lương tiền lương và sau đó bạn có một kế hoạch, đó là cách, bạn quản lý như thế nào, ví dụ, các loại người khác nhau có thể có - giả sử bạn có một kiến ​​trúc lớn, phải, giả sử bạn có một doanh nghiệp lớn và Mọi người bắt đầu kết hợp mọi thứ lại với nhau trong công cụ này và bạn đã có một nhóm ở đây có từ "nhân viên" và một nhóm ở đây có chữ Công nhân. Một người ở đây nói rằng Lương lương và một người khác nói Lương lương

Làm thế nào để các bạn hòa giải và quản lý và chi phối các loại khác biệt? Bởi vì tôi biết chúng ta sẽ làm điều đó như thế nào trong thế giới đồ thị, bạn biết đấy, bạn sẽ sử dụng danh sách từ đồng nghĩa hoặc bạn sẽ nói có một khái niệm và nó có một số thuộc tính, hoặc bạn có thể nói trong mô hình SKOS tôi có nhãn ưa thích và tôi có nhiều nhãn thay thế mà tôi có thể sử dụng. Làm thế nào để các bạn làm điều đó?

Ron Huizenga: Chúng tôi thực hiện theo một số cách khác nhau và chủ yếu trước tiên hãy nói về thuật ngữ này. Tất nhiên, một trong những điều chúng tôi làm là chúng tôi muốn có các điều khoản được xác định hoặc bị xử phạt và trong thuật ngữ kinh doanh rõ ràng là nơi chúng tôi muốn chúng. Và chúng tôi cũng cho phép liên kết đến các từ đồng nghĩa trong bảng thuật ngữ kinh doanh, vì vậy những gì bạn có thể làm là bạn có thể nói, đây là thuật ngữ của tôi, nhưng bạn cũng có thể định nghĩa tất cả các từ đồng nghĩa của chúng là gì.

Tất nhiên, điều thú vị bây giờ là khi bạn bắt đầu nhìn qua khung cảnh dữ liệu rộng lớn này với tất cả các hệ thống khác nhau mà bạn đã ra khỏi đó, bạn không thể ra khỏi đó và thay đổi các bảng tương ứng và các loại điều đó thành tương ứng với tiêu chuẩn đặt tên đó bởi vì nó có thể là một gói mà bạn đã mua, do đó bạn không có quyền kiểm soát nào trong việc thay đổi cơ sở dữ liệu hoặc bất cứ điều gì cả.

Những gì chúng ta có thể làm ở đó, ngoài việc có thể liên kết các định nghĩa thuật ngữ, là thông qua các ánh xạ phổ quát mà tôi đã nói, những gì chúng ta sẽ làm, và một cách tiếp cận được đề xuất, là có một mô hình logic bao quát đưa ra những gì những khái niệm kinh doanh khác nhau mà bạn đang nói đến. Gắn các thuật ngữ thuật ngữ kinh doanh vào các thuật ngữ đó và điều tuyệt vời là giờ đây bạn đã có cấu trúc này đại diện cho một thực thể logic như hiện tại, sau đó bạn có thể bắt đầu liên kết từ thực thể logic đó với tất cả các triển khai của thực thể logic đó trong Các hệ thống khác nhau.

Sau đó, nơi bạn cần phải làm điều đó, bạn có thể thấy, ồ, người ở đây được gọi là nhân viên của Lọ trong hệ thống này. Lương Salary ở đây được gọi là tiền lương ở đây trong hệ thống khác này. Bởi vì bạn sẽ thấy điều đó, bạn sẽ thấy tất cả các biểu hiện khác nhau của những điều đó vì bạn đã liên kết chúng với nhau.

Eric Little: Được rồi, tuyệt, ừ, hiểu rồi. Theo nghĩa đó, có an toàn không khi nói rằng đó giống như một số cách tiếp cận hướng đối tượng?

Ron Huizenga: Một chút. Nó chuyên sâu hơn một chút so với, tôi đoán bạn có thể nói. Ý tôi là, bạn có thể thực hiện phương pháp liên kết thủ công và trải qua và kiểm tra cũng như thực hiện tất cả chúng. Một điều tôi thực sự không có cơ hội để nói về - bởi vì một lần nữa, chúng tôi có rất nhiều khả năng - chúng tôi cũng có giao diện tự động hóa hoàn toàn trong chính công cụ Data Architect. Và một khả năng vĩ mô, thực sự là một ngôn ngữ lập trình trong công cụ. Vì vậy, chúng tôi thực sự có thể làm những việc như viết macro, đưa nó ra ngoài và thẩm vấn mọi thứ và tạo liên kết cho bạn. Chúng tôi sử dụng nó để nhập và xuất thông tin, chúng tôi có thể sử dụng nó để thay đổi mọi thứ hoặc thêm thuộc tính, sự kiện dựa trên chính mô hình hoặc chúng tôi có thể sử dụng nó để chạy theo lô để thực sự đi ra ngoài và thẩm vấn mọi thứ và thực sự đưa vào các cấu trúc khác nhau trong mô hình. Vì vậy, có một giao diện tự động hóa đầy đủ mà mọi người cũng có thể tận dụng. Và sử dụng các ánh xạ phổ quát với những ánh xạ đó sẽ là một cách rất mạnh mẽ để làm điều đó.

Rebecca Jozwiak: Được rồi, cảm ơn Ron, và cảm ơn Eric. Đó là những câu hỏi tuyệt vời. Tôi biết chúng ta đang chạy một chút qua đầu giờ, nhưng tôi muốn cho Malcolm một cơ hội để ném một số câu hỏi theo cách của Ron. Malcolm?

Malcolm Chisholm: Cảm ơn, Rebecca. Vì vậy, Ron, nó rất thú vị, tôi thấy có rất nhiều khả năng ở đây. Một trong những lĩnh vực mà tôi rất quan tâm là, nếu chúng ta có một dự án phát triển, bạn thấy nhà mô hình dữ liệu sử dụng các khả năng này như thế nào và có thể hợp tác nhiều hơn với các nhà phân tích kinh doanh, với một trình phân tích dữ liệu, với một nhà phân tích chất lượng dữ liệu và với các nhà tài trợ kinh doanh, những người cuối cùng sẽ chịu trách nhiệm về các yêu cầu thông tin thực tế trong dự án. Làm thế nào để người lập mô hình dữ liệu thực sự, bạn biết, làm cho dự án hiệu quả và hiệu quả hơn với các khả năng mà chúng ta đang xem xét?

Ron Huizenga: Tôi nghĩ rằng một trong những điều đầu tiên bạn phải làm đó là với tư cách là người lập mô hình dữ liệu - và tôi không có ý chọn một số người lập mô hình, nhưng dù sao tôi cũng sẽ có ấn tượng rằng bộ tạo mô hình dữ liệu thực sự là kiểu vai trò của người gác cổng, chúng tôi đang xác định cách thức hoạt động của nó, chúng tôi là những người bảo vệ đảm bảo rằng mọi thứ đều chính xác.

Bây giờ có một khía cạnh của điều đó, đó là bạn phải đảm bảo rằng bạn đang xác định kiến ​​trúc dữ liệu âm thanh và mọi thứ khác. Nhưng điều quan trọng hơn là với tư cách là người lập mô hình dữ liệu - và tôi thấy điều này khá rõ ràng khi tôi tư vấn - là bạn phải trở thành người hỗ trợ, vì vậy bạn phải kéo những người này lại với nhau.

Nó sẽ không được thiết kế trước, tạo, xây dựng cơ sở dữ liệu nữa - điều bạn cần làm là bạn cần có khả năng làm việc với tất cả các nhóm bên liên quan khác nhau này, làm những việc như kỹ thuật đảo ngược, nhập thông tin vào, có những người khác hợp tác, cho dù đó là trên các thuật ngữ hoặc tài liệu, mọi thứ như thế - và là người hỗ trợ để kéo nó vào kho lưu trữ và liên kết các khái niệm với nhau trong kho lưu trữ và làm việc với những người đó.

Nó thực sự là một loại môi trường hợp tác, thậm chí thông qua định nghĩa các nhiệm vụ hoặc thậm chí các chủ đề thảo luận hoặc loại điều chúng ta có trong máy chủ nhóm, mọi người thực sự có thể hợp tác, đặt câu hỏi và đến các sản phẩm cuối cùng mà họ cần cho kiến ​​trúc dữ liệu của họ và tổ chức của họ. Đó có phải là câu trả lời không?

Malcolm Chisholm: Vâng, tôi đồng ý. Bạn biết đấy, tôi nghĩ rằng kỹ năng tạo thuận lợi là thứ thực sự được mong muốn ở những người lập mô hình dữ liệu. Tôi đồng ý rằng chúng tôi không phải lúc nào cũng thấy điều đó, nhưng tôi nghĩ điều đó là cần thiết và tôi sẽ đề nghị rằng đôi khi có xu hướng ở trong góc của bạn khi làm mô hình dữ liệu của bạn, nhưng bạn thực sự cần phải ra ngoài làm việc với các nhóm bên liên quan khác hoặc bạn không hiểu môi trường dữ liệu mà bạn đang xử lý và tôi nghĩ rằng mô hình phải chịu hậu quả. Nhưng đó chỉ là ý kiến ​​của tôi.

Ron Huizenga: Và thật thú vị bởi vì bạn đã đề cập một vài điều trước đó trong slide của bạn về lịch sử về cách các doanh nghiệp quay lưng với CNTT vì họ không cung cấp các giải pháp một cách kịp thời và những loại điều đó.

Điều rất thú vị là trong những lần tham gia tư vấn sau này của tôi, trước khi trở thành người quản lý sản phẩm, hầu hết các dự án mà tôi đã làm trong hai năm trước đó, đều được tài trợ kinh doanh, nơi thực sự là doanh nghiệp thúc đẩy nó và các kiến ​​trúc sư dữ liệu và người lập mô hình không phải là một phần của CNTT. Chúng tôi là một phần của một nhóm được tài trợ bởi doanh nghiệp và chúng tôi đã ở đó với tư cách là người hỗ trợ làm việc với các nhóm dự án còn lại.

Malcolm Chisholm: Vì vậy, tôi nghĩ đó là một điểm rất thú vị. Tôi nghĩ rằng chúng ta đang bắt đầu thấy một sự thay đổi trong thế giới kinh doanh nơi doanh nghiệp đang hỏi hoặc nghĩ có thể, không nhiều như những gì tôi làm, đang xử lý như thế nào, nhưng họ cũng bắt đầu nghĩ về dữ liệu là gì mà tôi làm việc với, nhu cầu dữ liệu của tôi là gì, dữ liệu tôi đang xử lý như dữ liệu là gì và chúng tôi có thể nhận các sản phẩm và khả năng của IDERA ở mức độ nào để hỗ trợ quan điểm đó và tôi nghĩ rằng nhu cầu của doanh nghiệp, thậm chí mặc dù nó vẫn còn hơi mới.

Ron Huizenga: Tôi đồng ý với bạn và tôi nghĩ rằng chúng ta đang thấy nó ngày càng đi theo hướng đó. Chúng tôi đã thấy một sự thức tỉnh và bạn đã chạm vào nó sớm hơn về tầm quan trọng của dữ liệu. Chúng tôi đã thấy tầm quan trọng của dữ liệu sớm trong CNTT hoặc trong quá trình phát triển cơ sở dữ liệu, như bạn nói, chúng tôi đã tham gia vào toàn bộ chu trình quản lý quy trình này - và quy trình là vô cùng quan trọng, đừng hiểu sai về tôi - nhưng bây giờ điều gì đã xảy ra là khi điều đó xảy ra, loại dữ liệu mất tập trung.

Và bây giờ các tổ chức đang nhận ra rằng dữ liệu thực sự là đầu mối. Dữ liệu đại diện cho tất cả mọi thứ chúng tôi đang làm trong doanh nghiệp của chúng tôi vì vậy chúng tôi cần đảm bảo rằng chúng tôi có dữ liệu chính xác, rằng chúng tôi có thể tìm thấy thông tin chính xác mà chúng tôi cần để đưa ra quyết định của mình. Bởi vì không phải mọi thứ đều xuất phát từ một quy trình xác định. Một số thông tin là sản phẩm phụ của những thứ khác và chúng ta vẫn cần có thể tìm thấy nó, biết ý nghĩa của nó và có thể dịch dữ liệu mà chúng ta thấy cuối cùng thành kiến ​​thức mà chúng ta có thể sử dụng để thúc đẩy doanh nghiệp của mình tốt hơn.

Malcolm Chisholm: Phải, và bây giờ một lĩnh vực khác mà tôi đang vật lộn là cái mà tôi sẽ gọi là vòng đời dữ liệu, bạn biết đấy, nếu chúng ta nhìn vào loại chuỗi cung ứng dữ liệu đi qua một doanh nghiệp, chúng ta sẽ bắt đầu với thu thập dữ liệu hoặc thu thập dữ liệu, có thể là mục nhập dữ liệu nhưng cũng có thể là, tôi đang nhận dữ liệu từ bên ngoài doanh nghiệp từ một số nhà cung cấp dữ liệu.

Và sau đó, từ việc thu thập dữ liệu, chúng tôi chuyển sang bảo trì dữ liệu nơi tôi đang nghĩ về việc chuẩn hóa dữ liệu này và vận chuyển nó đến những nơi cần thiết. Và sau đó sử dụng dữ liệu, các điểm thực tế nơi có dữ liệu, bạn sẽ nhận được giá trị từ dữ liệu.

Và ngày xưa, tất cả chỉ được thực hiện theo một kiểu riêng lẻ, nhưng ngày nay, có thể là, một môi trường phân tích, và sau đó, ngoài đó, một kho lưu trữ, một cửa hàng, nơi chúng ta đặt dữ liệu khi chúng ta không còn cần nó và cuối cùng là một loại quá trình thanh trừng. Làm thế nào để bạn thấy mô hình dữ liệu phù hợp với việc quản lý toàn bộ vòng đời dữ liệu này?

Ron Huizenga: Đó là một câu hỏi rất hay và một điều tôi thực sự không có thời gian để đi sâu vào bất kỳ chi tiết nào ở đây ngày hôm nay, đó là những gì chúng ta thực sự bắt đầu nói đến là dòng dữ liệu. Vì vậy, những gì chúng ta thực sự có thể làm là chúng ta có khả năng truyền dữ liệu trong các công cụ của mình và, như tôi nói, chúng ta thực sự có thể trích xuất một số từ các công cụ ETL, nhưng bạn cũng có thể ánh xạ nó chỉ bằng cách vẽ dòng dõi. Bất kỳ mô hình dữ liệu hoặc cơ sở dữ liệu nào chúng tôi đã nắm bắt và đưa vào các mô hình, chúng tôi có thể tham chiếu các cấu trúc từ đó trong sơ đồ dòng dữ liệu của chúng tôi.

Những gì chúng ta có thể làm là vẽ một luồng dữ liệu, như bạn nói, từ nguồn đến đích và thông qua vòng đời tổng thể về cách dữ liệu đó truyền qua các hệ thống khác nhau và những gì bạn sẽ tìm thấy là, hãy đưa nhân viên 'dữ liệu - đó là một trong những mục yêu thích của tôi dựa trên một dự án mà tôi đã làm cách đây nhiều năm. Tôi đã làm việc với một tổ chức có dữ liệu nhân viên trong 30 hệ thống khác nhau. Những gì chúng tôi đã kết thúc ở đó - và Rebecca đã bật lên slide dòng dữ liệu - đây là một slide dòng dữ liệu khá đơn giản ở đây, nhưng những gì chúng tôi có thể làm là đưa vào tất cả các cấu trúc dữ liệu, tham chiếu chúng trong sơ đồ, và sau đó chúng tôi thực sự có thể bắt đầu xem xét các luồng giữa, và các thực thể dữ liệu khác nhau đó được liên kết với nhau như thế nào trong một luồng? Và chúng ta có thể vượt xa điều đó là tốt. Đây là một phần của sơ đồ dòng dữ liệu hoặc dòng dõi mà chúng ta thấy ở đây. Nếu bạn muốn đi xa hơn, chúng tôi cũng có một phần kiến ​​trúc sư kinh doanh của bộ này và điều tương tự được áp dụng ở đó.

Bất kỳ cấu trúc dữ liệu nào chúng tôi đã nắm bắt trong môi trường mô hình hóa dữ liệu, chúng có thể được tham chiếu trong công cụ mô hình hóa doanh nghiệp để ngay cả trong sơ đồ mô hình kinh doanh hoặc sơ đồ quy trình kinh doanh của bạn, bạn có thể tham khảo các cửa hàng dữ liệu riêng lẻ nếu bạn muốn ra khỏi môi trường mô hình hóa dữ liệu và trong khi bạn đang sử dụng chúng trong các thư mục trong mô hình quy trình kinh doanh của mình, bạn thậm chí có thể chỉ định CRUD trên đó, cũng như cách thông tin đó được tiêu thụ hoặc sản xuất, và sau đó chúng ta có thể bắt đầu tạo những thứ như báo cáo tác động và phân tích và sơ đồ ra khỏi đó.

Những gì chúng tôi đang hướng đến, và chúng tôi đã có rất nhiều khả năng, nhưng một trong những điều mà chúng tôi có giống như một mục tiêu mà chúng tôi đang xem xét, khi chúng tôi tiếp tục phát triển các công cụ của mình về phía trước, đang có thể vạch ra từ đầu đến cuối, dòng dữ liệu tổ chức và vòng đời dữ liệu đầy đủ.

Malcolm Chisholm: Được rồi. Rebecca, tôi có được phép thêm một người nữa không?

Rebecca Jozwiak: Tôi sẽ cho phép bạn thêm một người nữa, Malcolm, đi tiếp.

Malcolm Chisholm: Cảm ơn bạn rất nhiều. Suy nghĩ về quản trị dữ liệu và suy nghĩ về mô hình hóa dữ liệu, làm thế nào để hai nhóm đó làm việc hiệu quả với nhau và hiểu nhau?

Eric Little: Thật thú vị, tôi nghĩ nó thực sự phụ thuộc vào tổ chức, và nó quay trở lại với khái niệm trước đây của tôi là, trong các tổ chức nơi các sáng kiến ​​được thúc đẩy kinh doanh, chúng tôi đã gắn kết ngay. Ví dụ, tôi đang lãnh đạo một kiến ​​trúc dữ liệu nhóm nhưng chúng tôi đã liên kết ngay với người dùng doanh nghiệp và chúng tôi thực sự đã giúp họ đứng lên chương trình quản trị dữ liệu của họ. Một lần nữa, nhiều hơn một phương pháp tư vấn nhưng nó thực sự nhiều hơn một chức năng kinh doanh.

Những gì bạn thực sự cần để có thể làm là bạn cần các nhà mô hình dữ liệu và kiến ​​trúc sư thực sự hiểu về kinh doanh, có thể liên quan đến người dùng doanh nghiệp và sau đó đã giúp họ đứng lên các quy trình quản trị xung quanh nó. Doanh nghiệp muốn làm điều đó, nhưng nói chung, chúng tôi có kiến ​​thức công nghệ để có thể giúp họ nổi bật các loại chương trình đó. Nó thực sự phải là một sự hợp tác, nhưng nó cần phải được sở hữu kinh doanh.

Malcolm Chisholm: Được rồi, thật tuyệt. Cảm ơn bạn.

Tiến sĩ Eric Little: Được rồi.

Rebecca Jozwiak: Được rồi, cảm ơn rất nhiều. Thành viên khán giả, tôi e rằng chúng tôi không nhận được câu hỏi của bạn, nhưng tôi sẽ đảm bảo rằng họ sẽ được chuyển tiếp đến vị khách thích hợp mà chúng tôi có trên mạng hôm nay. Tôi muốn cảm ơn bạn rất nhiều đến Eric, Malcolm và Ron vì đã là khách của chúng tôi ngày hôm nay. Đây là công cụ tuyệt vời, folks. Và nếu bạn thích webcast IDERA ngày hôm nay, IDERA cũng sẽ có mặt trên Hot Technologies vào thứ Tư tới nếu bạn muốn tham gia, thảo luận về những thách thức của việc lập chỉ mục và Oracles, vì vậy một chủ đề hấp dẫn khác.

Cảm ơn bạn rất nhiều, mọi người, hãy quan tâm và chúng ta sẽ gặp lại bạn lần sau. Tạm biệt.

Xây dựng kiến ​​trúc dữ liệu theo định hướng kinh doanh