Trang Chủ Âm thanh Phân tích nhúng ở mọi nơi: cho phép nhà khoa học dữ liệu công dân

Phân tích nhúng ở mọi nơi: cho phép nhà khoa học dữ liệu công dân

Anonim

Bởi nhân viên Techopedia, ngày 25 tháng 8 năm 2016

Takeaway: Host Rebecca Jozwiak thảo luận về hiện tượng phân tích nhúng và các nhà khoa học dữ liệu công dân với Tiến sĩ Robin Bloor, Dez Blanchfield và David Sweenor.

Bạn phải đăng ký cho sự kiện này để xem video. Đăng ký để xem video.

Rebecca Jozwiak: Thưa quý vị và các bạn, xin chào và chào mừng đến với Hot Technologies. Phần mềm nhúng ở mọi nơi: Kích hoạt dữ liệu công dân Nhà khoa học là chủ đề của chúng tôi hôm nay. Tôi đang điền vào máy chủ thông thường của bạn, đây là Rebecca Jozwiak điền cho Eric Kavanagh. Vâng, năm nay là nóng. Đặc biệt là thuật ngữ nhà khoa học dữ liệu trực tuyến đã nhận được rất nhiều sự chú ý mặc dù chúng ta thường gọi chúng là những cái tên nhàm chán như chuyên gia phân tích và thống kê, nhưng khá giống với các hoạt động tương tự nhưng nó có một tên mới gợi cảm và nó thu hút rất nhiều sự chú ý. Họ rất mong muốn có được ở nơi làm việc, có lợi cho tổ chức và mọi người đều muốn có một cái. Nhưng chúng là: 1) đắt tiền, 2) khó tìm. Bạn biết đấy, tất cả các tin tức về sự thiếu hụt kỹ năng của nhà khoa học dữ liệu, vâng, nhưng họ vẫn mang lại giá trị to lớn cho tổ chức và mọi người đang cố gắng tìm ra cách để có được giá trị đó mà không phải bỏ xu, vì vậy nói.

Nhưng tin tốt là chúng ta đang thấy các công cụ và phần mềm ra đời là loại bù đắp cho sự thiếu hụt đó. Chúng ta có tự động hóa, học máy, phân tích nhúng, đó là những gì chúng ta sẽ học về ngày hôm nay, và nó đã làm phát sinh thuật ngữ mới này, nhà khoa học dữ liệu công dân, Hồi và điều đó có nghĩa là gì? Không, đó không phải là nhà khoa học dữ liệu được đào tạo của bạn, đó có thể là người dùng doanh nghiệp của bạn, chuyên gia BI của bạn, một người từ CNTT, một người có nền tảng nhưng có thể không nhất thiết phải là chuyên gia. Nhưng những gì nó làm, những công cụ và phần mềm này, là nó cho phép nhiều người truy cập vào các giải pháp thông minh đó mặc dù họ có thể không biết mã hóa sâu. Nhưng nó chỉ giúp cải thiện hiệu suất tổng thể khi bạn cung cấp cho mọi người thêm một chút quyền truy cập vào suy nghĩ phân tích đó. Bạn không cần phải được đào tạo để có được sự tò mò có thể dẫn đến những hiểu biết tốt cho công ty của bạn.

Thảo luận rằng với chúng tôi hôm nay là Robin Bloor của chúng tôi, nhà phân tích chính của Tập đoàn Bloor, một trong những nhà khoa học dữ liệu khó nắm bắt, Dez Blanchfield gọi đến, và sau đó chúng tôi có David Sweenor từ Dell Statistica sẽ trình bày cho chúng tôi hôm nay. Và với điều đó tôi sẽ chuyển nó cho Robin Bloor.

Robin Boor: Được rồi, cảm ơn vì lời giới thiệu đó. Tôi nghĩ về điều này trong bối cảnh lịch sử. Những gì chúng ta thực sự nhìn vào đây là một trong những thiết kế của Leonardo da Vinci cho một loại tàu lượn mà một người đàn ông có thể đặt trên lưng. Tôi không biết liệu nó có thực sự hoạt động không. Tôi sẽ không nhận được vào nó, tôi phải nói. Tuy nhiên, da Vinci, bất cứ khi nào tôi nghĩ về da Vinci, tôi nghĩ về anh ta như một trong những người tò mò và phân tích nhất từng tồn tại. Và nó khá rõ ràng nếu bạn chỉ nhìn vào chiếc tàu lượn đó được thiết kế trên cơ sở cánh chim và anh ta đã bằng cách này hay cách khác nghiên cứu các chuyến bay của các loài chim để chế tạo nó.

Nếu chúng ta nhìn theo quan điểm lịch sử - tôi thực sự đã tìm kiếm điều này - phân tích có lẽ là ứng dụng lâu đời nhất của toán học. Có những cuộc điều tra có niên đại ít nhất là từ thời Babylon. Chúng tôi biết về điều này bởi vì về cơ bản có một số máy tính bảng hình nêm có dữ liệu như thế trên chúng. Không biết có bất cứ điều gì đã quay trở lại sớm hơn. Nhưng điều hiển nhiên là bạn đã có cho mình một nền văn minh với số lượng người đông đảo, nó thực sự đòi hỏi phải lập kế hoạch và đáng để biết bạn đang lên kế hoạch cho điều gì và yêu cầu của những người đó thực sự là gì.

Và đó là nơi nó bắt đầu và cũng là nơi máy tính bắt đầu bởi vì những máy tính đầu tiên, những máy tính cơ học đầu tiên, thực sự, tôi nghĩ rằng đầu tiên là điều tra dân số được tạo ra bởi Hollerith, đã trở thành IBM, tôi tin. Tất cả điều này đã di chuyển về phía trước. Có một số loại xen kẽ giữa có lẽ những năm 1970 và ngày nay, nơi có một số lượng lớn các ứng dụng và phân tích khác, bạn có thể nói, đã ngồi ở ghế sau. Vâng, đã có phân tích đang diễn ra - nó đã xảy ra trong các tổ chức lớn, đặc biệt là các ngân hàng và công ty bảo hiểm, và thực sự là General Electric và telco và những thứ tương tự - nhưng nó thường không được sử dụng trong kinh doanh và hiện tại nó bắt đầu được sử dụng trong suốt kinh doanh. Và nó đã thay đổi trò chơi, thực sự. Điều đầu tiên tôi nghĩ tôi muốn thu hút sự chú ý là kim tự tháp dữ liệu, thứ tôi đặc biệt thích. Ý tôi là, tôi đã vẽ một trong số 20 năm trước - ít nhất là 20 năm trước - để thử và hiểu, thực sự, vào thời điểm đó, tôi đã cố gắng hiểu BI và một số khai thác dữ liệu ban đầu đã được thực hiện. Những gì tôi đã xác định ở đây là ý tưởng về dữ liệu và các ví dụ là tín hiệu, đo lường, ghi âm, sự kiện, giao dịch, tính toán, tổng hợp, các điểm thông tin riêng lẻ. Bạn có thể nghĩ về chúng như các phân tử thông tin, nhưng chúng là những điểm riêng lẻ. Nó trở thành thông tin ngay khi có được bối cảnh. Dữ liệu được liên kết, dữ liệu có cấu trúc, cơ sở dữ liệu, trực quan hóa dữ liệu, máy vẽ, lược đồ và bản thể học - tất cả chúng đều đủ điều kiện trong tâm trí tôi vì thông tin bạn đã làm là tổng hợp rất nhiều loại và tạo ra một thứ gì đó nhiều hơn một điểm dữ liệu, một cái gì đó thực sự có hình dạng, hình dạng toán học.

Ở trên mà chúng ta có kiến ​​thức. Chúng ta có thể, bằng cách kiểm tra thông tin, chúng ta có thể biết rằng có nhiều mẫu khác nhau và chúng ta có thể tận dụng các mẫu đó bằng cách xây dựng các quy tắc, chính sách, hướng dẫn, quy trình, và sau đó nó có dạng kiến ​​thức. Và hầu như tất cả các chương trình máy tính, bất kể chúng đang làm gì, đều là kiến ​​thức về một loại, bởi vì chúng hoạt động chống lại dữ liệu và áp dụng các quy tắc cho chúng. Chúng tôi có ba lớp này và có một sự tinh chỉnh ngày càng tăng giữa các lớp. Và ở phía bên trái của sơ đồ này, bạn đã hiển thị dữ liệu mới nhập vào, vì vậy rất nhiều trong số này là tĩnh. Dữ liệu được tích lũy, thông tin được tích lũy và kiến ​​thức có khả năng phát triển. Ở phía trên, chúng tôi có sự hiểu biết về cuộc sống và tôi sẽ duy trì, mặc dù đó là một lập luận triết học, sự hiểu biết đó chỉ tồn tại trong con người. Nếu tôi sai về điều đó, thì tất cả chúng ta sẽ được thay thế bằng máy tính tại một số thời điểm. Nhưng thay vì tranh luận, tôi sẽ chuyển sang slide tiếp theo.

Khi tôi nhìn vào điều này, điều thú vị, đây là điều gần đây, điều thú vị là thử và tìm hiểu xem phân tích thực sự là gì. Và cuối cùng bằng cách vẽ các sơ đồ khác nhau và kết thúc bằng một sơ đồ giống như thế này, tôi đã đi đến kết luận, trên thực tế, phát triển phân tích thực sự chỉ là phát triển phần mềm với một số lượng lớn các công thức toán học. Khám phá phân tích hơi khác một chút so với phát triển phần mềm theo nghĩa bạn thực sự sẽ lấy nhiều, nhiều mô hình khác nhau và điều tra chúng để tạo ra kiến ​​thức mới về dữ liệu. Nhưng một khi bạn đã tạo ra nó, nó sẽ được triển khai theo những gì tôi nghĩ là hỗ trợ quyết định thụ động, đó là thông tin chỉ cung cấp cho người dùng; hỗ trợ quyết định tương tác, đó là những thứ như OLAP, nơi người dùng được cung cấp một bộ dữ liệu có cấu trúc mà họ có thể tự điều tra và suy luận mọi thứ bằng cách sử dụng các công cụ khác nhau có sẵn. Rất nhiều hình dung là như thế. Và sau đó chúng tôi có tự động hóa nếu bạn có thể biến một số hiểu biết phân tích mà bạn đã tập hợp thành một bộ quy tắc có thể thực hiện, bạn không nhất thiết cần phải có một con người tham gia. Đó là cách mà tôi đã nhìn nó khi tôi làm tất cả những điều đó. Và những điều khác nhau bắt đầu xảy ra với tôi. Khi một khu vực hoạt động, chúng ta sẽ nói, một khi một miền dữ liệu thực sự được khai thác, khai thác triệt để, được khám phá kỹ lưỡng qua mọi hướng có thể, cuối cùng nó sẽ trở thành BI kết tinh. Kiến thức được phát minh bắt đầu trở thành kiến ​​thức thông báo cho nhiều người dùng theo nhiều cách khác nhau và tăng khả năng của họ, hy vọng, thực sự làm công việc họ làm.

Một trong những điều mà tôi nhận thấy và tôi đã xem xét các phân tích dự đoán trong khoảng năm năm, nhưng các phân tích dự đoán đang trở thành BI, theo nghĩa là nó chỉ biến thành thông tin hữu ích để cung cấp cho mọi người và như tôi đã chỉ ra, có báo cáo BI tự động, BI khám phá, BI, phân loại rất khác nhau của nó và phân tích dự đoán đang thực sự đi theo cả ba hướng. Và quy trình phân tích như tôi đã chỉ ra không khác gì phát triển phần mềm, chỉ được thực hiện bởi những người khác nhau với các kỹ năng hơi khác nhau. Tôi cho rằng tôi nên nhấn mạnh rằng các kỹ năng cần thiết để tạo ra một nhà khoa học dữ liệu thực sự giỏi phải mất nhiều năm để có được. Họ không dễ dàng có được và không một số lượng lớn người có thể làm điều đó, nhưng đó là vì nó liên quan đến việc hiểu toán học ở mức độ rất phức tạp để biết cái gì hợp lệ và cái gì không hợp lệ. Phát triển phân tích, khám phá kiến ​​thức mới, cấy phân tích, đó là về việc làm cho kiến ​​thức hoạt động. Đó là loại phông nền mà tôi thấy cho toàn bộ phân tích. Đó là một khu vực rộng lớn và có rất nhiều, nhiều chiều cho nó, nhưng tôi nghĩ rằng việc khái quát hóa áp dụng cho mọi thứ.

Sau đó, sự gián đoạn kinh doanh, như tôi đã đề cập, có một số tổ chức, công ty dược phẩm là một tổ chức khác, có trong DNA của họ, họ đã có phân tích. Nhưng có nhiều tổ chức thực sự không có DNA trong DNA của họ, và bây giờ họ có khả năng, bây giờ phần mềm và phần cứng rẻ hơn nhiều so với trước đây, giờ họ có khả năng khai thác nó. Tôi sẽ nói một số điều. Điều đầu tiên là phân tích, trong nhiều trường hợp, đó là R & D. Bạn có thể chỉ đang áp dụng phân tích cho một khu vực cụ thể của tổ chức và có vẻ như bạn đang bằng cách này hay cách khác để phân tích các đơn đặt hàng của khách hàng một lần nữa từ các quan điểm khác nhau, kết hợp nó với dữ liệu khác. Nhưng phân tích thực sự tạo ra khả năng nhìn toàn bộ tổ chức và phân tích khá nhiều bất kỳ hoạt động cụ thể nào đang diễn ra trong tổ chức và toàn bộ chuỗi hoạt động. Nhưng một khi bạn thực sự di chuyển vào khu vực đó, tôi sẽ duy trì rằng đó là nghiên cứu và phát triển. Và có một câu hỏi mà tôi đã được hỏi một vài lần, đó là, Công ty nên chi bao nhiêu cho phân tích? Và tôi nghĩ cách tốt nhất để nghĩ về việc cung cấp câu trả lời cho điều đó là nghĩ về phân tích là R & D và hỏi, bạn có thể chi bao nhiêu cho R & D trong lĩnh vực hiệu quả kinh doanh không?

Và các doanh nghiệp không có phân tích, có rất nhiều điều họ không biết. Trước hết, họ không biết làm thế nào để làm điều đó. Thông thường nếu họ thực sự đi theo cách này hay cách khác thông qua phân tích trong tổ chức - họ thực sự không có nhiều lựa chọn ngoài việc đi đến một tư vấn có thể hỗ trợ họ thực hiện điều đó bởi vì, điều đó là không thể hoặc thực sự rất khó khăn đối với hầu hết các doanh nghiệp thực sự thuê một nhà khoa học dữ liệu, tìm một người, trả tiền cho một người và thực sự tin tưởng họ làm những gì bạn muốn họ làm. Rất khó. Hầu hết các doanh nghiệp không biết cách thuê hoặc giáo dục nhân viên thực sự làm công việc này và lý do đơn giản là nó chưa có trong DNA của họ, vì vậy đây không phải là một phần của quy trình kinh doanh tự nhiên của họ. Điều này ăn vào điểm tiếp theo. Họ không biết làm thế nào để biến nó thành một quy trình kinh doanh. Cách tốt nhất để làm điều đó là nhân bản những gì các công ty dược phẩm và công ty bảo hiểm, chỉ cần nhìn, và một số công ty trong trung tâm chăm sóc sức khỏe, chỉ cần nhìn vào cách họ sử dụng phân tích và sao chép nó. Bởi vì đó là một quá trình kinh doanh. Không biết làm thế nào để cảnh sát nó hoặc kiểm toán nó. Điều đó thực sự, đặc biệt là bây giờ rất nhiều công ty phần mềm đã tạo ra các sản phẩm tự động hóa rất nhiều phân tích. Quan điểm về kiểm toán rất quan trọng, khi bạn có một chuyên gia tư vấn hoặc ai đó trên trang web có thể tin cậy để hiểu kết quả của bất kỳ phép tính phân tích nào, đó là một lựa chọn bạn phải đưa ra, nhưng nếu bạn đưa các công cụ phân tích thực sự mạnh mẽ vào bàn tay của những người không hiểu đúng về phân tích, họ có khả năng nhảy đến kết luận có thể không chính xác. Và như tôi đã nói, các công ty không biết cách lập ngân sách cho nó.

Đây là những hương vị của phân tích, tôi sẽ chỉ chạy qua chúng. Phân tích thống kê và mô hình thống kê khác biệt đáng kể so với phân tích dự đoán, hầu hết trong số đó là phù hợp với đường cong. Học máy khác với những điều đó, phân tích đường dẫn và chuỗi thời gian, về cơ bản được thực hiện trên các luồng trạng thái lại khác nhau. Phân tích biểu đồ lại khác nhau và phân tích văn bản và phân tích ngữ nghĩa lại khác nhau. Điều này chỉ chỉ ra rằng đây là một điều rất đa thể loại. Không, bạn không bắt đầu thực hiện phân tích, bạn bắt đầu xem xét các vấn đề bạn gặp phải và tìm kiếm các công cụ khác nhau và các hương vị phân tích khác nhau sẽ phù hợp với các phân tích đó. Và cuối cùng, mạng lưới. Do sự phát triển của phần cứng và phần mềm, theo tôi, phân tích đang ở giai đoạn sơ khai. Vẫn còn rất nhiều điều nữa sẽ đến và chúng ta sẽ thấy nó mở ra trong những năm tới. Tôi nghĩ rằng tôi có thể chuyền bóng cho Dez bây giờ.

Dez Blanchfield: Vâng, nói về một hành động khó theo dõi, Robin. Tôi sẽ đến thăm chủ đề này một thời gian ngắn từ một trong những góc độ yêu thích của tôi, đó là góc độ của con người. Có rất nhiều thay đổi diễn ra trong cuộc sống hàng ngày của chúng ta. Một trong những gián đoạn lớn nhất trong cuộc sống hàng ngày của chúng tôi, hiện tại theo quan điểm của tôi, chỉ là công việc hàng ngày. Quay trở lại làm việc và cố gắng thực hiện công việc bạn thuê, và kỳ vọng ngày càng tăng rằng bạn sẽ chuyển từ một người bình thường thành một siêu anh hùng và lượng thông tin chảy xung quanh các tổ chức và phát ra rất, rất nhanh, đó là một thách thức đáng kể và ngày càng nhiều hơn, chúng tôi phải cung cấp các công cụ tốt hơn và tốt hơn cho mọi người để cố gắng đối phó với luồng kiến ​​thức và thông tin và vì vậy tôi nghĩ tôi đã thử và tìm hiểu điều này từ một góc độ vui vẻ . Tuy nhiên, nó luôn gây ấn tượng với tôi về cách chúng ta có trí tuệ cao siêu hay flash mob, v.v., đó là cách thúc đẩy chúng ta hướng tới những gì chúng ta nói về phân tích nhưng thực sự những gì chúng ta đang nói là cung cấp thông tin cho mọi người, và cho phép họ tương tác với nó và làm theo cách nó tự nhiên và cảm thấy bình thường.

Và trên thực tế, nó làm tôi nhớ đến một video trên YouTube về một đứa trẻ, một đứa bé, đang ngồi trên sàn và nó đang ngồi chơi với một chiếc iPad và nó vỗ xung quanh, véo và bóp và di chuyển hình ảnh và chơi với màn hình, các dữ liệu trên đó. Và sau đó, phụ huynh mang iPad đi và đặt một tạp chí, một tạp chí in trên đùi của trẻ. Và đứa trẻ này có lẽ không quá hai tuổi. Đứa trẻ bắt đầu thử và vuốt bằng màn hình của tạp chí, véo và bóp và tạp chí không phản hồi. Đứa trẻ nhấc ngón tay lên và nhìn nó và nghĩ, Cún Hmm, tôi không nghĩ ngón tay của mình đang hoạt động, và nó tự chọc vào cánh tay và nghĩ rằng, Ah Ah, ngón tay của tôi đang hoạt động tôi có thể cảm nhận được cánh tay của mình và rằng Trông thật tuyệt, và nó vặn vẹo ngón tay, và ngón tay quằn quại và đáp lại. Đúng. Sau đó, nó cố gắng tương tác với tạp chí một lần nữa, và thấp và xem nó không véo và bóp và cuộn. Sau đó, họ mang tạp chí đi và đặt iPad trở lại trong lòng, và bất ngờ điều đó hoạt động. Và đây là một em bé đi cùng và được đào tạo để sử dụng một công cụ phân tích hoặc một công cụ phát trực tiếp để giải trí và nó không thể tìm ra cách một tạp chí nên hoạt động và cách lật trang.

Và đó là một khái niệm thú vị trong chính nó. Nhưng khi tôi nghĩ về kiến ​​thức di chuyển xung quanh các tổ chức, và cách truyền dữ liệu và cách mọi người cư xử, tôi thường nghĩ về khái niệm này về những gì mọi người đã học để trở thành một mob mob, đó là một sự kiện và phương tiện truyền thông xã hội tạo ra Điều này thậm chí còn dễ thực hiện hơn, một ý tưởng như đi đến nơi này vào thời điểm và ngày và hành động, hoặc quay video và học những điệu nhảy này, hoặc đội chiếc mũ màu này và chỉ về phía bắc vào lúc một giờ. Và bạn đẩy nó ra khỏi mạng của mình, và luôn luôn có một khối lượng người, hàng trăm người, xuất hiện ở cùng một nơi cùng một lúc và làm điều này, có một yếu tố đáng kinh ngạc, giống như, con bò thần, đó là thực sự ấn tượng! Thực sự đó là một ý tưởng thực sự đơn giản và một khái niệm đơn giản chỉ cần được đưa ra qua các mạng của chúng tôi và chúng tôi nhận được kết quả này là một điều ấn tượng về mặt trực quan và ấn tượng. Và khi bạn nghĩ về một tổ chức, cách chúng ta muốn mọi người cư xử và cách chúng ta muốn họ đối phó với hệ thống thông tin và khách hàng, điều đó thường đơn giản, đó là một ý tưởng hoặc một khái niệm hoặc một đặc điểm văn hóa hoặc hành vi mà chúng ta cố gắng vượt qua thông qua và trao quyền với các công cụ và thông tin.

Và củng cố tất cả những câu thần chú mà tôi đã có trong hơn hai thập kỷ rưỡi và đó là, nếu nhân viên của bạn không thể tìm thấy những gì họ cần để làm công việc của họ, có thể là công cụ hoặc thông tin, họ sẽ luôn phát minh lại bánh xe. Và vì vậy, đây là một thách thức ngày càng tăng hiện nay, nơi chúng ta có rất nhiều kiến ​​thức và nhiều thông tin và mọi thứ chuyển động rất nhanh, rằng chúng ta muốn ngăn chặn mọi người phát minh lại bánh xe. Và khi chúng tôi nghĩ về môi trường làm việc của chúng tôi, trở lại góc nhìn của mọi người, đó là một trong những sở thích của tôi, tôi đã rất ngạc nhiên khi chúng tôi ngạc nhiên rằng các hình khối không phải là một môi trường thuận lợi cho kết quả tốt, hoặc chúng tôi xếp hàng mọi thứ như thế này hình ảnh ở đây, và nó đã không thay đổi nhiều, chỉ cần hạ thấp các bức tường và gọi chúng là không gian làm việc mở. Nhưng ở giữa với vòng tròn màu vàng xung quanh họ, có hai người trao đổi kiến ​​thức. Tuy nhiên, nếu bạn nhìn vào phần còn lại của căn phòng, tất cả họ đang ngồi đó đập mạnh vào đó, đưa thông tin vào màn hình. Và thường xuyên hơn không, không thực sự trao đổi kiến ​​thức và dữ liệu, và có một số lý do cho điều đó. Nhưng sự tương tác ở giữa sàn bên trái trong vòng tròn màu vàng, có hai người đang trò chuyện ở đó, trao đổi kiến ​​thức và có lẽ đang cố gắng tìm một cái gì đó, cố gắng nói, Bạn có biết báo cáo này ở đâu, tôi đang ở đâu Có thể tìm thấy dữ liệu này, tôi sử dụng công cụ nào để thực hiện việc này? Có thể nó không hoạt động nên họ không có gì, và lang thang trên sàn, phá vỡ quy tắc của không gian văn phòng hình khối và trực tiếp làm điều đó.

Và chúng tôi đã có những môi trường tương tự xung quanh văn phòng mà chúng tôi đùa giỡn, nhưng thực tế là chúng khá mạnh mẽ và hiệu quả. Và một trong những mục yêu thích của tôi là nền tảng phân tích di động hoặc cố định được gọi là máy làm mát nước, nơi mọi người đến đó và trò chuyện xung quanh đó và trao đổi kiến ​​thức, so sánh các ý tưởng và thực hiện phân tích trong khi đứng ở bộ làm mát nước, trao đổi ý tưởng. Chúng là những khái niệm rất mạnh mẽ khi bạn nghĩ về chúng. Và nếu bạn có thể dịch chúng sang hệ thống và công cụ của mình, bạn sẽ nhận được một kết quả tuyệt vời. Và chúng tôi đã có sự yêu thích mọi thời đại, về cơ bản là trung tâm phân phối dữ liệu mạnh nhất của văn phòng, còn được gọi là bàn tiếp tân. Và nếu bạn không thể tìm thấy thứ gì đó, bạn sẽ đi đâu? Chà, bạn đi bộ đến trước văn phòng và bạn đến quầy lễ tân và nói, Bạn có biết x, y, z ở đâu không? Và tôi dám nói với tôi rằng họ đã không làm điều đó ít nhất một lần trong một lần mới công việc hoặc tại một thời điểm khi họ không thể tìm thấy một cái gì đó. Và bạn phải tự hỏi, tại sao họ lại như vậy? Nó nên ở đâu đó trên mạng nội bộ hoặc một số công cụ hoặc bất cứ thứ gì. Nó sẽ dễ dàng để tìm thấy.

Và vì vậy, khi nói đến dữ liệu và phân tích và các công cụ chúng tôi đã cung cấp cho nhân viên của mình để thực hiện công việc của họ và cách con người tương tác với công việc, tôi đã có quan điểm rằng trước sự xuất hiện gần đây của các công cụ phân tích và nền tảng dữ liệu lớn, hoặc xử lý dữ liệu và cũng gọi nó ở trường học cũ, báo cáo và chia sẻ kiến ​​thức khác xa với năng động hoặc hợp tác hoặc mở và khi bạn nghĩ về loại hệ thống mà chúng tôi mong đợi mọi người thực hiện công việc của mình, chúng tôi có cổ điển, bây giờ mọi người gọi là di sản, nhưng thực tế là nó chỉ là di sản và nó vẫn còn ở đây ngày hôm nay, và do đó nó không thực sự là di sản. Nhưng các hệ thống nhân sự và hệ thống ERP truyền thống - quản lý nguồn nhân lực, lập kế hoạch nguồn lực doanh nghiệp, quản lý dữ liệu doanh nghiệp và các hệ thống mà chúng tôi sử dụng để quản lý thông tin để điều hành một công ty. Nó luôn luôn im lặng. Và từ đầu cuối, các nền tảng đơn giản như mạng nội bộ, cố gắng giao tiếp mọi thứ ở đâu và làm thế nào để có được chúng và làm thế nào để tương tác với kiến ​​thức xung quanh. Chúng tôi bật nó lên trên mạng nội bộ của chúng tôi. Nó chỉ tốt như những người dành thời gian và nỗ lực để đưa nó lên đó, nếu không nó sẽ bị bỏ lại trong đầu bạn. Hoặc bạn đã có dữ liệu ở tận cùng của chuỗi thức ăn, tại các SAN của công ty và mọi thứ ở giữa, vì vậy mạng của khu vực lưu trữ chứa đầy các tệp và dữ liệu, nhưng ai biết tìm nó ở đâu.

Thường xuyên hơn không, chúng tôi đã xây dựng các nền tảng dữ liệu đóng hoặc hệ thống khép kín này và vì vậy mọi người đã hoàn nguyên các lượt thích của bảng tính và PowerPoint để truyền thông tin khắp nơi. Nhưng có một điều thú vị diễn ra gần đây, trong đầu tôi, và đó là các thiết bị di động và internet nói chung hoạt động theo ý tưởng rằng mọi thứ thực sự có thể tốt hơn. Và chủ yếu là trong không gian tiêu dùng. Và đó là một điều thú vị mà cuộc sống hàng ngày chúng ta bắt đầu có những thứ như ngân hàng internet. Chúng tôi không phải đến một ngân hàng thực sự để tương tác với họ, chúng tôi có thể làm điều đó qua điện thoại. Ban đầu điều đó thật rắc rối nhưng sau đó internet xuất hiện và chúng tôi đã có một trang web. Bạn có biết, và gần đây bạn đã thực sự đến ngân hàng của mình bao nhiêu lần? Tôi thực sự không thể, tôi đã có một cuộc trò chuyện về điều này vào một ngày khác, và tôi thực sự không thể nhớ lần cuối cùng tôi đến ngân hàng của mình, điều mà tôi đã rất sốc, tôi nghĩ rằng tôi phải có thể nhớ lại điều này, nhưng nó đã quá lâu Trước đây tôi thực sự không thể nhớ khi tôi đến đó. Và vì vậy, giờ đây chúng ta đã có những thiết bị này trong tay dưới dạng điện thoại di động và điện thoại, máy tính bảng và máy tính xách tay, chúng ta có mạng và truy cập vào các công cụ và hệ thống, và không gian người tiêu dùng chúng ta đã học được rằng mọi thứ có thể tốt hơn, nhưng bởi vì về sự thay đổi nhanh chóng trong không gian của người tiêu dùng vốn đã thay đổi lờ mờ và băng giá hơn trong doanh nghiệp và môi trường, chúng tôi đã không luôn thay đổi điều đó sang cuộc sống làm việc hàng ngày.

Và tôi thích chọc vào sự thật rằng bạn không thể truyền dữ liệu trực tiếp lên bản cứng. Trong hình ảnh này ở đây có một người đang xem một số phân tích đã được thực hiện và có một biểu đồ đẹp được tạo ra bởi một người nào đó có thể được trả rất nhiều tiền như một nhà thống kê hoặc chuyên gia tính toán, và họ đang ngồi đó cố gắng làm phân tích trên một bản cứng và chọc vào nó. Nhưng đây là điều đáng sợ đối với tôi: Chẳng hạn, những người trong phòng họp này và tôi sẽ sử dụng điều này như một ví dụ, họ đang tương tác với dữ liệu hiện là lịch sử. Và nó đã cũ từ khi thứ đó được sản xuất và sau đó được in, vì vậy có lẽ đó là một báo cáo cũ. Bây giờ họ đang đưa ra quyết định về không quá nhiều dữ liệu xấu nhưng dữ liệu cũ, luôn luôn có thể là dữ liệu xấu. Họ đang đưa ra quyết định ngày hôm nay dựa trên một cái gì đó mang tính lịch sử, đó là một nơi thực sự tồi tệ. Chúng tôi đã cố gắng thay thế bản cứng đó bằng máy tính bảng và điện thoại vì chúng tôi đã xử lý rất nhanh trong không gian của người tiêu dùng và bây giờ chúng tôi đã xử lý nó trong không gian doanh nghiệp, rằng thời gian thực là hiểu biết sâu sắc là giá trị thời gian thực.

Và chúng ta đang ngày càng tốt hơn ở đó. Và nó đưa tôi đến điểm mà Robin nêu ra trước đó, đó là khái niệm của nhà khoa học dữ liệu công dân và động lực của khái niệm này. Đối với tôi, một nhà khoa học dữ liệu công dân chỉ là những người bình thường với các công cụ và thông tin phù hợp về sở thích của iPad. Họ không phải làm toán, họ không phải biết thuật toán, họ không phải biết cách áp dụng thuật toán và quy tắc dữ liệu, họ chỉ cần biết cách sử dụng giao diện. Và điều đó đưa tôi trở lại với lời giới thiệu của tôi và khái niệm về đứa trẻ đang ngồi đó với iPad so với tạp chí, so với iPad. Trẻ mới biết đi có thể học rất nhanh, trực giác cách sử dụng giao diện của iPad để tìm hiểu thông tin và tương tác với nó, mặc dù có thể là trò chơi hoặc phát trực tuyến phương tiện hoặc video. Nhưng nó không thể nhận được phản hồi hoặc tương tác tương tự từ một thanh tạp chí và chỉ nhấp nháy trang sau trang này, điều này không hấp dẫn lắm, đặc biệt nếu bạn là một đứa trẻ mới biết đi đã lớn lên với iPad. Lúc nào cũng vậy, con người có thể nhìn và học rất nhanh cách lái các công cụ và những thứ mà nếu chúng ta chỉ cung cấp cho họ, và nếu chúng ta cung cấp cho họ một giao diện như thiết bị di động và đặc biệt là máy tính bảng và điện thoại thông minh có màn hình đủ lớn và đặc biệt là nếu bạn có thể tương tác trong liên lạc, với chuyển động ngón tay, tất cả bất ngờ bạn nhận được khái niệm này của một nhà khoa học dữ liệu công dân.

Một người có thể áp dụng khoa học dữ liệu với các công cụ phù hợp, nhưng không thực sự phải biết cách thực hiện. Và trong tâm trí tôi rất nhiều điều này, như tôi đã nói, được thúc đẩy bởi ảnh hưởng của người tiêu dùng, điều đó đã chuyển và chuyển thành nhu cầu và doanh nghiệp. Một vài ví dụ thực sự nhanh chóng. Chúng tôi, nhiều người trong chúng tôi sẽ bắt đầu làm mọi thứ với blog và trang web của mình, chẳng hạn như đặt ít quảng cáo hoặc xem theo dõi và chuyển động, chúng tôi đã sử dụng các công cụ như Google Analytics và chúng tôi đã nhận ra rằng trong blog và các trang web nhỏ của chúng tôi, chúng tôi có thể đặt một ít mã vào đó và Google sẽ cung cấp cho chúng tôi thông tin chi tiết theo thời gian thực về việc ai truy cập trang web, khi nào và ở đâu và như thế nào. Và trong thời gian thực, chúng ta thực sự có thể thấy mọi người truy cập trang web, lướt qua các trang và sau đó biến mất. Và nó thật đáng kinh ngạc. Tôi vẫn thích làm điều đó, khi tôi cố gắng giải thích các phân tích thời gian thực cho mọi người, tôi chỉ cho họ xem một trang web có Google Analytics được cắm và thực sự thấy sự tương tác trực tiếp với những người truy cập trang web và hỏi họ, Hãy tưởng tượng nếu bạn đã có những hiểu biết sâu sắc về doanh nghiệp của mình trong thời gian thực.

Lấy một ví dụ bán lẻ, và có thể là dược phẩm, tôi nghĩ bạn gọi nó là một cửa hàng dược phẩm ở Mỹ, một hiệu thuốc nơi bạn bước vào và mua tất cả mọi thứ từ máy tính bảng đau đầu cho đến kem chống nắng và mũ. Cố gắng điều hành tổ chức đó mà không có thông tin thời gian thực là một khái niệm đáng sợ bây giờ chúng ta biết những gì chúng ta biết. Ví dụ: bạn có thể đo lưu lượng chân, bạn có thể đặt các thiết bị xung quanh cửa hàng với một mặt cười ở một bên của màn hình vì bạn đang hạnh phúc, và một màu đỏ không vui ở phía xa bên phải và một số sắc thái khác nhau ở giữa. Và có một nền tảng được gọi là vui hoặc không phải là những ngày này, khi bạn bước vào một cửa hàng và bạn có thể đập vào mặt vui hay mặt buồn, tùy thuộc vào phản hồi tình cảm của khách hàng trực tiếp của bạn. Và điều đó có thể tương tác với thời gian thực. Bạn có thể nhận được giá theo nhu cầu trực tiếp. Nếu có nhiều người ở đó, bạn có thể tăng giá lên một chút và bạn có thể cung cấp hàng tồn kho và nói với mọi người, ví dụ - các hãng hàng không, chẳng hạn, sẽ cho mọi người biết có bao nhiêu chỗ ngồi hiện có trên trang web khi bạn Khi đặt vé máy bay, bạn không chỉ cần quay số ngẫu nhiên và hy vọng bạn có thể bật lên và nhận chuyến bay. Dữ liệu nhân sự trực tiếp, bạn có thể biết khi nào mọi người đang bật và tắt. Mua sắm, nếu bạn đang mua sắm và bạn có dữ liệu trực tiếp, bạn có thể làm những việc như chờ đợi trong một giờ và chống lại giá của đồng đô la Mỹ để mua khối lượng chứng khoán tiếp theo của bạn và có một khối lượng xe tải tăng lên.

Khi tôi cho mọi người xem Google Analytics và tôi chuyển tiếp loại giai thoại đó, khoảnh khắc eureka này, khoảnh khắc này, một khoảnh khắc này, bóng đèn này tắt trong tâm trí họ, như Hmm, tôi có thể thấy rất nhiều nơi tôi có thể làm điều đó . Giá như tôi có các công cụ và nếu tôi có quyền truy cập vào kiến ​​thức đó. Thì Và bây giờ chúng ta đang thấy điều này trên phương tiện truyền thông xã hội. Bất cứ ai là người dùng phương tiện truyền thông xã hội hiểu biết ngoài việc chỉ hiển thị hình ảnh về bữa sáng của họ, có xu hướng xem số lượt thích họ nhận được và lưu lượng truy cập họ nhận được và số lượng bạn bè họ nhận được, và họ làm điều đó với thích, giả sử, Twitter là một công cụ phân tích. Bạn có thể truy cập Twitter.com để sử dụng công cụ, nhưng bạn nhập vào Google Twitter Analytics dot com hoặc nhấp vào nút trên cùng bên phải và kéo xuống menu và thực hiện, bạn sẽ có được các biểu đồ trực tiếp đẹp này cho bạn biết có bao nhiêu tweets bạn đang tự làm và có bao nhiêu tương tác với chúng. Và phân tích thời gian thực chỉ trên phương tiện truyền thông xã hội cá nhân của bạn. Hãy tưởng tượng nếu chúng ta có những người thích Google Analytics, Facebook và LinkedIn và Twitter, số liệu thống kê của eBay đến với bạn, nhưng trong môi trường làm việc của bạn.

Bây giờ chúng ta đã có loại web và thiết bị di động trực tiếp trong tầm tay, nó trở thành một khái niệm quyền lực. Và điều đó thu hút tôi đến kết luận của tôi, và điều đó luôn luôn là tôi thấy rằng các tổ chức tận dụng công cụ và công nghệ sớm, họ có được lợi thế đáng kể so với các đối thủ cạnh tranh mà các đối thủ cạnh tranh thực sự không bao giờ có thể bắt kịp. Và chúng ta đang thấy điều đó với sự xung đột của nhà khoa học dữ liệu công dân. Nếu chúng ta có thể mang đến cho mọi người những kỹ năng, kiến ​​thức mà chúng ta đã thuê họ và chúng ta có thể cung cấp cho họ những công cụ phù hợp, đặc biệt là khả năng xem dữ liệu thời gian thực và khám phá dữ liệu và biết nó ở đâu mà không phải đi bộ xung quanh các khối và đặt câu hỏi thành tiếng, phải đi và đứng ở chỗ làm mát nước để làm một số phân tích so sánh với mọi người hoặc đi và hỏi người tiếp tân xem chỉ số ở đâu. Nếu họ có thể làm điều đó trong tầm tay và họ có thể mang nó đến các cuộc họp với họ và ngồi trong phòng họp lướt qua màn hình trong thời gian thực chứ không phải là bản cứng, tất cả đều bất ngờ chúng tôi trao quyền cho nhân viên của chúng tôi, những người không cần thực tế các nhà khoa học dữ liệu, nhưng để thực sự sử dụng khoa học dữ liệu và mang lại kết quả tuyệt vời cho các tổ chức. Và tôi nghĩ rằng điểm bùng phát này chúng ta thực sự đã vượt qua khi người tiêu dùng được đưa vào doanh nghiệp, thách thức là làm thế nào để chúng ta cung cấp cho doanh nghiệp đó và đó là chủ đề tôi đoán về cuộc thảo luận hôm nay. Và với điều đó, tôi sẽ gói lại mảnh của mình và bàn giao để nghe cách chúng ta có thể giải quyết điều đó. David, qua cho bạn.

David Sweenor: Được rồi, cảm ơn các bạn rất nhiều, và cảm ơn Robin. Bạn biết đấy, Robin, tôi đồng ý với đánh giá ban đầu của bạn. Quá trình phân tích, nó thực sự không khác gì phát triển phần mềm. Tôi nghĩ rằng thách thức trong một tổ chức thực sự là, bạn biết đấy, có thể mọi thứ không được xác định rõ ràng, có lẽ có một thành phần khám phá cho nó và một thành phần sáng tạo cho nó. Và Dez, bạn biết đấy, tôi đồng ý với bạn, có rất nhiều phát minh lại bánh xe, và bạn biết đấy, không có một tổ chức nào mà tôi đi vào ngày hôm nay, bạn hỏi, tại sao bạn lại làm theo cách này? Tại sao doanh nghiệp chạy theo cách này? Và thật dễ để đặt câu hỏi, và rất nhiều lần khi bạn ở trong một tổ chức, thật khó để thay đổi. Tôi yêu sự tương tự, sự tiêu dùng của mọi thứ. Và vì vậy, không còn khi tôi đến sân bay và muốn thay đổi chỗ ngồi của mình - tôi làm điều đó trên điện thoại di động của mình. Tôi không phải đến đại lý tại gian hàng và xem đại lý đó gõ một cái gì đó trên màn hình đơn sắc trong 15 phút để thay đổi chỗ ngồi của mình. Tôi chỉ thích làm điều đó trên điện thoại của mình, và đó là một sự phát triển thú vị.

Hôm nay, chúng ta sẽ nói một chút về trí tuệ tập thể. Đối với những người không biết, Statistica là một nền tảng phân tích hàng đầu, đã tồn tại hơn 30 năm. Nếu bạn xem bất kỳ ấn phẩm nào trong ngành phân tích, nó luôn được đưa lên hàng đầu như một trong những gói phần mềm phân tích nâng cao trực quan và dễ sử dụng nhất. Vì vậy, chúng tôi đã dành vài năm qua để nghiên cứu một khái niệm gọi là trí tuệ tập thể và chúng tôi đang đưa nó lên một tầm cao mới. Tôi muốn bắt đầu cuộc trò chuyện này với: làm thế nào để công việc được thực hiện trong tổ chức của bạn?

Và có hai hình ảnh ở đây. Hình bên trái là hình ảnh từ những năm 1960 và tôi đã không bắt đầu sự nghiệp của mình vào những năm 1960, nhưng hình ảnh bên phải là - đó là một nhà máy bán dẫn nơi tôi bắt đầu làm việc. Và tôi làm việc trong tòa nhà màu đen đó, tầng thượng màu đen ở phía trên bên trái. Nhưng họ đã tạo ra chất bán dẫn. Đây là một hình ảnh gần đây từ Google Images. Nhưng khi bạn quay lại hình ảnh những năm 1960 ở bên trái, điều đó rất thú vị. Bạn có những người này đang xếp hàng, và họ đang tạo ra các mạch và chất bán dẫn tích hợp. Nhưng có một tiêu chuẩn hóa, có một cách tiêu chuẩn để làm mọi thứ và đã có một quy trình được xác định rõ ràng. Bạn biết đấy, có lẽ vì những người này đều ngồi trong một môi trường mở, có lẽ đã có sự hợp tác. Tôi nghĩ rằng chúng ta đã mất một chút trong số đó trong lực lượng lao động tri thức.

Khi tôi ngồi trong tòa nhà đó ở phía trên bên trái, nếu tôi muốn cộng tác với ai đó, nó sẽ không mở. Có những văn phòng này, có lẽ một số người trong nhóm ở xa, hoặc có lẽ tôi phải đi bộ trong khuôn viên này; đó là 25 phút đi bộ và tôi phải nói chuyện với ai đó trong tòa nhà ở phía bên phải. Tôi nghĩ rằng chúng tôi đã mất một cái gì đó trên đường đi. Và vì vậy, bạn biết đấy, tôi cũng có suy nghĩ tương tự, tại sao mọi người - có bao nhiêu người tiếp tục phát minh lại bánh xe trong tổ chức của bạn? Tôi nghĩ, bạn biết đấy, các tổ chức nói chung đã làm rất tốt trong những năm 1990 và 2000 với CRM và lưu trữ dữ liệu, và ở một mức độ BI. Vì một số lý do, các phân tích đã bị trễ một chút. Có sự đầu tư đáng kể vào kho dữ liệu, và tiêu chuẩn hóa, và bình thường hóa dữ liệu của bạn, và tất cả điều này, và CRM, nhưng phân tích đã bị chậm trễ vì một số lý do. Và tôi đang tự hỏi tại sao. Có thể có một sáng tạo - có thể quy trình của bạn không được xác định rõ ràng, có thể bạn không biết quyết định hoặc đòn bẩy nào mà bạn đang cố gắng biến, bạn biết, trong doanh nghiệp của bạn để thay đổi mọi thứ. Khi chúng ta đi vào các tổ chức ngày nay, có rất nhiều người làm mọi thứ rất thủ công trong bảng tính.

Và bạn biết đấy, tôi đã xem một chỉ số sáng nay, tôi nghĩ rằng nó cho biết 80, 90 phần trăm bảng tính có lỗi và một số trong số này có thể rất đáng kể. Giống như người trong Whale, nơi JPMorgan Chase bị mất hàng tỷ và hàng tỷ đô la do lỗi bảng tính. Vì vậy, tôi có tiền đề tôi nghĩ, phải có một cách tốt hơn để hoàn thành công việc. Và như chúng tôi đã đề cập, chúng tôi có những nhà khoa học dữ liệu này. Những kẻ này đắt tiền, và họ rất khó tìm. Và đôi khi họ là một con vịt kỳ lạ. Nhưng tôi nghĩ, bạn biết đấy, nếu tôi phải tóm tắt một nhà khoa học dữ liệu là gì, thì đó có lẽ là người hiểu dữ liệu. Tôi nghĩ đó là người hiểu toán, người hiểu vấn đề. Và thực sự, một người có thể truyền đạt kết quả. Và nếu bạn là một nhà khoa học dữ liệu, bạn rất may mắn ngay bây giờ, bởi vì tiền lương của bạn có thể đã tăng gấp đôi trong vài năm qua.

Nhưng sự thật là, rất nhiều tổ chức, họ không có những nhà khoa học dữ liệu này, nhưng tổ chức của bạn có những người thông minh. Bạn có một tổ chức, bạn có rất nhiều người thông minh và họ sử dụng bảng tính. Bạn biết đấy, thống kê và toán học không phải là công việc chính của họ, nhưng họ sử dụng dữ liệu để thúc đẩy doanh nghiệp tiến lên. Thực sự, thách thức mà chúng tôi đang giải quyết là, bạn sẽ làm thế nào, nếu bạn may mắn có được một nhà khoa học dữ liệu hoặc một nhà thống kê hoặc hai, làm thế nào bạn có thể thực hiện chúng và làm thế nào bạn có thể cải thiện sự hợp tác giữa những người đó và các cá nhân khác trong tổ chức của bạn? Nếu chúng ta xem loại tổ chức của chúng ta được cấu trúc như thế nào, tôi sẽ bắt đầu và tôi sẽ đi từ phải sang trái. Và tôi biết điều này là ngược, nhưng chúng tôi có dòng người dùng doanh nghiệp này.

Đây là phần lớn dân số công nhân tri thức của bạn và đối với những người này, bạn cần nhúng các phân tích vào dòng ứng dụng kinh doanh của mình. Có lẽ họ đang nhìn thấy đầu ra phân tích trên màn hình trung tâm cuộc gọi hoặc một cái gì đó, và nó nói với họ lời đề nghị tốt nhất tiếp theo để cung cấp cho khách hàng. Có thể đó là người tiêu dùng hoặc nhà cung cấp trên một cổng thông tin web và nó ngay lập tức mang lại cho họ tín dụng hoặc những thứ tương tự. Nhưng ý tưởng là, họ đang tiêu thụ phân tích. Nếu chúng ta đi đến giữa, đây là những công nhân tri thức. Đây là những người đang làm mọi thứ với bảng tính ngày hôm nay, nhưng bảng tính dễ bị lỗi và đến một lúc nào đó họ hết xăng. Những nhà khoa học dữ liệu công dân, như chúng ta gọi họ, bạn biết đấy, những gì chúng ta đang cố gắng làm cho họ thực sự làm tăng mức độ tự động hóa.

Và bạn nghe được với các phân tích rằng 80 đến 90 phần trăm công việc nằm trong phần chuẩn bị dữ liệu và đó không phải là toán học thực sự, mà là phần chuẩn bị dữ liệu. Chúng tôi đang cố gắng tự động hóa điều đó, cho dù bạn làm điều đó, và chúng tôi có trình hướng dẫn và mẫu và những thứ có thể tái sử dụng và bạn không thực sự phải có kiến ​​thức về cơ sở hạ tầng bên dưới trong môi trường của mình. Và sau đó nếu chúng ta nhìn về phía bên trái, chúng ta có những nhà khoa học dữ liệu này. Và như tôi đã đề cập, họ đang thiếu. Và những gì chúng tôi đang cố gắng làm để làm cho chúng hiệu quả hơn, là cho phép họ tạo ra những thứ mà các nhà khoa học dữ liệu công dân này có thể làm. Hãy nghĩ về nó giống như một khối Lego, vì vậy những nhà khoa học dữ liệu này có thể tạo ra một tài sản có thể tái sử dụng mà một nhà khoa học dữ liệu công dân có thể sử dụng. Xây dựng nó một lần, vì vậy chúng tôi không phải tiếp tục phát minh lại bánh xe.

Và sau đó, những kẻ này có thể lo lắng về việc liệu chúng ta có thể làm mọi thứ trong cơ sở dữ liệu và tận dụng các khoản đầu tư công nghệ hiện có mà công ty bạn đã thực hiện. Bạn biết đấy, không có ý nghĩa gì trong thời đại ngày nay để xáo trộn dữ liệu trên khắp thế giới. Vì vậy, nếu chúng ta nhìn vào Statistica, như tôi đã đề cập, đó là một nền tảng đã tồn tại khá lâu. Và nó là một sản phẩm rất sáng tạo. Trộn dữ liệu, không có nguồn dữ liệu mà chúng tôi không thể truy cập. Chúng tôi có tất cả những điều khám phá và trực quan hóa dữ liệu mà bạn mong đợi; chúng ta có thể làm điều đó trong thời gian thực. Và nó có thể có - Tôi nghĩ rằng có hơn 16.000 chức năng phân tích trong công cụ phần mềm, vì vậy đó là toán học nhiều hơn tôi từng có thể sử dụng hoặc hiểu, nhưng nó ở đó nếu bạn cần.

Chúng tôi có khả năng kết hợp cả quy tắc kinh doanh và quy trình công việc phân tích để thực sự đưa ra quyết định kinh doanh. Bạn sẽ vượt ra ngoài, đây là một thuật toán, đây là một quy trình công việc, nhưng bạn có các quy tắc kinh doanh mà bạn luôn phải đối phó. Chúng tôi rất an toàn trong quản trị. Chúng tôi được sử dụng trong rất nhiều khách hàng dược phẩm, trong đó FDA tin tưởng chúng tôi. Bạn biết đấy, chỉ cần bằng chứng trong pudding rằng chúng tôi có quyền kiểm soát và khả năng kiểm toán để được họ chấp nhận. Và cuối cùng, bạn biết đấy, chúng tôi mở và linh hoạt và có thể mở rộng, vì vậy bạn cần tạo một nền tảng, đó là bạn muốn các nhà khoa học dữ liệu của bạn làm việc hiệu quả, bạn muốn các nhà khoa học dữ liệu công dân của bạn làm việc hiệu quả, bạn muốn có thể để triển khai các đầu ra phân tích này cho các công nhân trong tổ chức của bạn.

Nếu chúng ta xem nó, đây là một ví dụ về một số hình ảnh. Nhưng việc có thể phân phối đầu ra phân tích của bạn cho người dùng doanh nghiệp, vì vậy ví dụ đầu tiên ở bên trái, đó là sơ đồ phân tích mạng. Và có lẽ bạn là một nhà điều tra gian lận và bạn không biết những kết nối này được tạo ra như thế nào và đây có thể là những người, đây có thể là những thực thể, đây có thể là hợp đồng, bất cứ điều gì thực sự. Nhưng bạn có thể thao tác điều này bằng chuột và tương tác với nó để thực sự hiểu - nếu bạn là một nhà điều tra gian lận, để hiểu danh sách ưu tiên của những người cần điều tra, vì bạn không thể nói chuyện với mọi người, vì vậy bạn có ưu tiên.

Nếu chúng ta nhìn vào hình ảnh ở phía bên phải ở đó, đối với bảng điều khiển bảo trì dự đoán, đây là một vấn đề thực sự thú vị. Có lẽ bạn là chủ sở hữu của một sân bay và bạn có những máy quét cơ thể ở đó. Những máy quét cơ thể này, nếu bạn đi đến một sân bay, có một số thành phần trong đó có thời hạn sử dụng khoảng chín tháng. Và những thứ này thực sự, thực sự đắt tiền. Nếu tôi có nhiều điểm vào, nhiều máy quét trong sân bay của tôi, số một tôi muốn đảm bảo rằng tôi có nhân viên phù hợp ở mỗi cổng và đối với các bộ phận trong máy quét, tôi cũng không muốn đặt hàng chúng sớm, và tôi muốn có chúng trước khi nó bị hỏng. Chúng tôi có khả năng, có thể nếu bạn sở hữu một sân bay, để có thể dự đoán khi nào những điều này sẽ phá vỡ và dự đoán mức độ nhân viên.

Nếu chúng ta nhìn ở phía dưới bên phải, thì đây là nếu bạn đang ở trong môi trường sản xuất, đây chỉ là một biểu diễn đồ họa của quy trình sản xuất. Và hơi khó nhìn, nhưng có đèn giao thông màu đỏ và xanh lục trên các lĩnh vực xử lý khác nhau này, và vì vậy nếu tôi là kỹ sư, có toán học rất phức tạp ở đó, nhưng tôi có thể đi sâu vào lĩnh vực xử lý cụ thể đó và xem xét các tham số và đầu vào đó, có thể khiến điều đó nằm ngoài tầm kiểm soát. Nếu chúng ta nhìn vào nhà khoa học dữ liệu công dân, mục tiêu của chúng ta thực sự là làm cho nhà khoa học dữ liệu công dân dễ dàng. Chúng tôi có trình hướng dẫn và mẫu, và một điều tôi nghĩ thực sự thú vị, là chúng tôi có nút kiểm tra sức khỏe dữ liệu tự động này. Và thực sự những gì nó làm, nó có tích hợp thông minh.

Tôi đã đề cập đến việc chuẩn bị dữ liệu - phải mất một khoảng thời gian đáng kể, cả về tổng hợp dữ liệu và chuẩn bị dữ liệu. Nhưng giả sử tôi có dữ liệu của mình, tôi có thể chạy nó qua nút kiểm tra sức khỏe dữ liệu này và nó kiểm tra tính bất biến, độ thưa thớt và ngoại lệ, và tất cả những thứ này, nó điền vào các giá trị bị thiếu và nó thực hiện rất nhiều phép toán Tôi không hiểu, vì vậy tôi có thể chấp nhận mặc định hoặc nếu tôi thông minh hơn một chút, tôi có thể thay đổi chúng. Nhưng vấn đề là, chúng tôi muốn tự động hóa quá trình đó. Điều này thực hiện khoảng 15 kiểm tra và kết quả khác nhau trên một tập dữ liệu được làm sạch. Những gì chúng tôi đang làm là làm cho mọi người dễ dàng hơn để tạo ra các quy trình công việc này.

Đây là nơi chúng ta đang nói về sự hợp tác giữa các nhà khoa học dữ liệu và nhà khoa học dữ liệu công dân. Nếu chúng ta nhìn vào những hình ảnh bên phải, chúng ta sẽ thấy quy trình chuẩn bị dữ liệu này. Và có thể điều này rất tinh vi, có thể đây là nước sốt bí mật của công ty bạn, tôi không biết, nhưng chúng tôi biết ai đó trong tổ chức của bạn có thể truy cập vào một hoặc nhiều silo dữ liệu mà chúng tôi có. Chúng tôi cần một cách để, số một, lấy chúng và ghép chúng lại với nhau, và số hai, có thể chúng tôi muốn xử lý đặc biệt, đó là vượt quá kiểm tra sức khỏe dữ liệu của chúng tôi và đó là nước sốt bí mật của công ty bạn. Tôi có thể tạo quy trình công việc này trong tổ chức của chúng tôi và nó sụp đổ như một nút. Bạn thấy mũi tên chỉ xuống, nó chỉ là một nút và chúng ta có thể có hàng trăm thứ này trong một tổ chức. Ý tưởng là, chúng ta có những người biết điều gì đó về một không gian nhất định, họ có thể tạo ra một quy trình công việc và người khác có thể sử dụng lại điều đó. Chúng tôi đang cố gắng giảm thiểu sự tái phát minh của bánh xe.

Và chúng ta có thể làm điều tương tự với quy trình mô hình hóa phân tích. Trong trường hợp này ở bên phải, quy trình công việc này, có thể có 15 thuật toán khác nhau và tôi muốn chọn một thuật toán tốt nhất cho nhiệm vụ. Và tôi không cần phải là một nhà khoa học dữ liệu công dân, những gì đang xảy ra trong mạng nhện đó, nhưng nó chỉ sụp đổ vào một nút, và có lẽ nút đó chỉ đơn giản là, tính toán điểm rủi ro tín dụng. của một trang web phẫu thuật nhiễm trùng, những gì có bạn. Là một nhà khoa học dữ liệu công dân, tôi có thể sử dụng toán học rất tinh vi này mà một người khác đã xây dựng, có thể một trong những nhà khoa học dữ liệu này đã xây dựng trong tổ chức của tôi.

Từ góc độ khoa học dữ liệu, bạn biết đấy, tôi đã nói chuyện với các nhà khoa học dữ liệu thích viết mã và tôi đã nói chuyện với các nhà khoa học dữ liệu ghét viết mã. Và điều đó tốt, vì vậy chúng tôi có một giao diện người dùng đồ họa rất trực quan. Chúng tôi có thể lấy dữ liệu của mình, chúng tôi có thể kiểm tra sức khỏe dữ liệu tự động và có thể tôi muốn viết mã. Tôi thích Python, tôi thích R, nhưng ý tưởng là, các nhà khoa học dữ liệu này, họ đang bị thiếu hụt và họ thích mã trong một ngôn ngữ cụ thể. Chúng tôi đặc biệt không có sở thích về ngôn ngữ mà bạn muốn viết mã, vì vậy nếu bạn muốn làm R, hãy thực hiện R; nếu bạn muốn làm Python, hãy làm Python. Thật tuyệt. Nếu bạn muốn phân tích phân tích của mình sang Azure, hãy phân tích phân tích của bạn lên đám mây. Và vì vậy, mục tiêu ở đây thực sự là cung cấp sự linh hoạt và các tùy chọn để làm cho các nhà khoa học dữ liệu của bạn hiệu quả nhất có thể.

Bây giờ các nhà khoa học dữ liệu, họ là những người khá thông minh, nhưng có lẽ họ không phải là chuyên gia về mọi thứ và có thể có một số lỗ hổng trong những gì họ có thể làm. Và nếu bạn nhìn ra trong ngành, có rất nhiều thị trường phân tích khác nhau tồn tại ngoài kia. Đây là một ví dụ về, có lẽ tôi cần phải thực hiện nhận dạng hình ảnh và tôi không có kỹ năng đó, có lẽ tôi đi ra Thuật toán và nhận được thuật toán nhận dạng hình ảnh. Có lẽ tôi đi ra Apervita và nhận được một thuật toán chăm sóc sức khỏe rất đặc biệt. Có lẽ tôi muốn sử dụng một cái gì đó trong thư viện máy học Azure. Có lẽ tôi muốn sử dụng một cái gì đó trong nền tảng Statistica bản địa.

Một lần nữa, ý tưởng ở đây là chúng tôi muốn tận dụng cộng đồng phân tích toàn cầu. Bởi vì bạn sẽ không có tất cả các kỹ năng trong bốn bức tường của mình, vì vậy làm thế nào chúng ta có thể tạo ra phần mềm - và đây là những gì chúng ta đang làm - cho phép các nhà khoa học dữ liệu của bạn sử dụng thuật toán từ nhiều thị trường khác nhau. Chúng tôi đã làm điều đó với R và Python trong một thời gian dài, nhưng điều này đang mở rộng điều đó đến các thị trường ứng dụng tồn tại ngoài đó. Và giống như bạn thấy ở đây trên đỉnh này, chúng tôi đang sử dụng H2O trên Spark, vì vậy có rất nhiều thuật toán phân tích ở đó. Bạn không cần phải tập trung vào việc tạo ra chúng từ đầu, hãy sử dụng lại những thứ sống trong cộng đồng nguồn mở và chúng tôi muốn những người này làm việc hiệu quả nhất có thể.

Bước tiếp theo, sau khi chúng tôi có các nhà khoa học dữ liệu công dân và nhà khoa học dữ liệu của chúng tôi, thực sự là làm thế nào để bạn quảng bá và bạn phân phối các thực tiễn tốt nhất này? Chúng tôi có công nghệ trong phần mềm của chúng tôi cho phép bạn phân phối phân tích ở bất cứ đâu. Và đây là một quan điểm quản lý mô hình nhiều hơn, nhưng tôi không còn bị ràng buộc bởi bốn bức tường hoặc một cài đặt cụ thể trong Tulsa hoặc Đài Loan hoặc California, hoặc những gì có bạn. Đây là một nền tảng toàn cầu và chúng tôi có nhiều, rất nhiều khách hàng được triển khai trong nhiều trang web.

Và thực sự, điều quan trọng là, nếu bạn đang làm gì đó ở Đài Loan và bạn muốn sao chép nó ở Brazil, điều đó thật tuyệt. Đi vào đó, lấy các mẫu có thể tái sử dụng, lấy các quy trình công việc mà bạn muốn. Điều này đang cố gắng tạo ra những tiêu chuẩn đó, và cách làm việc chung, vì vậy chúng tôi không làm mọi thứ hoàn toàn khác nhau ở mọi nơi. Và thành phần quan trọng khác của điều này, thực sự là chúng tôi muốn đưa toán học đến nơi dữ liệu sống. Bạn không phải xáo trộn dữ liệu giữa, bạn biết, California và Tulsa, Đài Loan và Brazil. Chúng tôi có công nghệ cho phép chúng tôi đưa toán học vào dữ liệu và chúng tôi sẽ có một webcast Công nghệ nóng khác về chủ đề đó.

Nhưng chúng tôi gọi kiến ​​trúc này và đây là một cái nhìn lén, Kiến trúc phân phối bản địa phân tán. Ý tưởng chính đằng sau điều này là chúng ta có một nền tảng, Statistica và tôi có thể xuất một quy trình phân tích dưới dạng nguyên tử. Và tôi có thể làm một mô hình, hoặc toàn bộ quy trình công việc, vì vậy điều đó không thành vấn đề. Nhưng tôi có thể tạo cái này và xuất nó bằng ngôn ngữ phù hợp với nền tảng đích. Ở phía bên trái của điều này, rất nhiều người làm điều này, nhưng họ thực hiện ghi điểm trong hệ thống nguồn. Điều đó tốt, chúng tôi có thể ghi điểm và chúng tôi có thể xây dựng mô hình trong cơ sở dữ liệu, vì vậy điều đó thật thú vị.

Và sau đó ở phía bên phải, chúng ta có Boomi. Đây là một công nghệ đồng hành, chúng tôi làm việc với tất cả những thứ này. Nhưng chúng ta cũng có thể thực hiện các quy trình công việc này, và về cơ bản vận chuyển nó đến bất cứ nơi nào trên thế giới. Bất cứ điều gì có địa chỉ IP. Và tôi không phải cài đặt Statistica trên đám mây công cộng hoặc riêng tư. Bất cứ điều gì có thể chạy JVM, chúng ta có thể chạy các quy trình công việc phân tích, quy trình chuẩn bị dữ liệu này hoặc chỉ các mô hình trên bất kỳ nền tảng đích nào trong số này. Cho dù đó là trong đám mây công cộng hay riêng tư của tôi, cho dù đó là trong máy kéo, xe hơi, nhà của tôi, bóng đèn của tôi, internet của tôi, chúng tôi có công nghệ cho phép bạn vận chuyển những quy trình công việc đó đến bất cứ nơi nào trên thế giới.

Hãy xem lại. Bạn biết đấy, chúng tôi có dòng người dùng doanh nghiệp, vì vậy những người này, chúng tôi có công nghệ cho phép họ tiêu thụ đầu ra ở định dạng mà họ thấy thoải mái. Chúng tôi có các nhà khoa học dữ liệu công dân, và những gì chúng tôi đang cố gắng làm là cải thiện sự hợp tác, biến họ thành một nhóm, phải không? Và vì vậy chúng tôi muốn mọi người ngừng phát minh lại bánh xe. Và chúng tôi có những nhà khoa học dữ liệu này, có thể có một lỗ hổng kỹ năng ở đó, nhưng họ có thể viết mã bằng ngôn ngữ họ muốn, họ có thể đi đến các thị trường phân tích và sử dụng thuật toán ở đó. Và với điều này, làm thế nào bạn có thể không nghĩ rằng mọi thứ đều tuyệt vời với điều này? Điều này là hoàn hảo, đây là những gì chúng tôi đang làm. Chúng tôi đang xây dựng các quy trình công việc có thể tái sử dụng, chúng tôi đang hướng dẫn mọi người, chúng tôi sẽ cung cấp cho họ các khối Lego để họ có thể xây dựng các lâu đài hùng mạnh này và bất cứ điều gì họ muốn làm. Tóm lại, chúng tôi có một nền tảng trao quyền cho người dùng doanh nghiệp, nhà khoa học dữ liệu công dân, nhà khoa học dữ liệu lập trình viên - chúng tôi có thể giải quyết bất kỳ trường hợp sử dụng phân tích cạnh IoT nào và chúng tôi đang cho phép khái niệm về trí tuệ tập thể này. Với điều đó, tôi nghĩ có lẽ chúng ta sẽ mở nó ra cho câu hỏi.

Robin Bloor: Được rồi. Tôi nghĩ điều đầu tiên - ý tôi là, thành thật mà nói, ý tôi là tôi đã được Dell Statistica tóm tắt trước đó, và thành thật mà nói tôi thực sự khá ngạc nhiên về những điều mà tôi không biết rằng bạn đã đưa ra trong bài thuyết trình . Và tôi phải nói rằng, có một điều, đó là một lỗi đã xảy ra với tôi trong quá trình áp dụng phân tích, đó là, bạn biết đấy, có được các công cụ không, bạn biết không? Có rất nhiều công cụ ngoài kia, có các công cụ nguồn mở, vân vân và vân vân, và có nhiều thứ khác nhau, cái mà tôi gọi là bán nền tảng. Nhưng tôi nghĩ rằng sự khác biệt mà bạn có, tôi đặc biệt ấn tượng với một số quy trình làm việc.

Nhưng sự khác biệt là bạn dường như cung cấp kết thúc để kết thúc. Giống như phân tích là một quy trình kinh doanh phức tạp bắt đầu bằng việc thu thập dữ liệu và sau đó trải qua một loạt các bước, tùy thuộc vào mức độ biến đổi của dữ liệu, và sau đó nó có thể phân nhánh trong một loạt các cuộc tấn công toán học khác nhau tại dữ liệu. Và sau đó, kết quả xuất hiện theo cách này hay cách khác và những điều đó cần phải là hành động. Có một số lượng lớn các phân tích tôi đã đi qua nơi có rất nhiều công việc tuyệt vời đã được thực hiện nhưng không có gì để thực hiện. Và bạn dường như có rất nhiều những gì cần thiết. Tôi không biết mức độ toàn diện của nó, nhưng nó toàn diện hơn tôi mong đợi. Tôi vô cùng ấn tượng với điều đó.

Tôi muốn bạn nhận xét về bảng tính. Bạn đã nói điều gì đó, nhưng một trong những điều tôi đã lưu ý và tôi đã lưu ý trong nhiều năm qua, nhưng nó ngày càng trở nên rõ ràng hơn, đó là có rất nhiều bảng tính là hệ thống bóng tối và tôi thực sự nghĩ rằng Ý tôi là bảng tính, nó là một công cụ tuyệt vời khi được giới thiệu và nó thật tuyệt vời kể từ nhiều cách khác nhau, nhưng nó là một công cụ tổng quát, nó không thực sự phù hợp với mục đích. Nó chắc chắn không tốt lắm trong bối cảnh BI và tôi nghĩ nó thật tồi tệ trong bối cảnh phân tích. Và tôi tự hỏi nếu bạn có một số nhận xét để đưa ra, giả sử, ví dụ, nơi bạn biết, Statistica đã tuôn ra, sử dụng bảng tính quá mức, hoặc bất kỳ nhận xét nào bạn muốn đưa ra về điều đó?

David Sweenor: Vâng tôi nghĩ rằng, bạn biết đấy, bạn có thể tìm kiếm những lỗi bảng tính nổi tiếng. Google hoặc bất kỳ công cụ tìm kiếm nào bạn đang sử dụng sẽ quay lại với một loạt kết quả. Tôi không nghĩ rằng, bạn biết đấy, chúng tôi sẽ thay thế bảng tính. Đó không phải là ý định của chúng tôi, nhưng rất nhiều tổ chức mà tôi tham gia, có một vài trong số các pháp sư bảng tính hoặc ninja hoặc bất cứ điều gì bạn muốn gọi cho họ, nhưng họ có những bảng tính rất tinh vi này và bạn phải nghĩ, điều gì xảy ra khi những điều này xảy ra mọi người giành được xổ số và họ không quay trở lại? Và vì vậy, những gì chúng tôi đang cố gắng làm là, chúng tôi biết bảng tính sẽ tồn tại để chúng tôi có thể sử dụng chúng, nhưng tôi nghĩ những gì chúng tôi đang cố gắng là phát triển một cách trực quan về quy trình làm việc của bạn để có thể hiểu và chia sẻ với người khác . Bảng tính khá khó, khá khó chia sẻ. Và ngay sau khi bạn chuyển bảng tính của bạn cho tôi, tôi đã thay đổi nó và bây giờ chúng tôi không đồng bộ và chúng tôi nhận được các câu trả lời khác nhau. Những gì chúng tôi đang cố gắng làm là đặt một số rào cản xung quanh điều này và làm cho mọi thứ hiệu quả hơn một chút. Và bảng tính thực sự khủng khiếp khi kết hợp nhiều bộ dữ liệu lại với nhau, bạn biết không? Họ rơi xuống đó. Nhưng chúng tôi sẽ không thay thế chúng, chúng tôi ăn chúng và chúng tôi có những người bắt đầu thay đổi bởi vì nếu chúng tôi có một nút nói rằng tính toán rủi ro, đó là điều mà người sử dụng bảng tính đang cố gắng thực hiện. Vì vậy, những người đã biến mất.

Robin Bloor: Vâng, ý tôi là, tôi sẽ nói rằng, bạn biết đấy, từ một trong những quan điểm mà tôi nhìn vào mọi thứ, tôi nói rằng bảng tính là tuyệt vời để tạo thông tin. Chúng thậm chí còn tuyệt vời để tạo ra các đảo kiến ​​thức, nhưng chúng thực sự tệ khi chia sẻ kiến ​​thức. Họ không có cơ chế để làm điều đó, và nếu bạn chuyển một bảng tính cho ai đó, không giống như bạn có thể đọc nó giống như một bài viết giải thích chính xác những gì họ đang làm. Nó chỉ không có ở đó. Tôi nghĩ, bạn biết đấy, điều khiến tôi ấn tượng nhất về bài thuyết trình và về khả năng của Statistica, nó dường như không thể tin được. Nhưng nó có luồng này chạy qua luồng công việc. Tôi có đúng không khi cho rằng bạn có thể xem xét một quy trình công việc từ đầu đến cuối, bạn biết, từ việc thu thập dữ liệu cho đến khi nhúng kết quả vào các ứng dụng BI cụ thể hoặc thậm chí chạy các ứng dụng?

David Sweenor: Vâng, hoàn toàn. Và nó có khả năng kết thúc và một số tổ chức sử dụng toàn bộ điều đó, và tôi không hề ảo tưởng rằng bất kỳ công ty nào ngày nay mua mọi thứ từ một nhà cung cấp. Chúng tôi có một sự pha trộn. Một số người sử dụng Statistica cho mọi thứ và một số người sử dụng nó cho quy trình mô hình hóa, một số người sử dụng nó cho quy trình chuẩn bị dữ liệu. Một số người sử dụng nó để phân phối hàng trăm báo cáo kỹ thuật cho các kỹ sư. Và vì vậy chúng tôi có mọi thứ ở giữa. Và nó thực sự là đầu cuối và, bạn biết đấy, một nền tảng bất khả tri, trong đó nếu có các thuật toán mà bạn muốn sử dụng trong R hoặc Python, Azure, Apervita, bất cứ điều gì, bạn biết, hãy sử dụng chúng. Điều đó thật tuyệt, hãy làm việc hiệu quả, sử dụng những gì bạn biết, sử dụng những gì bạn thấy thoải mái và chúng tôi có các cơ chế để đảm bảo những điều đó được kiểm soát và kiểm toán được và tất cả những thứ đó.

Robin Bloor: Tôi đặc biệt thích khía cạnh đó của nó. Ý tôi là, tôi không biết liệu bạn có thể nói vượt ra ngoài những gì bạn đã nói với sự giàu có của những gì ngoài kia không. Ý tôi là, tôi đã xem xét điều này nhưng tôi đã không nhìn nó một cách toàn diện và chắc chắn có một lượng lớn thư viện Python trong thư viện của chúng tôi nhưng bạn có thể thêm gì vào bức tranh đó không? Bởi vì tôi nghĩ đó là một điều rất thú vị, bạn biết đấy, ý tưởng rằng bạn sẽ có những thành phần đáng tin cậy, bởi vì bạn biết nhiều người đã tạo ra chúng và những người khác nhau đang sử dụng chúng mà bạn có thể tải xuống. Bạn biết đấy, bạn có thể làm phong phú những gì bạn đã nói về điều đó?

David Sweenor: Vâng, tôi nghĩ rằng một số thị trường ứng dụng, bạn biết đấy, các thị trường thuật toán nằm ngoài đó. Ví dụ, bạn biết đấy, Tiến sĩ John Cromwell tại Đại học Iowa, ông đã phát triển một mô hình sẽ dự đoán, được sử dụng trong thời gian thực trong khi chúng tôi được phẫu thuật, sẽ cho bạn điểm nếu bạn sẽ đạt được nhiễm trùng phẫu thuật. Và nếu số điểm đó đủ cao, họ sẽ can thiệp ngay vào phòng mổ. Thật là thú vị. Vì vậy, có lẽ có một bệnh viện khác không lớn như vậy. Chà, Apervita là một thị trường ứng dụng sức khỏe để phân tích. Bạn có thể đi tìm một trong rất nhiều chợ ứng dụng này, bạn có thể đi tìm và sử dụng lại chúng, và giao dịch là giữa bạn và bất cứ ai sở hữu nó, nhưng bạn có thể đi tìm một hoặc bạn có thể nói, đó là những gì tôi cần. Tôi nghĩ rằng nó khai thác cộng đồng toàn cầu đó bởi vì mọi người ngày nay là một chuyên gia và bạn không thể biết tất cả mọi thứ. Tôi nghĩ R và Python là một thứ nhưng ý tưởng này, tôi muốn thực hiện chức năng này, đặt một thông số kỹ thuật trên một trong những nơi thị trường ứng dụng này và nhờ ai đó phát triển nó cho bạn. Tôi nghĩ họ có thể kiếm tiền từ nó. điều đó rất thú vị và rất khác so với hoàn toàn mô hình nguồn mở.

Robin Bloor: Được rồi. Dù sao, tôi sẽ chuyền bóng cho Dez. Bạn có muốn lặn xuống không, Dez?

Dez Blanchfield: Hoàn toàn và tôi muốn ở lại trên bảng tính chỉ trong giây lát vì tôi nghĩ rằng nó đã nắm bắt được ý chính của rất nhiều điều chúng ta đang nói ở đây. Và bạn đã đưa ra một nhận xét, Robin, liên quan đến việc chuyển từ loại bảng tính cũ ở dạng vật lý sang dạng điện tử. Chúng tôi đã có một điều thú vị diễn ra ở đó, bạn biết đấy, khi bảng tính ban đầu là một thứ chúng chỉ là những tờ giấy với các hàng và cột và bạn sẽ tự viết ra mọi thứ, sau đó bạn sẽ xử lý và tính toán chúng, bằng cách thực hiện nó ra khỏi đỉnh đầu của bạn hoặc với một số thiết bị khác. Nhưng chúng ta vẫn có cơ hội mắc lỗi với các lỗi viết tay hoặc chứng khó đọc và bây giờ chúng ta đã thay thế nó bằng lỗi chính tả. Rủi ro là với bảng tính, hồ sơ rủi ro nhanh hơn và lớn hơn, nhưng tôi nghĩ các công cụ như Statistica đảo ngược kim tự tháp rủi ro.

Tôi thường vẽ bức tranh này trên một tấm bảng trắng hình con người ở trên cùng, như một người, và sau đó là một bộ sưu tập của họ ở phía dưới, giả sử, hãy tưởng tượng mười người trong số họ ở dưới cùng của bảng trắng đó, và tôi vẽ kim tự tháp nơi điểm của kim tự tháp ở một người và dưới chân kim tự tháp là bộ sưu tập của mọi người. Và tôi sử dụng điều này để hình dung ý tưởng rằng nếu một người ở trên cùng làm bảng tính mắc lỗi và chia sẻ nó với mười người, và bây giờ chúng tôi đã có mười bản sao lỗi. Hãy cẩn thận với các macro của bạn và rất cẩn thận với Visual Basic nếu bạn sẽ chuyển sang đó. Bởi vì khi chúng tôi xây dựng các công cụ điện tử như bảng tính thì nó rất mạnh, nhưng nó cũng mạnh mẽ theo hướng tốt và xấu.

Tôi nghĩ rằng các công cụ như Statistica mang lại khả năng đảo ngược hồ sơ rủi ro đó và đó là bây giờ bạn có thể đi đến điểm mà bạn có rất nhiều công cụ có sẵn cho từng người và khi họ đi từ rất nhiều công cụ ở đầu kim tự tháp và sau đó xuống tận cùng nơi mà điểm của kim tự tháp đang bị đảo ngược là công cụ thực tế, nếu chúng ta có một nhóm người đang xây dựng những công cụ đó và các thuật toán đó. Và nhà khoa học dữ liệu không cần phải là chuyên gia phân tích hồi quy trên dữ liệu của họ. Họ có thể có thể sử dụng công cụ này, nhưng bạn có thể có năm hoặc sáu nhà thống kê và chuyên gia tính toán và một nhà khoa học dữ liệu và một số nhà toán học làm việc trên công cụ đó, mô-đun đó, thuật toán đó, trình cắm đó và theo cách nói của bảng tính, vì vậy hãy tưởng tượng rằng mọi bảng tính được xuất bản mà bạn có thể sử dụng thực sự được viết bởi các chuyên gia đã kiểm tra các macro, đã kiểm tra Visual Basic, đảm bảo các thuật toán hoạt động, vì vậy khi bạn nhận được nó, bạn có thể bật dữ liệu vào nhưng bạn thực sự không thể phá vỡ nó và do đó tốt hơn là kiểm soát.

Tôi nghĩ rằng rất nhiều công cụ phân tích đang làm điều đó. Tôi đoán rằng đến lúc đó, bạn đang thấy điều đó trong lĩnh vực này, bạn có thấy sự chuyển đổi từ bảng tính có khả năng gây ra lỗi và sai lầm và rủi ro, đến điểm mà các công cụ mà bạn đang xây dựng với nền tảng bây giờ, với việc phát hiện dữ liệu là chính xác trong thời gian thực và những người đang xây dựng các mô-đun và thuật toán đang loại bỏ hoặc giảm hồ sơ rủi ro đó? Là dịch vụ khách hàng nhìn thấy điều đó theo nghĩa thực hay bạn nghĩ điều đó chỉ xảy ra và họ không nhận ra điều đó?

David Sweenor: Bạn biết đấy, tôi nghĩ có một vài cách để trả lời điều này. Nhưng những gì chúng ta đang thấy là, trong bất kỳ tổ chức nào, và tôi đã đề cập rằng các phân tích mà tôi nghĩ có thể bị tụt lại từ góc độ đầu tư của công ty, giống như những gì chúng ta đã làm với kho dữ liệu và CRM. Nhưng những gì chúng ta đang thấy, vì vậy, cần rất nhiều để thay đổi một tổ chức, để vượt qua quán tính của tổ chức đó. Nhưng những gì chúng ta đang thấy là mọi người lấy bảng tính của họ, lấy quy trình công việc của họ và tôi đã đề cập đến bảo mật và quản trị, thì Vâng, có lẽ tôi có một bảng tính, xông vào, tôi có thể khóa nó và tôi có thể kiểm soát phiên bản này. chúng tôi thấy rất nhiều tổ chức, có lẽ họ chỉ bắt đầu từ đó. Và nếu nó thay đổi, có một quy trình công việc và cuối cùng tôi sẽ đi, số một, ai đã thay đổi nó? Tại sao họ thay đổi nó. Khi họ thay đổi nó. Và tôi cũng có thể thiết lập một quy trình công việc sao cho tôi sẽ không đưa bảng tính mới này vào sản xuất trừ khi nó được xác thực và xác minh bởi một, hai, ba, tuy nhiên nhiều bên bạn muốn xác định trong quy trình làm việc của mình. Tôi nghĩ mọi người đang bắt đầu thực hiện, và các tổ chức bắt đầu thực hiện những bước đi nhỏ bé ở đó, nhưng tôi có thể đề nghị chúng ta phải đi một chặng đường dài.

Dez Blanchfield: Thật vậy và tôi nghĩ rằng nếu bạn xây dựng cả hai biện pháp kiểm soát an ninh và quản trị ở đó, thì khối lượng công việc có thể tự động ánh xạ đến và mọi thứ cho đến nhân viên rủi ro chính, giờ là một điều. Bạn có thể bắt đầu kiểm soát cách các công cụ và hệ thống đó được truy cập và ai đang làm gì với chúng, vì vậy điều đó rất mạnh mẽ. Tôi nghĩ rằng những thứ khác xuất hiện ở đây là các loại công cụ bạn cung cấp, đối với tôi, cho vay đối với hành vi của con người hơn là các bảng tính truyền thống mà chúng ta đang nói đến, nếu tôi có một phòng đầy người với cùng một bảng điều khiển và truy cập vào cùng một dữ liệu mà họ thực sự có thể có một cái nhìn khác và do đó, có được những hiểu biết hơi khác nhau từ cùng một thông tin, phù hợp với nhu cầu của họ để họ có thể cộng tác. Sau đó, chúng tôi có quan điểm và tương tác nhân văn hơn với doanh nghiệp và quá trình ra quyết định, trái ngược với tất cả sẽ đến cùng một cuộc họp với cùng một PowerPoint và cùng một bảng tính được in ra, tất cả cùng một dữ liệu cố định.

Bạn có thấy sự chuyển đổi trong hành vi và văn hóa trong các tổ chức sắp xếp các công cụ của bạn bây giờ khi họ thấy điều đó đang diễn ra, nơi không giống như năm người trong phòng đang nhìn vào cùng một bảng tính đang cố gắng xác minh bằng lời nói và ghi chú về nó, nhưng bây giờ họ thực sự tương tác với bảng điều khiển và công cụ trong thời gian thực, với trực quan hóa và phân tích trong tầm tay và nhận được một luồng hoàn toàn khác nhau về cuộc trò chuyện và tương tác, không chỉ trong các cuộc họp mà chỉ là sự hợp tác chung quanh tổ chức? Bởi vì họ có thể làm điều đó theo thời gian thực, bởi vì họ có thể đặt câu hỏi và nhận được câu trả lời thực sự. Đó có phải là một xu hướng bạn đang thấy vào lúc này hay chưa xảy ra?

David Sweenor: Không, tôi nghĩ rằng nó chắc chắn đã bắt đầu con đường đó và tôi nghĩ điều rất thú vị là, bạn biết đấy, nếu chúng ta lấy ví dụ về một nhà máy chẳng hạn. Có thể ai đó sở hữu một khu vực quy trình cụ thể trong nhà máy đó họ muốn xem xét và tương tác với dữ liệu này theo một cách nhất định. Và có lẽ tôi, nhìn ra tất cả các quy trình, có thể cái này ở phía dưới, có lẽ tôi muốn xem xét nó trên tất cả mọi thứ. Tôi nghĩ những gì chúng ta đang thấy là, số một, mọi người bắt đầu sử dụng một tập hợp trực quan hóa hoặc trực quan hóa tiêu chuẩn trong các tổ chức của họ, nhưng nó cũng phù hợp với vai trò của họ. Nếu tôi là kỹ sư xử lý, có thể đó là một quan điểm rất khác so với những người nhìn nó từ góc độ chuỗi cung ứng và tôi nghĩ điều đó thật tuyệt vì nó phải được điều chỉnh và nó phải được nhìn qua lăng kính mà bạn cần hoàn thành công việc.

Dez Blanchfield: Tôi đoán quá trình ra quyết định đi xuống, thời gian và tốc độ, để thực sự đưa ra quyết định thông minh và chính xác cũng tăng nhanh, phải không? Bởi vì nếu bạn có phân tích thời gian thực, bảng điều khiển thời gian thực, nếu bạn có công cụ Statistica trong tầm tay, bạn không phải chạy trên sàn để đi và hỏi ai đó về điều gì đó, bạn đã có nó trong bản cứng. Bạn có thể hợp tác, tương tác và thực sự đưa ra quyết định nhanh chóng và nhận được kết quả đó ngay lập tức. Mà tôi nghĩ rằng một số công ty thực sự chưa nắm bắt được, nhưng khi họ làm điều đó sẽ là khoảnh khắc eureka này, vâng, chúng tôi vẫn có thể ở trong tủ của mình và làm việc tại nhà, nhưng chúng tôi có thể tương tác và hợp tác và những quyết định đó chúng tôi thực hiện khi chúng tôi hợp tác biến thành kết quả ngay lập tức. Hãy nhìn xem, tôi nghĩ thật tuyệt vời khi nghe những gì bạn đã nói cho đến nay và tôi thực sự mong muốn được xem nó đi đâu. Và tôi biết rằng chúng tôi đã có rất nhiều câu hỏi trong phần hỏi đáp, vì vậy tôi sẽ chạy trở lại Rebecca để chạy qua một số câu hỏi để chúng tôi có thể đến với những câu hỏi đó nhanh nhất có thể. Cảm ơn rât nhiều.

Rebecca Jozwiak: Cảm ơn Dez, và vâng Dave, chúng tôi có khá nhiều câu hỏi từ khán giả. Và cảm ơn Dez và Robin vì những hiểu biết của bạn, quá. Tôi biết người tham gia đặc biệt này đã phải nghỉ việc vào đầu giờ, nhưng cô ấy hỏi, bạn có thấy các bộ phận hệ thống thông tin ưu tiên kiểm soát dữ liệu tinh vi hơn là thoải mái trong việc cung cấp công cụ cho Những người lao động tri thức? Ý tôi là, đó là - đi trước.

David Sweenor: Vâng, tôi nghĩ nó phụ thuộc vào tổ chức. Tôi nghĩ rằng một ngân hàng, một công ty bảo hiểm, có thể họ có những ưu tiên và cách làm khác nhau, so với một tổ chức tiếp thị. Tôi đoán tôi sẽ phải nói rằng nó chỉ phụ thuộc vào ngành và chức năng bạn đang xem xét. Các ngành công nghiệp khác nhau có trọng tâm và nhấn mạnh khác nhau.

Rebecca Jozwiak: Được rồi, điều đó có ý nghĩa. Và sau đó một người tham dự khác muốn biết, động cơ đằng sau Statistica là gì? Có phải C ++ hoặc công cụ của riêng bạn?

David Sweenor: Chà, tôi không biết liệu tôi có thể hiểu được điều đó hay không vì nó đã tồn tại được 30 năm và nó đã được phát triển trước thời của tôi nhưng có một thư viện cốt lõi của các thuật toán phân tích là thuật toán Statistica chạy. Và bạn thấy ở đây chúng ta cũng có thể chạy R, chúng ta có thể chạy Python, chúng ta có thể chạy sang Azure, chúng ta có thể chạy trên Spark ở H2O, vì vậy tôi đoán rằng tôi sẽ phải trả lời câu hỏi đó, đó là một loạt các công cụ. Và tùy thuộc vào thuật toán bạn chọn, nếu đó là thuật toán Statistica, nó chạy như thế này, nếu bạn chọn một thuật toán trên H2O và Spark, thì nó sử dụng thuật toán đó, và do đó, đó là một loạt các thuật toán.

Rebecca Jozwiak: Được rồi tốt. Một loại người tham dự khác được hỏi cụ thể chỉ vào slide này, muốn biết, loại, làm thế nào để nhà khoa học dữ liệu công dân biết sử dụng các mẫu có thể tái sử dụng? Và tôi đoán tôi sẽ loại câu hỏi rộng hơn ra khỏi đó. Rằng, bạn đang thấy gì khi người dùng trong ngành kinh doanh hoặc nhà phân tích kinh doanh đến và họ muốn sử dụng các công cụ này, việc họ có thể dễ dàng lấy và chạy như thế nào?

David Sweenor: Tôi đoán tôi sẽ trả lời rằng và nếu bạn có thể sử dụng, nếu bạn quen thuộc với Windows, thì đây là một nền tảng dựa trên Windows, vì vậy tôi đã cắt bỏ phần trên của các ảnh chụp màn hình này, nhưng nó có dải băng Windows. Nhưng làm thế nào để họ biết quy trình làm việc để sử dụng? Nó trông giống như Windows Explorer, vì vậy có cấu trúc cây và bạn có thể định cấu hình nó và thiết lập nó tuy nhiên tổ chức của bạn muốn thiết lập nó. Nhưng có thể, bạn sẽ chỉ có các thư mục này và bạn sẽ đặt các mẫu có thể sử dụng lại này trong các thư mục này. Và tôi nghĩ rằng có lẽ có một danh pháp mà công ty của bạn có thể áp dụng, giả sử đây là hồ sơ rủi ro tính toán, ở đây là các dữ liệu nhận được từ các nguồn này và bạn đặt tên cho chúng bất cứ điều gì bạn muốn. Đây chỉ là một thư mục miễn phí, bạn chỉ cần kéo các ghi chú ra trên khung vẽ của mình. Vì vậy, khá dễ dàng.

Rebecca Jozwiak: Được rồi tốt. Có thể là một bản demo lần sau. Sau đó, một người tham dự khác đưa ra, và đó là những gì bạn và Robin và Dez đang nói về sự không chính xác, đặc biệt là trên bảng tính, nhưng rác / rác ra ngoài, và anh ta thấy nó còn nghiêm trọng hơn khi nói đến để phân tích. Loại đề cập rằng, bạn biết, lạm dụng dữ liệu thực sự có thể dẫn đến một số quyết định không may. Và anh ấy tự hỏi những quan điểm của bạn về sự phát triển của các thuật toán không an toàn hơn, tôi đoán, anh ấy sử dụng từ này, sử dụng các phân tích quá mức. Bạn biết đấy, có ai đó bước vào, họ thực sự phấn khích, họ muốn thực hiện các phân tích nâng cao này, họ muốn chạy các thuật toán nâng cao này, nhưng có lẽ họ không chắc chắn lắm. Vì vậy, bạn làm gì để loại bảo vệ chống lại điều đó?

David Sweenor: Vâng, vì vậy tôi đoán tôi sẽ trả lời điều này tốt nhất có thể, nhưng tôi nghĩ mọi thứ đều thuộc về con người, quy trình và công nghệ. Chúng tôi có công nghệ giúp kích hoạt mọi người và giúp kích hoạt bất kỳ quy trình nào bạn muốn đưa vào trong tổ chức của mình. Trong ví dụ về việc gửi phiếu giảm giá cho ai đó, có thể điều đó không quan trọng và nếu đó là kỹ thuật số thì thực sự không mất phí, có thể có một cấp độ kiểm soát bảo mật và có thể chúng tôi không quan tâm. Nếu tôi dự đoán nhiễm trùng vết mổ, có lẽ tôi muốn cẩn thận hơn một chút về điều đó. Hoặc nếu tôi dự đoán chất lượng và an toàn thuốc và những thứ tương tự, có lẽ tôi muốn cẩn thận hơn một chút về điều đó. Bạn nói đúng, rác vào / đổ rác, vì vậy những gì chúng tôi cố gắng làm là cung cấp một nền tảng cho phép bạn điều chỉnh nó theo bất kỳ quy trình nào mà tổ chức của bạn muốn áp dụng.

Rebecca Jozwiak: Được rồi tốt. Tôi có một vài câu hỏi nữa, nhưng tôi biết rằng chúng tôi đã đi khá nhiều giờ và tôi chỉ muốn nói với những người thuyết trình của chúng tôi, điều đó thật tuyệt vời. Và chúng tôi muốn cảm ơn rất nhiều Dave Sweenor từ Dell Statistica. Tất nhiên, Tiến sĩ Robin Bloor và Dez Blanchfield, cảm ơn bạn đã trở thành nhà phân tích ngày hôm nay. Chúng tôi sẽ có một webcast khác vào tháng tới với Dell Statistica. Tôi biết Dave loại gợi ý về chủ đề này. Nó sẽ là về phân tích ở rìa, một chủ đề hấp dẫn khác, và tôi biết rằng một số trường hợp sử dụng rất hấp dẫn sẽ được thảo luận trên webcast đó. Nếu bạn thích những gì bạn thấy ngày hôm nay, hãy quay lại để biết thêm vào tháng tới. Và với điều đó, folks, tôi chào tạm biệt bạn. Cám ơn rất nhiều. Tạm biệt.

Phân tích nhúng ở mọi nơi: cho phép nhà khoa học dữ liệu công dân