Q:
Tại sao điều quan trọng đối với các nhà khoa học dữ liệu là tìm kiếm sự minh bạch?
A:Tính minh bạch về cơ bản rất quan trọng trong các dự án khoa học dữ liệu và các chương trình học máy, một phần vì sự phức tạp và tinh vi thúc đẩy chúng - bởi vì các chương trình này là Học học Hồi (tạo ra kết quả xác suất) thay vì làm theo các hướng dẫn lập trình tuyến tính được xác định trước, và vì kết quả là, có thể khó hiểu làm thế nào công nghệ đang đi đến kết luận. Vấn đề hộp đen của Martin về các thuật toán học máy không thể giải thích đầy đủ cho những người ra quyết định của con người là một vấn đề lớn trong lĩnh vực này.
Với ý nghĩ đó, việc có thể thành thạo việc học máy có thể giải thích được hoặc AI có thể giải thích được AI sẽ có thể là trọng tâm chính trong cách các công ty theo đuổi việc mua lại nhân tài cho một nhà khoa học dữ liệu. Đã DARPA, tổ chức mang đến cho chúng ta internet, đang tài trợ cho một nghiên cứu trị giá hàng triệu đô la về AI có thể giải thích được, cố gắng thúc đẩy các kỹ năng và tài nguyên cần thiết để tạo ra các công nghệ máy học và trí tuệ nhân tạo minh bạch cho con người.
Một cách để nghĩ về điều đó là thường có giai đoạn biết đọc biết viết về phát triển tài năng và một giai đoạn siêu văn hóa của người Hồi giáo. Đối với một nhà khoa học dữ liệu, giai đoạn biết chữ truyền thống sẽ là kiến thức về cách kết hợp các chương trình học máy và cách xây dựng các thuật toán với các ngôn ngữ như Python; làm thế nào để xây dựng mạng lưới thần kinh và làm việc với chúng. Giai đoạn siêu tiêu chuẩn sẽ là khả năng làm chủ AI có thể giải thích, cung cấp tính minh bạch trong việc sử dụng thuật toán học máy và duy trì tính minh bạch khi các chương trình này hoạt động hướng tới mục tiêu và mục tiêu của người xử lý.
Một cách khác để giải thích tầm quan trọng của tính minh bạch trong khoa học dữ liệu là các bộ dữ liệu đang được sử dụng tiếp tục trở nên tinh vi hơn và do đó có khả năng xâm nhập vào cuộc sống của mọi người. Một động lực chính khác của học máy và khoa học dữ liệu có thể giải thích là Quy định bảo vệ dữ liệu chung châu Âu đã được triển khai gần đây để cố gắng hạn chế sử dụng dữ liệu cá nhân một cách phi đạo đức. Sử dụng GDPR làm trường hợp thử nghiệm, các chuyên gia có thể thấy nhu cầu giải thích các dự án khoa học dữ liệu phù hợp với mối quan tâm về quyền riêng tư và bảo mật, cũng như đạo đức kinh doanh như thế nào.
