Q:
Tại sao trực quan hóa dữ liệu hữu ích cho các thuật toán học máy?
A:Kỷ luật trực quan hóa dữ liệu cho chúng ta những cách thực tế vô hạn để thể hiện những gì đang xảy ra với các thuật toán học máy. Thật đáng suy nghĩ về lý do chính xác tại sao trực quan hóa dữ liệu lại quan trọng đến vậy và tại sao nó giải phóng rất nhiều sức mạnh sáng tạo cho rất nhiều người đang tham gia vào các quá trình học máy.
Để hiểu giá trị của trực quan hóa dữ liệu cho máy học, chỉ cần xem bất kỳ thuật toán nào được sử dụng để tạo ra các chương trình đột phá và sáng tạo này.
Một trong những đơn giản nhất là cây quyết định. Không đi vào các hàm kích hoạt hoặc các lớp ẩn hoặc bất cứ thứ gì tương tự, cây quyết định chỉ đơn giản là tập hợp các nút nhị phân. Nhưng ngay cả cây quyết định đơn giản cũng rất khó để mọi người mô tả hoặc viết về nó. Nó dễ dàng hơn nhiều khi được hiển thị trên màn hình hoặc trên một trang. Khi bạn thấy mỗi nút và các kết nối của nó với các nút khác, toàn bộ mọi thứ trở nên rõ ràng.
Bây giờ chúng ta hãy lấy một trong những loại thuật toán học máy công phu và phức tạp nhất - mạng lưới thần kinh.
Theo một số cách, mạng lưới thần kinh thực sự là bộ sưu tập các thuật toán học máy. Thiết lập cơ bản bao gồm một lớp đầu vào, các lớp ẩn và một lớp đầu ra. Các chức năng kích hoạt giúp các nơ-ron kỹ thuật số riêng lẻ xử lý các đầu vào có trọng số.
Tất cả các mục này và tất cả các quy trình này được giải thích dễ dàng hơn nhiều thông qua trực quan hóa dữ liệu so với thông qua mô tả bằng lời nói hoặc bằng văn bản. Bạn có thể nói rằng một mạng nơ ron có các đầu vào có trọng số chảy vào một lớp đầu vào và chúng kết hợp thành một lớp ẩn và hợp nhất thành một đầu ra nhất định, nhưng khi bạn sử dụng một hình ảnh trực quan để cho thấy cách thức hoạt động của nó, mắt người và con người não bám vào đó theo cách trực tiếp và hữu ích hơn nhiều.
Theo một nghĩa nào đó, bạn có thể thấy sức mạnh của trực quan hóa dữ liệu ngay cả khi không tính đến việc học máy. Quay trở lại thời kỳ lập trình tuyến tính, trình biên dịch và phòng thu ngôn ngữ máy tính sẽ cho các lập trình viên lựa chọn thiết lập chương trình kiểm tra từng bước trong đó họ có thể kiểm tra các giá trị của các biến trong các hộp trực quan nhỏ. Một lần nữa, điều này đã giúp cho thấy những gì xảy ra trong một thực thi tốt hơn nhiều so với việc chỉ đọc qua một cơ sở mã.
Học máy là lập trình siêu chuyên sâu - đó là lập trình xác suất và đó là lý do tại sao trực quan hóa dữ liệu thực sự giúp chúng ta hiểu được những gì đang xảy ra với bất kỳ thuật toán hoặc quy trình cụ thể nào.