Q:
Tại sao số lượng lớn các tệp hình ảnh quan trọng đối với nhiều dự án máy học?
A:Đối với các công ty đang tìm cách tham gia vào các khoản đầu tư máy học (ML) đầu tiên của họ, toàn bộ quá trình có thể có vẻ hơi khó hiểu và bí truyền. Đối với nhiều người, thật khó để hình dung cách thức học máy thực sự hoạt động và chính xác những gì nó sẽ làm cho một doanh nghiệp.
Trong một số trường hợp, ai đó đang nghiên cứu về máy học có thể có một bản hùng ca khi họ xem xét tại sao số lượng lớn tệp hình ảnh, được thu thập vào các thùng chứa kỹ thuật số gọn gàng, lại rất quan trọng đối với các dự án ML. Đó là vì khái niệm "tệp hình ảnh" giúp trực quan hóa ML. Suy nghĩ về điều này cho phép chúng ta hiểu thêm về cách các loại công nghệ này sẽ sớm được áp dụng vào thế giới của chúng ta.
Tải xuống miễn phí: Machine Learning và Why It Matters |
Câu trả lời ngắn gọn là số lượng lớn tệp hình ảnh này rất quan trọng đối với máy học vì chúng đại diện cho các tập huấn luyện - bộ dữ liệu ban đầu mà máy tính phải làm việc khi nó học. Nhưng có một chút nhiều hơn thế. Tại sao hình ảnh rất có giá trị?
Một lý do mà hình ảnh rất có giá trị là các nhà khoa học đã đạt được nhiều tiến bộ trong xử lý hình ảnh. Nhưng ngoài ra, họ cũng đã đạt được tiến bộ trong việc giúp máy móc xác định kết quả dựa trên những gì trong một bức tranh.
Ví dụ, bất cứ ai đã nghe về các mạng cứng đầu sâu với cả hai công cụ phân biệt và phân biệt đều hiểu một chút về cách máy tính có thể đọc và hiểu dữ liệu và hình ảnh trực quan. Họ không đọc các pixel như họ đã từng làm - họ thực sự "nhìn thấy" hình ảnh và các thành phần nhận dạng. Ví dụ: nghĩ về nhận dạng khuôn mặt của Facebook - máy tính tìm hiểu bạn trông như thế nào và nhận dạng bạn bằng hình ảnh - cũng như những người xung quanh bạn. Điều này thường được thực hiện thông qua việc tổng hợp nhiều hình ảnh và đào tạo lặp để tạo nền tảng cho một dự án máy học.
Khi các bên liên quan đã xác định một kế hoạch và khái niệm, và đi ra ngoài và thu thập tất cả các hình ảnh có liên quan, và đưa chúng vào các thuật toán học máy, họ có thể tận dụng sức mạnh to lớn của trí tuệ nhân tạo để điều hành các quy trình kinh doanh.
Một công ty có thể gửi một trình thu thập dữ liệu web lên internet để tìm kiếm những bức ảnh có thể chứa một khách hàng cụ thể, để xây dựng một tệp cho thấy danh tính của khách hàng đó và sở thích và xu hướng của họ. Công ty thậm chí có thể sử dụng thông tin này để tự động hóa thư trực tiếp hoặc tiếp thị trực tiếp khác. Khi bạn bắt đầu nghĩ về nó như thế này, thật dễ dàng để thấy quá trình nhận dạng và nhận dạng hình ảnh đó có thể được gắn với tất cả các loại chức năng sẽ cho phép máy tính thực hiện rất nhiều việc mà con người đã từng làm cho tất cả lịch sử ghi lại của chúng tôi. Lấy ví dụ về nghiên cứu khách hàng, với các loại thiết lập ở trên, con người hoàn toàn không cần phải tham gia: máy tính có thể "truy cập web" và báo cáo lại cho chủ sở hữu hoặc chủ sở hữu dữ liệu.
Đối với bất kỳ ai tham gia lội xuống vùng nước sâu của học máy, hiểu được khái niệm khai thác dữ liệu hình ảnh đại chúng là bước đầu tiên tốt trong bản đồ khai thác sức mạnh học máy và tìm ra cách sử dụng nó để mang lại lợi ích cho doanh nghiệp.