Trang Chủ Âm thanh Tại sao một số dự án máy học đòi hỏi số lượng lớn các diễn viên?

Tại sao một số dự án máy học đòi hỏi số lượng lớn các diễn viên?

Anonim

Q:

Tại sao một số dự án máy học đòi hỏi số lượng lớn các diễn viên?

A:

Khi bạn nghĩ về học máy, bạn có xu hướng nghĩ về các nhà khoa học dữ liệu lành nghề làm việc trên bàn phím trong phòng máy tính. Có một sự nhấn mạnh cực độ về phân tích định lượng và thuật toán. Không có nhiều bối cảnh thực tế ngay lập tức cho nhiều chương trình này - ít nhất, đó là những gì nhiều người sẽ nghĩ.

Tuy nhiên, một số chương trình học máy đột phá nhất hiện nay đang tận dụng đội quân thực sự của các diễn viên người ngoài đường, trong các cửa hàng và bất cứ nơi nào họ có thể mô hình hóa các hoạt động cơ bản của con người như đi bộ, làm việc hoặc mua sắm.

Tải xuống miễn phí: Machine Learning và Why It Matters

Một bài báo có dây của Tom Simonite minh họa điều này rất tốt với tiêu đề apt "Để làm cho AI thông minh hơn, con người thực hiện các nhiệm vụ được trả lương thấp."

Sử dụng ví dụ về các video ngắn được quay trong cửa hàng tạp hóa Whole Food, Simonite nhấn mạnh các loại công việc sẽ giúp xây dựng một số giai đoạn tiếp theo của học máy.

Điều này dẫn đến câu hỏi tại sao tất cả những người này tham gia vào việc tự quay phim trong các video ngắn và đơn giản ghi lại các hành động thô sơ như di chuyển một cánh tay hoặc chân.

Câu trả lời làm sáng tỏ nơi học máy và nơi nó sẽ đi.

Các nhà nghiên cứu và doanh nhân muốn nhìn thấy AI hiểu và hành động trong thế giới vật chất, ông Simon Simonite viết, giải thích lý do tại sao ông và những người khác đang di chuyển bằng máy ảnh. Do đó, cần phải có công nhân để thực hiện các cảnh trong siêu thị và nhà. Họ đang tạo ra các tài liệu giảng dạy để dạy các thuật toán về thế giới và con người trong đó.

Như nhiều chuyên gia sẽ chỉ ra, một số biên giới lớn nhất của học máy liên quan đến xử lý hình ảnh và xử lý ngôn ngữ tự nhiên. Đây là những quy trình cực kỳ định lượng - nói cách khác, không có nhiều phổ đầu vào như trong môi trường thế giới thực "biểu diễn". Thay vào đó, các chương trình học máy đang sử dụng dữ liệu hình ảnh và âm thanh theo những cách rất cụ thể để xây dựng mô hình. Với xử lý hình ảnh, nó chọn các tính năng từ trường nhìn (hữu hạn). Đối với NLP, đó là lắp ráp âm vị.

Vượt ra ngoài các danh mục đầu vào cụ thể này liên quan đến thứ mà bạn có thể gọi là "khoảng cách hình ảnh và giọng nói" - vượt xa những thứ như xử lý hình ảnh và nhận dạng giọng nói, bạn đang di chuyển vào các khu vực mà máy tính phải phân tích theo nhiều cách khác nhau. Các bộ đào tạo sẽ khác nhau về cơ bản.

Nhập quân đội quay phim. Trong một số dự án máy học mới này, những ý tưởng nhỏ nhất về hoạt động của con người là các bộ đào tạo. Thay vì được đào tạo để tìm kiếm các tính năng và các cạnh và pixel kết hợp thành các tác vụ phân loại, máy tính thay vào đó sử dụng các video đào tạo để đánh giá các loại hành động khác nhau trông như thế nào.

Điều quan trọng là những gì các kỹ sư có thể làm với dữ liệu này khi nó được tổng hợp và tải và khi máy tính được đào tạo về nó. Bạn sẽ sớm thấy kết quả trong các lĩnh vực khác nhau - ví dụ, điều này sẽ giúp việc giám sát trở nên cực kỳ hiệu quả. Máy tính sẽ có thể "nhìn thấy" trong lĩnh vực thị giác những gì mọi người đang làm và áp dụng điều đó cho các lĩnh vực như tiếp thị và bán hàng, hoặc có thể, trong một số trường hợp, công việc của cơ quan chính phủ hoặc tư pháp hình sự.

Sự phân nhánh cũng làm sáng tỏ cuộc tranh luận giữa lợi ích tối đa và câu hỏi riêng tư. Phần lớn việc sử dụng các video này sẽ xây dựng các mô hình học máy hoạt động để giám sát - nhưng còn những người không muốn bị giám sát thì sao? Khi các chương trình máy học mới này được triển khai trong không gian công cộng, quyền của cá nhân là gì và dòng đó được rút ra ở đâu?

Trong mọi trường hợp, các công ty đang sử dụng các loại tài nguyên video và con người này để thực sự nghiên cứu một số vòng tiến trình học máy cấp độ tiếp theo sẽ thực sự cho phép máy tính nhận ra những gì xảy ra xung quanh chúng, thay vì chỉ phân loại hình ảnh hoặc làm việc với âm vị của phát biểu. Đây là một sự phát triển cực kỳ thú vị và gây tranh cãi trong trí tuệ nhân tạo, và nó xứng đáng được chia sẻ sự chú ý của nó trên các phương tiện truyền thông công nghệ và hơn thế nữa.

Tại sao một số dự án máy học đòi hỏi số lượng lớn các diễn viên?