Q:
Làm thế nào các công ty đang cố gắng thêm một "công tơ mét" cho trí tuệ nhân tạo hoạt động?
A:Một số công ty làm việc dựa trên những tiến bộ mới nhất trong trí tuệ nhân tạo đang trở nên tập trung vào việc định lượng tiến bộ mà họ đã đạt được và đánh giá một số khía cạnh về cách trí tuệ nhân tạo phát triển theo thời gian. Có nhiều lý do tại sao các công ty đang theo đuổi các loại phân tích này. Nói chung, họ đang cố gắng tìm hiểu xem trí tuệ nhân tạo đã đi được bao xa, nó áp dụng như thế nào vào cuộc sống của chúng ta và nó sẽ ảnh hưởng đến thị trường như thế nào.
Một số công ty đang động não và theo dõi tiến trình trí tuệ nhân tạo của họ để tìm ra cách các công nghệ mới có thể ảnh hưởng đến tự do dân sự, hoặc cách họ có thể tạo ra thực tế kinh tế mới. Tùy thuộc vào cách tiếp cận của công ty, các loại phân tích này có thể ở dạng cố gắng tìm hiểu làm thế nào dữ liệu người dùng có thể chảy qua các hệ thống, hiểu cách giao diện sẽ hoạt động hoặc tìm ra khả năng của các thực thể trí tuệ nhân tạo và cách họ có thể sử dụng các khả năng đó.
Khi nói đến phương pháp, các công ty đang cố gắng đánh giá trí tuệ nhân tạo có thể tập trung vào việc phá vỡ thông tin trừu tượng - ví dụ, một bài báo của Wired trích dẫn dự án AI Index, nơi các nhà nghiên cứu như Ray Perrault, người làm việc tại phòng thí nghiệm phi lợi nhuận SRI International, đang làm việc trên một ảnh chụp chi tiết về những gì đang diễn ra trong lĩnh vực trí tuệ nhân tạo.
Đây là một việc cần phải làm, một phần vì có quá nhiều điều điên rồ ngoài kia về việc AI sẽ đi đâu, theo ông Perrault trong bài báo, bình luận về động lực thực hiện loại dự án này.
Để giải thích cách hoạt động của điểm chuẩn trí tuệ nhân tạo, một số chuyên gia đang giải thích rằng các kỹ sư hoặc các bên khác có thể đang cố gắng theo đuổi các thử nghiệm cứng đối với các dự án trí tuệ nhân tạo, ví dụ, cố gắng để lừa các trò chơi trí tuệ nhân tạo. Loại mô tả này thực sự đi vào cốt lõi của cách các công ty thực sự có thể giám sát và đánh giá trí tuệ nhân tạo. Một cách để nghĩ về điều này là áp dụng các loại ý tưởng tương tự mà các lập trình viên đã sử dụng trong thời gian qua để gỡ lỗi các hệ thống mã tuyến tính.
Gỡ lỗi các hệ thống mã tuyến tính là tất cả về việc tìm kiếm các điểm mà hệ thống sẽ hoạt động tốt - nơi chương trình sẽ bị sập, nơi nó bị đóng băng, nơi nó chạy chậm, v.v. Đó là về việc tìm ra lỗi logic sẽ làm dừng hoặc gây nhiễu cho dự án, trong đó một chức năng sẽ không hoạt động chính xác hoặc nơi có thể có một số sự kiện người dùng ngoài ý muốn.
Khi bạn nghĩ về nó, thử nghiệm hiện đại về trí thông minh nhân tạo có thể là một nỗ lực tương tự trên một mặt phẳng rất khác - bởi vì các công nghệ trí tuệ nhân tạo nhận thức nhiều hơn tuyến tính, thử nghiệm đó có hình thức khác nhiều, nhưng con người vẫn đang tìm kiếm lỗi. Nghiêng - những cách mà các chương trình này có thể gây ra hậu quả không lường trước, cách mà chúng có thể hành động và gây hại cho các tổ chức của con người, v.v. Với suy nghĩ đó, mặc dù có nhiều phương pháp khác nhau để tạo ra công tơ mét hoặc điểm chuẩn cho tiến bộ trí tuệ nhân tạo, các loại kiểm tra cứng được mô tả ở trên nói chung sẽ cung cấp cho con người cái nhìn sâu sắc độc đáo về trí thông minh nhân tạo đã đi được bao xa, và những gì phải làm để giữ cho nó mang lại nhiều tích cực hơn mà không phát triển thêm tiêu cực.