Trang Chủ Cơ sở dữ liệu Sử dụng thuật toán để dự đoán các cuộc bầu cử: một cuộc trò chuyện với linzer đã vẽ

Sử dụng thuật toán để dự đoán các cuộc bầu cử: một cuộc trò chuyện với linzer đã vẽ

Anonim

Drew sẽ trình bày tại Hội nghị thượng đỉnh đổi mới dữ liệu lớn, ngày 30 & 31 tháng 1 tại Las Vegas: http://analytics.theiegroup.com/bigdata-lasvegas, cùng với các diễn giả từ Obama cho Mỹ, Best Buy, LinkedIn, New York Times, Nokia, Bitly, Barnes & Nobles, Walmart Labs và nhiều hơn nữa.


Liên kết đăng ký: http://bit.ly/Zs3wms


Cuộc phỏng vấn này được thực hiện bởi George Hill và được công bố trên Tạp chí Đổi mới Dữ liệu Lớn.


Những loại phản ứng đã có dự đoán của bạn?


Hầu hết các phản ứng đã tập trung vào sự khác biệt về độ chính xác giữa những người trong chúng tôi đã nghiên cứu các cuộc thăm dò dư luận và dự đoán "cảm giác ruột" của các nhà bình luận và bình luận viên nổi tiếng. Vào ngày bầu cử, các nhà phân tích dữ liệu như tôi, Nate Silver (blog New York Times FiveThentyEight), Simon Jackman (Đại học Stanford và Huffington Post) và Sam Wang (Hiệp hội bầu cử Princeton) đều đặt cơ hội tái tranh cử của Obama ở mức hơn 90% và dự đoán chính xác 332 phiếu đại cử tri cho Obama là kết quả rất có thể. Trong khi đó, các học giả như Karl Rove, George Will và Steve Forbes cho biết Romney sẽ giành chiến thắng - và trong một số trường hợp, một cách dễ dàng. Điều này đã dẫn đến việc nói về một "chiến thắng cho những người đi đường" mà tôi hy vọng sẽ mang lại cho các cuộc bầu cử trong tương lai.


Làm thế nào để bạn đánh giá thuật toán được sử dụng trong dự đoán của bạn?


Mô hình dự báo của tôi ước tính kết quả bỏ phiếu của tiểu bang và phiếu bầu cử cuối cùng, vào mỗi ngày của chiến dịch, bắt đầu vào tháng Sáu. Tôi muốn đánh giá các dự báo này là công bằng và khách quan nhất có thể - và không để lại cho tôi bất kỳ phòng ngọ nguậy nào nếu chúng sai. Vì vậy, khoảng một tháng trước cuộc bầu cử, tôi đã đăng lên trang web của mình một bộ tám tiêu chí đánh giá tôi sẽ sử dụng một khi kết quả được biết đến. Hóa ra, mô hình hoạt động hoàn hảo. Nó đã dự đoán vào mùa hè rằng Obama sẽ thắng tất cả các bang năm 2008 của mình trừ Indiana và Bắc Carolina, và hầu như không nảy sinh từ dự đoán đó ngay cả sau khi hỗ trợ cho Obama nhích lên vào tháng 9, sau đó giảm xuống sau cuộc tranh luận tổng thống đầu tiên.


Lượng dữ liệu được sử dụng trong suốt chiến dịch này của cả các nhà phân tích độc lập và các nhóm chiến dịch là rất lớn, điều này có ý nghĩa gì đối với việc sử dụng dữ liệu trong năm 2016?


Chiến dịch năm 2012 đã chứng minh rằng nhiều nguồn thông tin định lượng đa dạng có thể được quản lý, tin cậy và áp dụng thành công vào nhiều mục đích khác nhau. Người ngoài chúng tôi đã có thể dự đoán kết quả bầu cử trước rất xa. Bên trong các chiến dịch, đã có những bước tiến lớn trong việc nhắm mục tiêu của cử tri, theo dõi ý kiến, gây quỹ và bỏ phiếu cho cử tri. Bây giờ chúng tôi biết các phương pháp này có thể hoạt động, tôi nghĩ rằng sẽ không quay trở lại. Tôi hy vọng các phóng viên và nhà bình luận chiến dịch sẽ thực hiện tổng hợp khảo sát nghiêm túc hơn trong năm 2016. Và mặc dù Obama và đảng Dân chủ hiện đang nắm giữ lợi thế trong công nghệ chiến dịch, tôi sẽ ngạc nhiên nếu đảng Cộng hòa không nhanh chóng bắt kịp.


Bạn có nghĩ rằng sự thành công của chiến dịch dựa trên dữ liệu này có nghĩa là các nhà quản lý chiến dịch bây giờ cần phải là một nhà phân tích cũng như một nhà chiến lược?


Các nhà quản lý chiến dịch có thể không cần phải là nhà phân tích, nhưng họ nên có sự đánh giá cao hơn về cách dữ liệu và công nghệ có thể được khai thác theo lợi thế của họ. Các chiến dịch luôn sử dụng nghiên cứu khảo sát để xây dựng chiến lược và đo lường tình cảm của cử tri. Nhưng bây giờ có một loạt các công cụ mạnh mẽ khác có sẵn: các trang web mạng xã hội, cơ sở dữ liệu cử tri, điện thoại thông minh di động và tiếp thị qua email, chỉ kể ra một số. Và đó là ngoài những tiến bộ gần đây trong phương pháp bỏ phiếu và mô hình ý kiến ​​thống kê. Có rất nhiều sự đổi mới đang diễn ra trong chính trị chiến dịch của Mỹ ngay bây giờ.


Bạn đã dự đoán được kết quả bầu cử trước 6 tháng, bạn nghĩ khung thời gian tối đa thực tế để dự đoán chính xác kết quả bằng cách sử dụng các kỹ thuật phân tích của bạn là gì?


Khoảng bốn hoặc năm tháng là khoảng thời gian xa như khoa học cho phép chúng ta đi ngay bây giờ; và thậm chí còn đẩy nó một chút. Trước đó, các cuộc thăm dò chỉ không đủ thông tin về kết quả cuối cùng: quá nhiều người không quyết định hoặc chưa bắt đầu chú ý đến chiến dịch. Các yếu tố kinh tế và chính trị lịch sử đã được chứng minh là tương quan với kết quả bầu cử cũng bắt đầu mất đi khả năng dự đoán của họ một khi chúng ta vượt quá khoảng 4-5 tháng. May mắn thay, điều đó vẫn mang lại cho các chiến dịch nhiều thời gian để vạch ra chiến lược và đưa ra quyết định về cách phân bổ nguồn lực của họ.

Sử dụng thuật toán để dự đoán các cuộc bầu cử: một cuộc trò chuyện với linzer đã vẽ