Twitter có thể dự đoán bầu cử không? Chưa
Một bài báo nghiên cứu được công bố vào tuần trước cho thấy rằng, trong một phân tích về 435 cuộc bầu cử Hạ viện Hoa Kỳ vào năm 2010, chỉ cần nhìn vào tần số tên của một ứng cử viên đã được đề cập trên Twitter có thể được sử dụng để dự đoán kết quả bầu cử.Nhưng đây là một điều điên rồ - không quan trọng những gì đã được nói về ứng viên - tích cực, tiêu cực hay trung lập. Điều quan trọng là tên của ứng cử viên được những người ủng hộ, kẻ thù hoặc chỉ ngẫu nhiên tweet.
Các nhà nghiên cứu có thể dự đoán kết quả của 404 trong số 435 cuộc đua - một tỷ lệ dự đoán đáng kinh ngạc là 92,8%.
Nhưng có một cơ hội… và đó là một điều lớn.
Điều mà bài báo và đồng tác giả của nó, nhà xã hội học Fabio Rojas của Đại học Indiana, không tính đến (hoặc ít nhất là thừa nhận trên tất cả báo chí của họ về chủ đề này) là xác suất thống kê đơn giản. Trong 19 trong số 23 cuộc bầu cử đã qua, 90% những người đương nhiệm đã chiến thắng trong cuộc bầu cử lại.
Vì vậy, các nhà nghiên cứu đã cải thiện cơ sở dự đoán hiện có của chúng tôi bằng cách 2,8 phần trăm. Không chính xác đáng tin khi đặt vào loại quan điểm đó.
Những người đương nhiệm - với tên tuổi hiện có của họ ở các quận của họ và cỗ máy gây quỹ vận động được bôi trơn - thường gặp ít khó khăn trong việc tái đắc cử.
Tôi không phải là người đầu tiên đưa ra lời giải thích thay thế này cho kết quả của các nhà nghiên cứu, như Stuart Rothenberg đã lưu ý:
Rất ít nhà khoa học chính trị có uy tín sẽ chấp nhận khẳng định của Rojas rằng “Nghiên cứu mới trong khoa học máy tính, xã hội học và khoa học chính trị cho thấy dữ liệu được trích xuất từ các nền tảng truyền thông xã hội mang lại phép đo chính xác về dư luận”.
“Không ai tôi biết đang nói bất cứ điều gì gần với điều này,” Michael S. Lewis-Beck, Giáo sư xuất sắc của F. Wendell Miller về Khoa học Chính trị tại Đại học Iowa và là một cơ quan nổi tiếng về cả chính trị Mỹ và dự báo bầu cử, viết trong một email cho tôi trong tuần này.
Thật đáng lo ngại khi Rojas, một nhà khoa học xã hội, dường như không thảo luận về những giải thích thay thế cho những phát hiện của mình trong bài báo của mình (được liên kết bên dưới). Các nhà khoa học có trách nhiệm trình bày những phát hiện của họ với công chúng theo cách cũng tiết lộ những hạn chế trong nghiên cứu của họ - bao gồm cả việc đề cập đến lý do tại sao những kết quả sơ bộ này có thể không được giữ vững khi được thử nghiệm trong các cuộc đua tranh gay gắt hơn hoặc phi quốc gia.
Thử nghiệm thực sự của hệ thống dự đoán này sẽ là khi nó được sử dụng trong các cuộc đua mà người đương nhiệm không phải là một công cụ dự đoán đáng tin cậy như vậy. Có lẽ là Thượng viện, hoặc nhiều cuộc đua địa phương hơn (chẳng hạn như các chức vụ thống đốc). Đây có thể là một nghiên cứu tốt, nhưng đâu là sự ôn hòa trong cuộc thảo luận về kết quả? Kiểm tra sự tỉnh táo về tính hợp lý của các phát hiện ở đâu? Đâu là nghiên cứu tiếp theo chứng minh những kết quả này thực sự có thể khái quát được đối với các cuộc bầu cử khác?
Cho đến lúc đó, Twitter có thể là một cách nhanh chóng để đánh giá nhiệt độ của một cuộc bầu cử. Hoặc nó có thể không.
Nhưng tôi nghĩ điều cuối cùng Twitter muốn được biết đến là một phương tiện truyền thông xã hội, nơi nội dung của những gì bạn đăng không thực sự quan trọng.