Tìm Flaws trong Nghiên cứu Truyền thông Xã hội
Theo các nhà khoa học máy tính tại Đại học McGill ở Montreal và Đại học Carnegie Mellon ở Pittsburgh, các nhà nghiên cứu cần phải cảnh giác với những cạm bẫy nghiêm trọng khi làm việc với các tập dữ liệu truyền thông xã hội khổng lồ.
Kết quả sai lệch có thể có những tác động to lớn: Hàng nghìn bài báo nghiên cứu mỗi năm hiện dựa trên dữ liệu thu thập được từ phương tiện truyền thông xã hội.
Tiến sĩ Derek Ruths, trợ lý giáo sư tại Trường Khoa học Máy tính McGill cho biết: “Nhiều trong số những giấy tờ này được sử dụng để thông báo và biện minh cho các quyết định và đầu tư giữa công chúng cũng như trong ngành và chính phủ.
Đối với các nhà khoa học hành vi, sự phát triển của truyền thông xã hội dường như là một cơ hội chưa từng có để nắm bắt và sau đó phân tích lượng thông tin dồi dào về hành vi của con người.
Nhiều nhà khoa học tin rằng những bộ dữ liệu chín muồi như vậy có thể giúp dự đoán hành vi của con người ở mức độ chưa từng có trước đây tưởng tượng. Trong những năm gần đây, các nghiên cứu đã tuyên bố khả năng dự đoán mọi thứ, từ những bộ phim bom tấn mùa hè đến những biến động trên thị trường chứng khoán.
Nhưng trong một bài báo đăng trên tạp chí Khoa học, Ruths và Tiến sĩ Jürgen Pfeffer thuộc Viện Nghiên cứu Phần mềm của Carnegie Mellon nêu bật một số vấn đề liên quan đến việc sử dụng các tập dữ liệu truyền thông xã hội, cùng với các chiến lược để giải quyết chúng. Trong số những thách thức:
- Các nền tảng truyền thông xã hội khác nhau thu hút những người dùng khác nhau - ví dụ như Pinterest, chủ yếu là phụ nữ ở độ tuổi 25-34 - nhưng các nhà nghiên cứu hiếm khi sửa sai cho bức tranh méo mó mà những người này có thể tạo ra;
- Nguồn cấp dữ liệu có sẵn công khai được sử dụng trong nghiên cứu trên mạng xã hội không phải lúc nào cũng cung cấp bản trình bày chính xác về dữ liệu tổng thể của nền tảng - và các nhà nghiên cứu thường không hiểu rõ về thời điểm và cách thức các nhà cung cấp mạng xã hội lọc luồng dữ liệu của họ;
- Thiết kế của các nền tảng truyền thông xã hội có thể quyết định cách người dùng hành xử và do đó, hành vi nào có thể được đo lường. Ví dụ: trên Facebook, việc không có nút “không thích” khiến phản hồi tiêu cực đối với nội dung khó bị phát hiện hơn là “thích” tích cực;
- Một số lượng lớn người gửi thư rác và bot, giả dạng người dùng bình thường trên phương tiện truyền thông xã hội, được đưa nhầm vào nhiều phép đo và dự đoán về hành vi của con người;
- Các nhà nghiên cứu thường báo cáo kết quả cho các nhóm người dùng, chủ đề và sự kiện dễ phân loại, làm cho các phương pháp mới có vẻ chính xác hơn thực tế. Ví dụ, những nỗ lực để suy ra khuynh hướng chính trị của người dùng Twitter chỉ đạt được độ chính xác 65% đối với người dùng thông thường - mặc dù các nghiên cứu (tập trung vào những người dùng hoạt động chính trị) đã khẳng định độ chính xác 90%. Người dùng Twitter chỉ đạt được độ chính xác 65% đối với người dùng thông thường - mặc dù các nghiên cứu (tập trung vào người dùng hoạt động chính trị) đã khẳng định độ chính xác 90%.
Các nhà điều tra cho biết nhiều vấn đề cũng thường xảy ra với các lĩnh vực khác như dịch tễ học, thống kê và học máy.
Ruths nói: “Điểm chung trong tất cả những vấn đề này là các nhà nghiên cứu cần nhận thức sâu sắc hơn về những gì họ đang thực sự phân tích khi làm việc với dữ liệu truyền thông xã hội.
Các nhà khoa học xã hội đã trau dồi kỹ thuật và tiêu chuẩn của họ để đối phó với loại thách thức này trước đây.
Ruths lưu ý: “Tiêu đề nổi tiếng‘ Dewey đánh bại Truman ’năm 1948 xuất phát từ các cuộc điều tra qua điện thoại mà những người ủng hộ Truman được lấy mẫu trong dân chúng nói chung.
“Thay vì làm mất uy tín vĩnh viễn của hoạt động thăm dò ý kiến, lỗi rõ ràng đó đã dẫn đến các kỹ thuật phức tạp hơn, tiêu chuẩn cao hơn và các cuộc thăm dò chính xác hơn ngày nay. Bây giờ, chúng ta đã sẵn sàng ở một điểm uốn công nghệ tương tự. Bằng cách giải quyết các vấn đề mà chúng tôi gặp phải, chúng tôi sẽ có thể nhận ra tiềm năng to lớn cho những điều tốt đẹp được hứa hẹn bởi nghiên cứu dựa trên mạng xã hội. ”
Nguồn: Đại học McGill