Làm thế nào chúng tôi tìm ra những Tweet nào đáng tin cậy

Các nhà nghiên cứu tại Viện Công nghệ Georgia đã phát triển một mô hình ngôn ngữ mới cho thấy những từ và cụm từ nào ảnh hưởng tích cực hoặc tiêu cực đến độ tin cậy của các sự kiện thế giới được báo cáo trên Twitter.

Nghiên cứu đã quét 66 triệu tweet liên quan đến gần 1.400 sự kiện trong thế giới thực, cho thấy rằng lời nói của hàng triệu người trên mạng xã hội có thể cung cấp thông tin đáng kể về độ tin cậy của một sự kiện, ngay cả khi một sự kiện vẫn đang diễn ra.

Tanushree Mitra, Tiến sĩ Công nghệ Georgia, cho biết: “Đã có nhiều nghiên cứu về độ tin cậy của mạng xã hội trong những năm gần đây, nhưng rất ít người biết về loại từ hoặc cụm từ nào tạo ra nhận thức về độ tin cậy trong các sự kiện diễn ra nhanh chóng” ứng cử viên dẫn đầu nghiên cứu.

Nhóm nghiên cứu đã nghiên cứu các tweet liên quan đến các sự kiện thế giới trong năm 2014 và 2015, bao gồm sự xuất hiện của Ebola ở Tây Phi, vụ tấn công Charlie Hebdo ở Paris và cái chết của Eric Garner ở thành phố New York.

Các nhà nghiên cứu yêu cầu mọi người đánh giá các bài đăng về độ tin cậy của họ (từ “chắc chắn chính xác” đến “chắc chắn không chính xác”). Sau đó, nhóm nghiên cứu đưa các từ vào một mô hình chia chúng thành 15 loại ngôn ngữ khác nhau. Các phân loại bao gồm cảm xúc tích cực và tiêu cực, rào cản và thúc đẩy, và lo lắng.

Máy tính Georgia Tech sau đó đã kiểm tra các từ để đánh giá xem các tweet có đáng tin hay không. Nó khớp với ý kiến ​​của con người khoảng 68% thời gian, một tỷ lệ phần trăm cao hơn đáng kể so với đường cơ sở ngẫu nhiên là 25%.

Mitra cho biết: “Các bài đăng có các từ tăng cường, chẳng hạn như" không thể phủ nhận "và các cụm từ cảm xúc tích cực, chẳng hạn như" háo hức "và" tuyệt vời ", được xem là rất đáng tin cậy. “Những từ biểu thị tình cảm tích cực nhưng chế nhạo tính không thực tế của sự kiện, chẳng hạn như‘ ha ’,‘ cười toe toét ’hoặc‘ nói đùa ’, được coi là ít đáng tin cậy hơn. Các từ hàng rào cũng vậy, bao gồm cả "mức độ nhất định" và "nghi ngờ."

Số lượt retweet cao hơn có liên quan đến điểm uy tín thấp hơn.Các câu trả lời và retweet có độ dài tin nhắn dài hơn được cho là đáng tin cậy hơn.

Cô nói: “Có thể độ dài tin nhắn dài hơn cung cấp nhiều thông tin hoặc lý luận hơn, vì vậy chúng được xem là đáng tin cậy hơn. “Mặt khác, số lượt retweet cao hơn, được đánh giá thấp hơn về độ tin cậy, có thể thể hiện nỗ lực đưa ra lý luận tập thể trong thời gian khủng hoảng hoặc không chắc chắn.”

Mặc dù mô hình này chưa thể triển khai, nhưng các nhà nghiên cứu cho biết cuối cùng họ có thể phát triển một ứng dụng có thể tính toán mức độ đáng tin cậy được nhận thức của một sự kiện khi nó xuất hiện trên mạng xã hội.

“Khi được kết hợp với các tín hiệu khác, chẳng hạn như chủ đề sự kiện hoặc thông tin cấu trúc, kết quả ngôn ngữ của chúng tôi có thể là một khối xây dựng quan trọng của hệ thống tự động”, Tiến sĩ Eric Gilbert, cố vấn của Mitra và là trợ lý giáo sư tại Trường Máy tính Tương tác Georgia Tech cho biết.

“Twitter là một phần của vấn đề lan truyền tin tức không trung thực trên mạng. Nhưng nó cũng có thể là một phần của giải pháp ”.

Nguồn: Viện Công nghệ Georgia

!-- GDPR -->