Các từ trên Twitter có thể dự đoán nguy cơ mắc bệnh tim của một khu vực
Niềm tin rằng các nền tảng truyền thông xã hội sẽ cải thiện việc đánh giá sức khỏe hoặc hạnh phúc của cộng đồng đã được hứa hẹn trong nhiều năm.
Một nghiên cứu mới cho thấy lời tiên tri có thể đã được ứng nghiệm khi các nhà nghiên cứu tại Đại học Pennsylvania phát hiện ra rằng Twitter có thể nắm bắt nhiều thông tin về nguy cơ bệnh tim hơn nhiều yếu tố truyền thống cộng lại.
Các nghiên cứu trước đây đã xác định nhiều yếu tố góp phần vào nguy cơ mắc bệnh tim: những yếu tố truyền thống, như thu nhập thấp hoặc hút thuốc nhưng cũng là những yếu tố tâm lý, như căng thẳng.
Các chuyên gia từ lâu đã cho rằng sức khỏe tâm lý của cộng đồng là quan trọng đối với sức khỏe thể chất, nhưng rất khó để đo lường. Giờ đây, các nhà nghiên cứu tin rằng Twitter có thể cung cấp một cánh cửa dẫn đến trạng thái tinh thần chung của cộng đồng.
Các nhà điều tra đã chọn lọc qua 148 triệu Tweet từ năm 2009-2010 và so sánh ngôn ngữ với dữ liệu của từng quận từ CDC về tỷ lệ tử vong do bệnh tim.
Các nhà nghiên cứu phát hiện ra rằng những biểu hiện của cảm xúc tiêu cực như tức giận, căng thẳng và mệt mỏi trong các tweet của quận có liên quan đến nguy cơ mắc bệnh tim cao hơn. Mặt khác, những cảm xúc tích cực như phấn khích và lạc quan có liên quan đến nguy cơ thấp hơn.
Johannes Eichstaedt, tác giả chính của bài báo đăng trên tạp chí cho biết: “Về các biến số tâm lý, điều lớn nhất mà chúng tôi phát hiện ra đi kèm với bệnh tim cao hơn là sự tức giận và thù địch. Khoa học Tâm lý.
Các nhà nghiên cứu tin rằng phân tích các tweet có thể là một công cụ hữu ích trong dịch tễ học và đo lường hiệu quả của các can thiệp y tế công cộng, vì ngôn ngữ được sử dụng phản ánh trạng thái tâm lý của cộng đồng.
Với hàng tỷ người dùng viết hàng ngày về trải nghiệm, suy nghĩ và cảm xúc hàng ngày của họ, thế giới truyền thông xã hội đại diện cho một biên giới mới cho nghiên cứu tâm lý. Những dữ liệu như vậy có thể là một công cụ y tế công cộng vô giá nếu có thể gắn với các kết quả trong thế giới thực.
Với suy nghĩ này, các nhà nghiên cứu từ lâu đã nghiên cứu mức độ mà ngôn ngữ mọi người sử dụng trực tuyến thể hiện suy nghĩ và cảm xúc bên trong của họ.
Vì không có cách nào để đo lường trực tiếp đời sống tình cảm bên trong của mọi người, nhóm nghiên cứu đã dựa trên các truyền thống trong nghiên cứu tâm lý học thu thập thông tin này từ những từ mọi người sử dụng khi nói hoặc viết.
Nghiên cứu trước đó của nhóm đã chỉ ra rằng phân tích ngôn ngữ như vậy có thể hoạt động tốt như bảng câu hỏi truyền thống trong việc đánh giá tính cách của một cá nhân.
Eichstaedt nói: “Lấy dữ liệu này thông qua các cuộc khảo sát là tốn kém và mất thời gian, nhưng quan trọng hơn, bạn bị giới hạn bởi các câu hỏi trong cuộc khảo sát.
“Bạn sẽ không bao giờ có được sự phong phú về mặt tâm lý đi kèm với các biến số vô hạn của ngôn ngữ mọi người chọn sử dụng.”
Sau khi nhìn thấy mối tương quan giữa ngôn ngữ và trạng thái cảm xúc, các nhà nghiên cứu tiếp tục xem liệu họ có thể chỉ ra mối liên hệ giữa những trạng thái cảm xúc và kết quả thể chất bắt nguồn từ chúng hay không.
Họ đã có một ứng cử viên lý tưởng cho bệnh tim mạch vành, nguyên nhân gây tử vong hàng đầu trên toàn thế giới.
Margaret Kern, tiến sĩ, phó giáo sư tại Đại học Melbourne, Úc cho biết: “Trạng thái tâm lý từ lâu đã được cho là có ảnh hưởng đến bệnh tim mạch vành.
“Ví dụ, sự thù địch và trầm cảm có liên quan đến bệnh tim ở cấp độ cá nhân thông qua các hiệu ứng sinh học. Nhưng những cảm xúc tiêu cực cũng có thể kích hoạt các phản ứng hành vi và xã hội; bạn cũng có nhiều khả năng uống rượu, ăn uống kém và cách ly với những người khác, điều này có thể gián tiếp dẫn đến bệnh tim ”.
Là một nguyên nhân phổ biến gây tử vong sớm, các quan chức y tế công cộng tính toán cẩn thận thời điểm bệnh tim được xác định là nguyên nhân cơ bản trên giấy chứng tử.
Họ cũng thu thập dữ liệu tỉ mỉ về các yếu tố nguy cơ có thể xảy ra, chẳng hạn như tỷ lệ hút thuốc, béo phì, tăng huyết áp và lười vận động. Dữ liệu này có sẵn ở cấp độ từng quận ở Hoa Kỳ, vì vậy nhóm nghiên cứu đã nhắm đến việc đối sánh dịch tễ học vật lý này với phiên bản Twitter kỹ thuật số của họ.
Trong nghiên cứu, các nhà nghiên cứu đã xem xét một tập hợp các tweet công khai được thực hiện từ năm 2009 đến 2010. Các từ điển cảm xúc đã được thành lập, cũng như các cụm từ được tạo tự động phản ánh hành vi và thái độ, được sử dụng để phân tích một mẫu tweet ngẫu nhiên từ những cá nhân đã đặt địa điểm của họ. có sẵn.
Đã có đủ số lượng tweet và dữ liệu sức khỏe từ khoảng 1.300 quận, chiếm 88% dân số cả nước.
Các nhà điều tra phát hiện ra rằng ngôn ngữ và chủ đề cảm xúc tiêu cực, chẳng hạn như những từ như “ghét” hoặc nói tục, vẫn có mối tương quan chặt chẽ với tỷ lệ tử vong do bệnh tim, ngay cả khi đã tính đến các biến số như thu nhập và giáo dục.
Ngôn ngữ cảm xúc tích cực cho thấy mối tương quan ngược lại, cho thấy rằng sự lạc quan và trải nghiệm tích cực, những từ như “tuyệt vời” hoặc “bạn bè”, có thể bảo vệ chống lại bệnh tim.
“Mối quan hệ giữa ngôn ngữ và tỷ lệ tử vong là đặc biệt đáng ngạc nhiên,” H. Andrew Schwartz, Ph.D., một trợ lý giáo sư thỉnh giảng cho biết. Ông tin rằng việc lựa chọn những từ ngữ tức giận phản ánh sự căng thẳng của cộng đồng vì những người đang tweet những từ ngữ và chủ đề tức giận nói chung không phải là những người chết vì bệnh tim.
"Nhưng điều đó có nghĩa là nếu nhiều người hàng xóm của bạn tức giận, bạn có nhiều khả năng chết vì bệnh tim."
Phát hiện này phù hợp với nghiên cứu xã hội học hiện có cho thấy rằng các đặc điểm tổng hợp của các cộng đồng có thể dự báo nhiều hơn về sức khỏe thể chất so với báo cáo của bất kỳ cá nhân nào.
Lyle Ungar, Tiến sĩ, giáo sư khoa học máy tính và thông tin tại Pennsylvania cho biết: “Chúng tôi tin rằng chúng tôi đang phát hiện ra nhiều đặc điểm lâu dài hơn của các cộng đồng.
“Ngôn ngữ có thể thể hiện sự‘ khô héo của gỗ ’hơn là‘ tia lửa ’ngay lập tức dẫn đến tử vong. Chúng tôi không thể dự đoán số lượng các cơn đau tim mà một quận sẽ gặp phải trong một khung thời gian nhất định, nhưng ngôn ngữ có thể tiết lộ những nơi cần can thiệp. "
Các lưu ý khác đối với khả năng dự đoán của phương pháp bao gồm các yếu tố xã hội ảnh hưởng đến loại thông điệp mà mọi người chọn chia sẻ trên Twitter.
Schwartz nói: “Nếu mọi người tích cực hơn một chút trên Twitter so với ngoài đời thực, chúng tôi vẫn sẽ thấy sự khác biệt giữa các vị trí, đó là điều chúng tôi quan tâm nhất.
Sự khác biệt này có thể được sử dụng để lấy bằng chứng về hiệu quả của các can thiệp y tế công cộng ở cấp độ cộng đồng, thay vì ở cấp độ cá nhân. Phát hiện của nhóm cho thấy rằng những tweet này là tổng hợp thông tin về những người không thể dễ dàng truy cập theo những cách khác.
“Twitter dường như nắm bắt rất nhiều thông tin giống như thông tin mà bạn nhận được từ các chỉ số sức khỏe và nhân khẩu học,” Tiến sĩ Gregory Park, một nghiên cứu sinh sau tiến sĩ tại Khoa Tâm lý của Trường Nghệ thuật và Khoa học Pennsylvania cho biết.
“Nhưng nó cũng bổ sung thêm một số thứ. Vì vậy, các dự đoán từ Twitter thực sự có thể chính xác hơn so với việc sử dụng một tập hợp các biến truyền thống ”.
Nguồn: Đại học Pennsylvania