Tweets Cung cấp Rất nhiều Dữ liệu Y tế Công cộng

Sự phát triển vượt bậc của mạng xã hội đã tạo ra một phương tiện truyền thông chưa từng có. Chỉ riêng Twitter đã cho phép hàng triệu người hâm mộ trên mạng xã hội bình luận với 140 ký tự hoặc ít hơn về bất cứ điều gì.

Một nỗ lực nghiên cứu mới đã xem xét liệu định dạng kỹ thuật số này có thể được sử dụng để theo dõi các xu hướng sức khỏe cộng đồng quan trọng hay không. Và, theo hai nhà khoa học máy tính của Đại học Johns Hopkins, dòng tweet chỉ một từ là: "Có!"

Tiến sĩ. Mark Dredze và Michael J. Paul đưa 2 tỷ tweet công khai được đăng từ tháng 5 năm 2009 đến tháng 10 năm 2010 vào máy tính, sau đó sử dụng phần mềm để lọc ra 1,5 triệu tin nhắn đề cập đến các vấn đề sức khỏe. Danh tính của các tweeter không được thu thập.

“Mục tiêu của chúng tôi là tìm hiểu xem các bài đăng trên Twitter có thể là một nguồn thông tin sức khỏe cộng đồng hữu ích hay không,” Dredze nói.

“Chúng tôi xác định rằng thực sự, họ có thể. Trong một số trường hợp, chúng tôi có thể đã học được một số điều mà ngay cả các bác sĩ của người đăng tweet cũng không biết, chẳng hạn như loại thuốc không kê đơn nào mà người đăng quảng cáo đang sử dụng để điều trị các triệu chứng của họ tại nhà. "

Bằng cách sắp xếp các tweet liên quan đến sức khỏe này thành các “đống” điện tử, Dredze và Paul đã khám phá ra các mô hình hấp dẫn về dị ứng, các trường hợp cúm, mất ngủ, ung thư, béo phì, trầm cảm, đau đớn và các bệnh khác.

Dredze nói: “Đã có một số nghiên cứu hẹp sử dụng các bài đăng trên Twitter để theo dõi bệnh cúm. “Nhưng theo hiểu biết của chúng tôi, chưa có ai sử dụng tweet để xem xét nhiều vấn đề sức khỏe như chúng tôi đã làm.”

Dredze và Paul sẽ trình bày nghiên cứu hoàn chỉnh của họ vào ngày 18 tháng 7 tại Barcelona, ​​Tây Ban Nha, tại Hội nghị Quốc tế về Weblog và Truyền thông Xã hội, được tài trợ bởi Hiệp hội Vì sự Tiến bộ của Trí tuệ Nhân tạo.

Ngoài việc tìm thấy một loạt các bệnh về sức khỏe trong các bài đăng trên Twitter, các nhà nghiên cứu còn có thể ghi lại nhiều loại thuốc mà những người viết tweet bị bệnh đã sử dụng, nhờ vào các bài đăng như: “Phải bật một viên Benadryl… dị ứng là tồi tệ nhất”.

Các tweet khác chỉ ra việc lạm dụng thuốc.

Paul nói: “Chúng tôi phát hiện ra rằng một số người đã tweet rằng họ đang dùng thuốc kháng sinh cho bệnh cúm. “Nhưng thuốc kháng sinh không có tác dụng đối với bệnh cúm vốn là một loại vi rút và phương pháp này có thể góp phần vào vấn đề kháng thuốc kháng sinh ngày càng tăng. Vì vậy, những dòng tweet này đã cho chúng tôi thấy rằng một số nhận thức sai lầm nghiêm trọng về y tế vẫn tồn tại ở đó. "

Tất nhiên, phần lớn các tweet hàng ngày không liên quan gì đến bệnh tật. Mặc dù một cách tiếp cận đơn giản là lọc các từ liên quan đến bệnh tật, chẳng hạn như "đau đầu" hoặc "sốt", nhưng chiến lược này không thành công với các tweet như "Giá xăng cao làm doanh nghiệp của tôi đau đầu" hoặc "Có một vụ việc của Bieber Fever. Yêu bài hát mới của anh ấy ”.

Để tìm các bài đăng liên quan đến sức khỏe trong số hàng tỷ tin nhắn trong nhóm ban đầu của họ, các nhà nghiên cứu của Johns Hopkins đã áp dụng một hệ thống lọc và phân loại mà họ đã nghĩ ra. Với công cụ này, máy tính có thể được dạy cách bỏ qua các cụm từ không thực sự liên quan đến sức khỏe của một người, ngay cả khi chúng chứa một từ thường được sử dụng trong ngữ cảnh sức khỏe.

Sau khi các tweet không liên quan đã bị xóa, các kết quả còn lại cung cấp một số phát hiện đáng ngạc nhiên.

Paul nói: “Khi chúng tôi bắt đầu, tôi thậm chí không biết mọi người có nói về bệnh dị ứng trên Twitter hay không. “Nhưng chúng tôi phát hiện ra rằng họ có. Và có một điều tôi không ngờ tới: Hệ thống đã phát hiện ra hai loại dị ứng khác nhau: loại gây sụt sịt và hắt hơi và loại gây phát ban và nổi mề đay trên da ”.

Trong khoảng 200.000 tweet liên quan đến sức khỏe, các nhà nghiên cứu có thể dựa trên thông tin công khai do người dùng cung cấp để xác định trạng thái mà từ đó tin nhắn được gửi đi. Điều đó cho phép họ theo dõi một số xu hướng theo thời gian và địa điểm, chẳng hạn như khi mùa dị ứng và cúm lên đến đỉnh điểm ở nhiều vùng khác nhau của đất nước.

“Chúng tôi có thể thấy từ các tweet rằng mùa dị ứng bắt đầu sớm hơn ở các bang ấm hơn và muộn hơn ở Trung Tây và Đông Bắc,” Dredze nói.

Dredze và Paul đã bắt đầu nói chuyện với các nhà khoa học sức khỏe cộng đồng, bao gồm cả một số liên kết với Johns Hopkins, những người nói rằng các nghiên cứu trong tương lai về các tweet có thể khám phá nhiều dữ liệu hữu ích hơn, không chỉ về các vấn đề y tế của áp phích mà còn về nhận thức của công chúng về bệnh tật, thuốc men và các vấn đề sức khỏe khác.

Tuy nhiên, Dredze và Paul cảnh báo rằng cố gắng nắm bắt nhiệt độ của quốc gia bằng cách phân tích các tweet có những hạn chế của nó.

Có điều, hầu hết người dùng Twitter đã không bình luận nhiều lần về căn bệnh cụ thể của họ, khiến việc theo dõi bệnh kéo dài bao lâu và liệu nó có tái phát hay không. Ngoài ra, hầu hết người dùng Twitter có xu hướng trẻ, điều này sẽ loại trừ nhiều người cao tuổi khỏi một nghiên cứu sức khỏe cộng đồng. Ngoài ra, hiện tại, Twitter bị thống trị bởi người dùng ở Hoa Kỳ, khiến nó ít hữu ích hơn cho việc nghiên cứu ở các quốc gia khác.

Mặc dù các trang mạng xã hội cho phép người dùng tiết lộ nhiều thông tin cá nhân với bạn bè và người lạ, nhưng nghiên cứu dựa trên Twitter có thể chỉ đạt đến một độ sâu nhất định.

“Trong nghiên cứu của chúng tôi,” Paul nói, “chúng tôi chỉ có thể học những gì mọi người sẵn sàng chia sẻ. Chúng tôi nghĩ rằng có giới hạn đối với những gì mọi người sẵn sàng chia sẻ trên Twitter. "

Tuy nhiên, Dredze cho biết vẫn còn rất nhiều dữ liệu hữu ích từ các bài đăng trên Twitter. “Những người tôi đã nói chuyện cảm thấy đây là một công cụ nghiên cứu thực sự thú vị,” anh nói, “và họ có một số ý tưởng tuyệt vời về những gì họ muốn tìm hiểu tiếp theo từ Twitter.”

Nguồn: Đại học Johns Hopkins

!-- GDPR -->