Hồ sơ Facebook có thể đo tính cách không?

Hồ sơ mà chúng ta cung cấp trên Facebook có phản ánh chính xác hơn tính cách của chúng ta so với những gì có được bằng các phương pháp truyền thống được các nhà tâm lý học sử dụng không?

Đây là một câu hỏi mà một nhóm các nhà nghiên cứu liên ngành từ Đại học Pennsylvania đang cố gắng trả lời. Hiện nay, các nhà tâm lý học sử dụng nhiều phương pháp bao gồm khảo sát tự báo cáo và bảng câu hỏi để đánh giá tính cách.

Trong một nghiên cứu gần đây, 75.000 người đã tự nguyện hoàn thành bảng câu hỏi về tính cách chung thông qua ứng dụng Facebook và cập nhật trạng thái Facebook của họ cho mục đích nghiên cứu. Sau đó, các nhà nghiên cứu tìm kiếm các mẫu ngôn ngữ tổng thể trong ngôn ngữ của các tình nguyện viên.

Nghiên cứu được công bố trên tạp chí PLOS MỘT.

Các nhà điều tra đã tạo ra các mô hình máy tính có thể dự đoán tuổi tác, giới tính của các cá nhân và phản ứng của họ trên bảng câu hỏi tính cách mà họ đã thực hiện.

Những mô hình dự đoán này chính xác một cách đáng ngạc nhiên. Ví dụ: các nhà nghiên cứu đã chính xác 92% thời gian khi dự đoán giới tính của người dùng chỉ dựa trên ngôn ngữ cập nhật trạng thái của họ.

Sự thành công của cách tiếp cận “mở” này gợi ý những cách mới để nghiên cứu mối liên hệ giữa các đặc điểm tính cách và hành vi và đo lường hiệu quả của các can thiệp tâm lý.

Nghiên cứu của các nhà nghiên cứu dựa trên một lịch sử lâu dài nghiên cứu những từ mà mọi người sử dụng như một cách để hiểu cảm xúc và trạng thái tinh thần của họ, nhưng theo cách tiếp cận "mở" thay vì "đóng" để phân tích dữ liệu cốt lõi.

Tiến sĩ Margaret Kern, nghiên cứu sinh sau tiến sĩ, cho biết: “Trong cách tiếp cận 'từ vựng khép kín', các nhà tâm lý học có thể chọn một danh sách các từ mà họ nghĩ là dấu hiệu của cảm xúc tích cực, như 'hài lòng', 'nhiệt tình' hoặc 'tuyệt vời' và sau đó xem tần suất sử dụng những từ này của một người như một cách để đo mức độ hạnh phúc của người đó.

Tuy nhiên, các phương pháp tiếp cận từ vựng đóng có một số hạn chế, bao gồm cả việc chúng không phải lúc nào cũng đo lường những gì chúng định đo lường ”.

“Ví dụ,” Ungar nói, “người ta có thể thấy lĩnh vực năng lượng sử dụng nhiều từ cảm xúc tiêu cực hơn, đơn giản vì họ sử dụng từ‘ thô thiển ’nhiều hơn. Nhưng điều này chỉ ra sự cần thiết phải sử dụng các biểu thức nhiều từ để hiểu ý nghĩa dự định.

‘Dầu thô’ khác với ‘dầu thô’ và tương tự như vậy, bị ‘ốm’ khác với việc chỉ đơn thuần là ‘bị bệnh’. ”

Một hạn chế cố hữu khác đối với phương pháp tiếp cận từ vựng đóng là nó dựa vào một nhóm từ cố định, được định trước. Một nghiên cứu như vậy có thể xác nhận rằng những người trầm cảm thực sự sử dụng những từ được mong đợi (như “buồn”) thường xuyên hơn nhưng không thể tạo ra những hiểu biết mới (ví dụ: họ ít nói về thể thao hoặc hoạt động xã hội hơn những người vui vẻ).

Các nghiên cứu ngôn ngữ tâm lý trước đây nhất thiết phải dựa vào các phương pháp tiếp cận từ vựng đóng vì kích thước mẫu nhỏ của họ khiến các phương pháp tiếp cận mở không thực tế. Sự xuất hiện của các bộ dữ liệu ngôn ngữ khổng lồ được cung cấp bởi mạng xã hội hiện cho phép các phân tích khác nhau về chất lượng.

“Hầu hết các từ đều hiếm khi xảy ra - bất kỳ mẫu viết nào, kể cả cập nhật trạng thái trên Facebook, chỉ chứa một phần nhỏ từ vựng trung bình,” H. Andrew Schwartz, một nghiên cứu sinh sau tiến sĩ về máy tính và khoa học thông tin, báo cáo.

“Điều này có nghĩa là, đối với tất cả, trừ những từ phổ biến nhất, bạn cần viết mẫu từ nhiều người để tạo mối liên hệ với các đặc điểm tâm lý. Các nghiên cứu truyền thống đã tìm thấy những mối liên hệ thú vị với các danh mục từ được chọn trước như "cảm xúc tích cực" hoặc "từ chức năng".

Tuy nhiên, hàng tỷ mẫu từ có sẵn trên mạng xã hội cho phép chúng tôi tìm thấy các mẫu ở mức độ phong phú hơn nhiều ”.

Ngược lại, phương pháp tiếp cận từ vựng mở lấy các từ và cụm từ quan trọng từ chính mẫu. Với hơn 700 triệu từ, cụm từ và chủ đề được lấy từ mẫu thông điệp trạng thái Facebook của nghiên cứu này, có đủ dữ liệu để tìm hiểu hàng trăm từ và cụm từ phổ biến và tìm ngôn ngữ mở tương quan có ý nghĩa hơn với các đặc điểm cụ thể.

Kích thước dữ liệu lớn này rất quan trọng đối với kỹ thuật cụ thể mà nhóm đã sử dụng, được gọi là phân tích ngôn ngữ khác biệt, hoặc DLA.

Các nhà nghiên cứu đã sử dụng DLA để tách các từ và cụm từ tập hợp xung quanh các đặc điểm khác nhau được tự báo cáo trong bảng câu hỏi của các tình nguyện viên: tuổi, giới tính và điểm số cho các đặc điểm tính cách “Big Five” - hướng ngoại, dễ chịu, tận tâm, loạn thần kinh và cởi mở.

Mô hình Big Five được chọn vì đây là một cách phổ biến và được nghiên cứu kỹ lưỡng để định lượng các đặc điểm tính cách, nhưng phương pháp của các nhà nghiên cứu có thể được áp dụng cho các mô hình đo lường các đặc điểm khác, bao gồm cả trầm cảm hoặc hạnh phúc.

Để hình dung kết quả của họ, các nhà nghiên cứu đã tạo ra các đám mây từ tóm tắt ngôn ngữ dự đoán một cách thống kê một đặc điểm nhất định, với độ mạnh tương quan của một từ trong một cụm nhất định được biểu thị bằng kích thước của nó. Ví dụ: đám mây từ hiển thị ngôn ngữ được người hướng ngoại sử dụng nổi bật với các từ và cụm từ như “bữa tiệc”, “đêm tuyệt vời” và “đánh tôi lên”, trong khi đám mây từ dành cho người hướng nội có nhiều tham chiếu đến phương tiện truyền thông và biểu tượng cảm xúc của Nhật Bản.

Eichstaedt nói: “Có vẻ hiển nhiên là một người siêu hướng ngoại sẽ nói nhiều về các bữa tiệc, nhưng tổng hợp lại, những đám mây từ ngữ này cung cấp một cánh cửa chưa từng có vào thế giới tâm lý của những người có đặc điểm nhất định. Nhiều thứ dường như hiển nhiên sau khi thực tế và mỗi mục đều có ý nghĩa, nhưng liệu bạn có nghĩ đến tất cả, hoặc thậm chí hầu hết chúng? ”

Martin Seligman, giám đốc chương trình giải thích: “Khi tôi tự hỏi bản thân mình muốn trở thành một người hướng ngoại là như thế nào?” “Trở thành một cô gái tuổi teen là như thế nào?” “Tâm thần phân liệt hoặc rối loạn thần kinh là như thế nào?” Hoặc “Nó như thế nào? 70 tuổi? "Những đám mây từ này đến gần trung tâm của vấn đề hơn nhiều so với tất cả các bảng câu hỏi đang tồn tại."

Để kiểm tra mức độ chính xác mà họ nắm bắt các đặc điểm của mọi người thông qua phương pháp tiếp cận từ vựng mở của họ, các nhà nghiên cứu chia tình nguyện viên thành hai nhóm và xem liệu mô hình thống kê thu thập được từ một nhóm có thể được sử dụng để suy ra các đặc điểm của nhóm kia hay không. Đối với 3/4 số tình nguyện viên, các nhà nghiên cứu đã sử dụng các kỹ thuật máy học để xây dựng mô hình các từ và cụm từ dự đoán câu trả lời của bảng câu hỏi.

Sau đó, họ sử dụng mô hình này để dự đoán tuổi, giới tính và tính cách cho một phần tư còn lại dựa trên các bài đăng trên Facebook của họ.

Schwartz nói: “Mô hình dự đoán giới tính của một tình nguyện viên chính xác đến 92% từ cách sử dụng ngôn ngữ của họ, và chúng tôi có thể dự đoán tuổi của một người trong vòng ba năm hơn một nửa thời gian.

“Những dự đoán về tính cách của chúng tôi vốn đã kém chính xác hơn nhưng gần như tốt bằng việc sử dụng kết quả bảng câu hỏi của một người từ một ngày để dự đoán câu trả lời của họ cho cùng một bảng câu hỏi vào một ngày khác.”

Với phương pháp tiếp cận từ vựng mở được cho là có khả năng dự đoán ngang bằng hoặc nhiều hơn so với phương pháp tiếp cận đóng, các nhà nghiên cứu đã sử dụng các đám mây từ để tạo ra những hiểu biết mới về mối quan hệ giữa các từ và đặc điểm. Ví dụ: những người tham gia đạt điểm thấp trong thang điểm rối loạn thần kinh (tức là những người có cảm xúc ổn định nhất) đã sử dụng nhiều từ hơn đề cập đến các hoạt động theo đuổi xã hội, tích cực, chẳng hạn như “trượt tuyết”, “hội họp” hoặc “bóng rổ”.

“Điều này không đảm bảo rằng tập thể thao sẽ giúp bạn bớt loạn thần kinh hơn; Nó có thể là chứng loạn thần kinh khiến mọi người tránh thể thao, "Ungar nói. “Nhưng điều đó gợi ý rằng chúng ta nên khám phá khả năng những người loạn thần kinh sẽ trở nên ổn định hơn về mặt cảm xúc nếu họ chơi nhiều môn thể thao hơn.”

Bằng cách xây dựng một mô hình dự đoán về tính cách dựa trên ngôn ngữ của mạng xã hội, các nhà nghiên cứu giờ đây có thể dễ dàng tiếp cận những câu hỏi như vậy hơn. Thay vì yêu cầu hàng triệu người điền vào các cuộc khảo sát, các nghiên cứu trong tương lai có thể được thực hiện bằng cách yêu cầu các tình nguyện viên gửi nguồn cấp dữ liệu Facebook hoặc Twitter của họ cho nghiên cứu ẩn danh.

“Các nhà nghiên cứu đã nghiên cứu những đặc điểm tính cách này trong nhiều thập kỷ về mặt lý thuyết,” Eichstaedt nói, “nhưng giờ đây họ có một cửa sổ đơn giản về cách họ định hình cuộc sống hiện đại trong thời đại Facebook.”

Nguồn: Đại học Pennsylvania

!-- GDPR -->