Đưa tin thú vị về khoa học: TweetPsych

Một dịch vụ mới được ra mắt trong tuần này bởi một nhà phát triển web tên Dan Zarrella có tên là TweetPsych. Zarrella cũng là giám đốc tiếp thị của HubSpot, một công ty tiếp thị trực tuyến. Zarrella tự gọi mình là “nhà khoa học”, bởi vì tôi đoán điều đó nghe có vẻ quyến rũ hơn “nhà phát triển web” hoặc “giám đốc tiếp thị”, nhưng anh ấy không liệt kê bất kỳ bằng chứng học tập nào. (Tôi sẽ không đề cập đến nhà khoa học hoặc phần chứng chỉ ngoại trừ việc Zarrella đưa ra tuyên bố khoa học cụ thể về dịch vụ mới của anh ấy.)

Dịch vụ mới thú vị được tiếp thị là cung cấp “hồ sơ tâm lý” dựa trên những gì bạn đăng lên Twitter. Nhưng nó thực sự chỉ là một dịch vụ phân tích nội dung, sử dụng hai từ điển tâm lý và 1.000 tweet trong quá khứ của bạn. Zarrella tuyên bố phân tích này "xây dựng hồ sơ tâm lý của một người." Lập hồ sơ tâm lý thực sự là một môn khoa học và thường được thực hiện với nhiều thứ hơn là chỉ một phần trong cuộc sống của một người (chẳng hạn như những gì họ viết trên một dịch vụ blog nhỏ). TweetPsych sau đó đưa ra tuyên bố mâu thuẫn rằng nó chỉ dành cho “mục đích giải trí”. Đó là nó?

Có vấn đề với một trong những từ điển mà Zarrella đang sử dụng trong phân tích. Một từ điển - LIWC - là một cơ sở dữ liệu ngôn ngữ học tâm lý học hợp lệ. Nhưng cái khác, Từ điển hình ảnh suy thoái tiếng Anh (RID), thì ít hơn. RID bao gồm khoảng 3.200 từ và gốc rễ được gán cho 43 loại suy nghĩ và tâm trạng. Vấn đề chính với RID là về cơ bản không có nghiên cứu nào hỗ trợ (mặc dù Zarrella trích dẫn một trang web khiến nó có vẻ như có). Nó được phát triển bởi một chuyên gia duy nhất, người sau đó đã viết một loạt sách về nó và các quá trình phân tâm học khác. Một cuốn sách không giống như một bài báo trên tạp chí nghiên cứu được bình duyệt (như các nhà nghiên cứu đã biết) và RID hoàn toàn thiếu bất kỳ sự ủng hộ thực nghiệm nào. Điều này cho thấy rằng một nửa phân tích là không hợp lệ trước khi chúng ta bắt đầu.

Từ điển thứ hai, Truy vấn Ngôn ngữ và Đếm Từ (LIWC), chủ yếu dựa trên từ viết - bài viết của mọi người - hoặc từ được nói - như một buổi trị liệu hoặc cuộc trò chuyện giữa hai người. Nó không được phát triển để phân tích các mục nhập ngắn 140 ký tự giả tạo, chẳng hạn như các mục tìm thấy trên Twitter. Mọi người viết tắt các từ khi tweet, vì giới hạn ký tự và không rõ ràng rằng việc viết tắt đơn giản sẽ phân tích chính xác tất cả các từ được viết bằng cách viết tắt nhanh không chuẩn. Điều gì về các tweet lại là tốt? Một người retweet điều gì đó không nhất thiết phải là “nói” mà thay vào đó họ đóng vai trò là người phát ngôn cho lời nói của người khác. Dịch vụ có khác biệt không? Nếu không biết mức độ của vấn đề, bạn sẽ không biết liệu phân tích của bạn có thiên vị giả tạo theo một cách nào đó hay không (trừ khi bạn đã nghiên cứu cụ thể những loại vấn đề này trước). Những vấn đề này có thể giải quyết được, nhưng chưa được giải quyết trong dịch vụ này.

Khả năng phân tích nhanh chóng 1.000 tweet của Zarrella và so sánh tất cả văn bản trong đó với hai từ điển này trong vài giây là một kỳ tích đáng ngưỡng mộ của lập trình ngôn ngữ. Thách thức sau đó phải đối mặt là “Làm cách nào để trình bày kết quả phân tích một cách chu đáo, trực quan và dễ hành động?” Đây là phần mà TweetPsych đơn giản là không phân phối được.

Vì Zarrella dường như có ít kiến ​​thức về tâm lý học, nên kết quả tâm lý học khá không hài lòng. Bạn nhận được một danh sách các "đặc điểm" (tính cách của bạn? Tweet của bạn?) Bao gồm những thứ như "Nghề nghiệp và Công việc." Bên cạnh đó là mô tả hữu ích, "Bạn nói rất nhiều về công việc và công việc của bạn" và điểm số.

Gee, cảm ơn vì cái nhìn sâu sắc

Bạn không biết điểm số có ý nghĩa gì vì không có ngữ cảnh cho nó. 47,87 cho công việc là tốt hay xấu? Mức trung bình là bao nhiêu? Các tính năng khác bao gồm “Căng thẳng hiện tại”, “Chuyển động đi lên”, “Cảm xúc tích cực”, “Cảm xúc tiêu cực” và ba chục danh mục khác.

Phần phân tích này, dựa trên LIWC, cũng tốt như từ điển cơ bản của LIWC. Trong khi các danh mục như công việc, thành tích và giải trí đều là “mối quan tâm hiện tại” mà LIWC có thể xác định, nó không có danh mục nào cho những thứ như “mối quan tâm về mối quan hệ”. Nhưng bạn sẽ không biết điều đó trừ khi bạn biết LIWC. Đó có thể là điều bạn muốn đề cập với những người thực hiện phân tích. Nội dung chủ đề phổ biến khác được tweet thường xuyên - như chính trị, công nghệ và người nổi tiếng - cũng không phải là một phần của LIWC. Vì vậy, một lần nữa, chúng sẽ không bao giờ xuất hiện trong phân tích, ngay cả khi đó là tất cả những gì bạn nói. Vì vậy, thông tin mà LIWC - và phần mở rộng, TweetPsych - có thể cung cấp bị hạn chế. (Việc sử dụng từ điển tùy chỉnh giải quyết một số vấn đề này, nhưng nó không phải là từ điển mà TweetPsych cung cấp.)

“Nội dung nguyên thủy, khái niệm và cảm xúc” từ RID hoàn toàn không có mô tả và một lần nữa, không có gì để đặt điểm số của bạn vào bất kỳ loại ngữ cảnh hoặc hiểu biết nào. Nhưng vì nó không phải là một từ điển khoa học để bắt đầu, bạn có thể bỏ qua khá nhiều điểm. Chúng có thể được phát triển ngẫu nhiên và cung cấp nhiều thông tin hữu ích.

Phần cuối cùng của phân tích hiện tại là “Những người khác thích bạn”, một thành phần phổ biến của bất kỳ dịch vụ mạng xã hội nào. Thật kỳ lạ, thành phần này bị thiếu trong phiên bản đầu tiên của công cụ này. Chỉ dựa trên những gì bạn tweet, nó tuyên bố "Một số người nghĩ giống bạn" và sau đó cung cấp cho bạn danh sách những người khác đã truy cập vào TweetPsych và nhập tên người dùng của họ để phân tích.

Tất nhiên nó là không phải những người nghĩ giống bạn - đó là những người tweet giống bạn. Đây là một dấu hiệu đặc biệt quan trọng. Một dịch vụ phân tích một phần nhỏ những gì bạn viết hàng ngày và dựa trên một phân tích có thể bị sai sót do việc sử dụng rộng rãi các chữ viết tắt của người dùng, chắc chắn không thể tuyên bố sẽ phân tích những gì bạn suy nghĩ.

TweetPsych đáng tin cậy như thế nào? Chà, hôm nay khi tôi viết bài này, tôi nhận thấy rằng tất cả điểm số của Dan Zarrella đã thay đổi chỉ vì một tweet duy nhất (hôm nay anh ấy chỉ tweet một lần). Điểm “nghề nghiệp và công việc” của anh ấy giảm 20%, và điểm “thì hiện tại” tăng 16%. Điểm suy nghĩ trừu tượng của anh ấy giảm 16%. Làm thế nào tất cả những điều này có thể xảy ra chỉ từ một tweet? Một tweet - so với 999 tweet khác của anh ấy - sẽ không thể ảnh hưởng nhiều đến điểm số của một người. Trừ khi có điều gì khác đang diễn ra.(So ​​sánh ảnh chụp màn hình bên dưới, được chụp lúc 2:55 chiều theo giờ ET, với ảnh ở trên, được chụp lúc 9:00 sáng theo giờ ET hôm nay.)

Kết quả của riêng tôi khi phân tích 1.000 tweet trước đây của Zarrella trong chương trình LIWC2007 cho thấy điều gì đó rất khác. Tôi không biết phương pháp luận của Zarrella (vì anh ấy không chia sẻ nó), nhưng tôi đã lấy nội dung của 1.000 tweet trước đây của anh ấy và xử lý chúng ở hai dạng thông qua LIWC - xuất phát và “nguyên trạng”. Cả hai sản phẩm đều không đạt điểm nào gần với những gì xuất hiện trên TweetPsych. Điều này có thể là do anh ấy sử dụng phiên bản cũ hơn của từ điển hoặc một số loại biến chuyển đổi mà anh ấy đang thêm vào TweetPsych mà anh ấy không tiết lộ. Bạn có thể xem kết quả phân tích LIWC2007 này tại đây. (Tôi đã đánh dấu những thứ màu vàng mà TweetPsych đã đánh dấu và ở những khu vực màu xanh lá cây khác không còn được TweetPsych đánh dấu nữa; lưu ý sự khác biệt đáng kể trong việc chấm điểm.) Tuy nhiên, điều này khiến bạn tự hỏi, chính xác thì điều gì đang xảy ra với dịch vụ. Nếu độ tin cậy và hiệu lực đo lường tâm lý của nó còn nhiều nghi vấn, thì nó hữu ích như thế nào?

TweetPsych đang nhận được rất nhiều báo chí tích cực, chỉ với một chút hoài nghi. Josh Lowensohn của CNet đã viết về dịch vụ và chỉ lưu ý rằng, "Điều này làm cho nó ít hơn về tâm lý và nhiều hơn về từ vựng cá nhân của bạn, nhưng kết quả vẫn khá vui vẻ." Yay, vui vẻ! Ben Patterson qua Yahoo! Tech cho biết, “Thật không may, các hồ sơ tâm lý mà TweetPsych phân phối không phải là sự đa dạng, mạch lạc mà bạn có thể nghe từ bác sĩ tâm thần thường trú về“ Luật & Trật tự: Mục đích tội phạm ”. Và tuy nhiên, một câu chuyện mạch lạc không hữu ích hơn nhiều. hơn một số danh mục không có gì? Không ai trong số các phóng viên, cũng như bài báo gốc trên Mashable (ở đây, thật bất ngờ !, Zarrella là một người đóng góp), lưu ý rằng việc thiếu nền tảng tâm lý mà Zarrella đưa ra bàn luận. Không có kết nối nào kết nối các dấu chấm tại sao kết quả lại không hài lòng trong cách giải thích của họ. Rõ ràng các nhà báo công nghệ rất giỏi trong việc phân phối lại các thông cáo báo chí tích cực của riêng họ, nhưng không quá giỏi trong việc trở thành những nhà báo thực tế, những người đào sâu vào khoa học đã được khẳng định của một dịch vụ như vậy.

Tất nhiên, bản thân Zarrella cũng thừa nhận anh ấy không nghĩ nhiều đến dịch vụ này, như anh ấy đã nói với NY Post, ““ Mọi người chỉ thích so sánh mình với người khác và cố gắng ‘thâm nhập’ vào suy nghĩ của người khác, ”Zarrella nói. “Giống như bay trên tường trong một buổi trị liệu.” “Một buổi trị liệu? Có thực sự sâu sắc đến mức phát hiện ai đó đang nói về “chuyển động đi lên” không? Trong lúc vội vàng đưa dịch vụ lên mạng, Zarrella dường như chưa bao giờ đặt câu hỏi, "Có thông tin nào thực sự hữu ích không?" Dịch vụ này, như nó tồn tại ngày nay, là một suy nghĩ chưa hoàn thiện mà ít người sẽ xem lại.

TweetPsych, bất chấp những hạn chế của nó, đã mở ra cánh cửa cho các dịch vụ trong tương lai thực sự cung cấp thông tin hữu ích, hữu ích và có thể hành động có thể có giá trị cao hơn. Hãy tưởng tượng không chỉ lấy tweet của một người mà còn thông tin có trong hồ sơ Facebook, blog, v.v. của họ, và đặt tất cả vào một công cụ phân tích khổng lồ… Một công cụ như vậy có thể có khả năng cung cấp cái nhìn sâu sắc về tâm lý thực sự về một cá nhân dựa trên những gì họ nói trực tuyến.

Cho đến thời điểm đó, chúng tôi có những nỗ lực dành cho sinh viên năm nhất như TweetPsych, thực sự nên được gọi là “TweetFun!” Bởi vì trong khi chơi với nó thực sự rất thú vị, nó cung cấp rất ít cái nhìn sâu sắc về tâm lý - ngoại trừ loại nông cạn nhất - cho bất kỳ ai.

(Bạn có thể đọc thêm các mối quan tâm về TweetPsych của Tyler Hayes tại đây.)

!-- GDPR -->