Học máy có thể giúp dự đoán chứng loạn thần thông qua phân tích ngôn ngữ

Một phương pháp học máy mới có thể dự đoán với độ chính xác 93% liệu một người có nguy cơ mắc chứng loạn thần có tiếp tục phát triển chứng rối loạn này hay không.

Phương pháp được phát triển bởi các nhà khoa học tại Đại học Emory và Đại học Harvard, phát hiện ra rằng việc sử dụng các từ liên quan đến âm thanh cao hơn mức bình thường, kết hợp với tỷ lệ sử dụng các từ có nghĩa tương tự cao hơn, có nghĩa là có khả năng bị rối loạn tâm thần.

Ngay cả các bác sĩ lâm sàng được đào tạo cũng không nhận thấy cách những người có nguy cơ bị rối loạn tâm thần sử dụng nhiều từ liên quan đến âm thanh hơn mức trung bình, mặc dù nhận thức thính giác bất thường là một dấu hiệu cảnh báo sớm.

Neguine Rezaii, tác giả đầu tiên của bài báo cho biết: “Cố gắng nghe những điều tinh tế này trong cuộc trò chuyện với mọi người cũng giống như cố gắng nhìn thấy những vi trùng cực nhỏ bằng mắt của bạn. “Kỹ thuật tự động mà chúng tôi đã phát triển là một công cụ thực sự nhạy cảm để phát hiện những mẫu ẩn này. Nó giống như một chiếc kính hiển vi để cảnh báo các dấu hiệu rối loạn tâm thần ”.

Sự khởi phát của tâm thần phân liệt và các rối loạn tâm thần khác thường xảy ra vào đầu những năm 20 tuổi, với các dấu hiệu cảnh báo sớm - được gọi là hội chứng thần đồng - bắt đầu vào khoảng tuổi 17. Khoảng 25 đến 30 phần trăm thanh niên mắc hội chứng thần kinh cuối cùng sẽ phát triển tâm thần phân liệt hoặc một chứng rối loạn tâm thần khác.

Hiện nay, không có cách chữa trị cho chứng loạn thần. Thông qua các cuộc phỏng vấn có cấu trúc và các bài kiểm tra nhận thức, các bác sĩ lâm sàng được đào tạo có thể dự đoán chứng rối loạn tâm thần với độ chính xác khoảng 80% ở những người mắc hội chứng hoang tưởng.

Hiện nay, nghiên cứu với máy học, một dạng trí tuệ nhân tạo có thể phát hiện ra các mẫu ẩn, là một trong nhiều nỗ lực không ngừng nhằm hợp lý hóa các phương pháp chẩn đoán, xác định các biến mới và cải thiện độ chính xác của các dự đoán.

Tác giả cao cấp Phillip Wolff, giáo sư tâm lý học tại Emory cho biết: “Trước đây người ta đã biết rằng các đặc điểm tinh vi của chứng rối loạn tâm thần trong tương lai hiện diện trong ngôn ngữ của con người, nhưng chúng tôi đã sử dụng công nghệ máy học để thực sự khám phá các chi tiết ẩn về những đặc điểm đó. Phòng thí nghiệm của Wolff tập trung vào ngữ nghĩa ngôn ngữ và học máy để dự đoán khả năng ra quyết định và sức khỏe tâm thần.

Đối với nghiên cứu, các nhà nghiên cứu lần đầu tiên sử dụng máy học để thiết lập "quy chuẩn" cho ngôn ngữ đàm thoại. Họ cung cấp cho một chương trình phần mềm máy tính các cuộc trò chuyện trực tuyến của 30.000 người dùng Reddit, một nền tảng truyền thông xã hội nơi mọi người thảo luận không chính thức về một loạt các chủ đề.

Chương trình phần mềm, được gọi là Word2Vec, sử dụng một thuật toán để thay đổi các từ riêng lẻ thành vectơ (một thuật ngữ toán học đề cập đến vị trí của một điểm trong không gian so với vị trí khác). Nói cách khác, chương trình đã gán mỗi từ cho một vị trí trong không gian ngữ nghĩa dựa trên nghĩa của nó. Những từ có nghĩa tương tự được đặt gần nhau hơn những từ có nghĩa rất khác nhau.

Phòng thí nghiệm Wolff cũng phát triển một chương trình máy tính để thực hiện “giải nén véc tơ” hoặc phân tích mật độ ngữ nghĩa của việc sử dụng từ. Việc giải nén vector cho phép các nhà nghiên cứu định lượng lượng thông tin được đóng gói trong mỗi câu.

Sau khi tạo ra một cơ sở dữ liệu “bình thường”, các nhà nghiên cứu đã áp dụng các kỹ thuật tương tự để phỏng vấn chẩn đoán 40 thanh niên có nguy cơ cao bị rối loạn tâm thần. Sau đó, các phân tích tự động của các mẫu tham gia được so sánh với mẫu cơ sở bình thường.

Kết quả cho thấy việc sử dụng các từ liên quan đến âm thanh cao hơn bình thường, cùng với tỷ lệ sử dụng các từ có nghĩa tương tự cao hơn, có nghĩa là chứng rối loạn tâm thần có khả năng xảy ra.

Điểm mạnh của nghiên cứu bao gồm sự đơn giản của việc chỉ sử dụng hai biến - cả hai đều có nền tảng lý thuyết vững chắc - sao chép kết quả trong tập dữ liệu lưu giữ và độ chính xác cao của các dự đoán của nó, trên 90%.

Rezaii nói: “Trong lĩnh vực lâm sàng, chúng tôi thường thiếu độ chính xác. “Chúng tôi cần những cách khách quan, được định lượng hơn để đo lường các biến số tinh vi, chẳng hạn như những biến số ẩn trong việc sử dụng ngôn ngữ.”

Rezaii và Wolff hiện đang thu thập các tập dữ liệu lớn hơn và thử nghiệm việc áp dụng các phương pháp của họ trên nhiều loại bệnh tâm thần kinh, bao gồm cả chứng sa sút trí tuệ.

Wolff nói: “Nghiên cứu này thú vị không chỉ vì tiềm năng tiết lộ nhiều hơn về bệnh tâm thần, mà còn để hiểu cách thức hoạt động của tâm trí - cách nó kết hợp các ý tưởng lại với nhau”. “Công nghệ máy học đang phát triển nhanh chóng đến mức nó cung cấp cho chúng tôi các công cụ để khai thác dữ liệu trong tâm trí con người”.

Đồng tác giả Elaine Walker, giáo sư tâm lý học và khoa học thần kinh của Emory, cho biết “Nếu chúng ta có thể xác định những cá nhân có nguy cơ sớm hơn và sử dụng các biện pháp can thiệp phòng ngừa, chúng ta có thể đảo ngược sự thâm hụt”.

Các phát hiện được công bố trên tạp chí npj Tâm thần phân liệt.

Nguồn: Emory Health Sciences

!-- GDPR -->