Phân tích giọng nói AI có thể phát hiện trầm cảm ở trẻ nhỏ

Nghiên cứu mới cho thấy một thuật toán học máy có thể phát hiện các dấu hiệu lo lắng và trầm cảm trong các mẫu giọng nói của trẻ nhỏ. Kỹ thuật này có thể là một cách nhanh hơn và dễ dàng hơn để phát hiện các rối loạn khó phát hiện ở những người trẻ tuổi. Phát hiện sớm các vấn đề về cảm xúc là rất quan trọng để đảm bảo chăm sóc kịp thời.

Các nhà điều tra giải thích rằng khoảng 1/5 trẻ em bị lo âu và trầm cảm, được gọi chung là "rối loạn nội tâm hóa". Tuy nhiên, các dấu hiệu của rối loạn này rất khó nhận biết vì trẻ em dưới 8 tuổi không thể nói rõ nỗi đau khổ về cảm xúc của mình, khiến tình trạng bệnh khó phát hiện.

Nhu cầu chẩn đoán kịp thời rất quan trọng vì việc tiếp cận nhà cung cấp, có thể là các vấn đề về lịch trình hoặc xác minh bảo hiểm, thường là một quá trình tốn nhiều công sức.

Tiến sĩ Ellen McGinnis, nhà tâm lý học lâm sàng tại Trung tâm Trẻ em, Thanh thiếu niên và Gia đình thuộc Đại học Vermont, Trung tâm Y tế Vermont, cho biết: “Chúng tôi cần các bài kiểm tra khách quan, nhanh chóng để bắt trẻ khi chúng đang đau khổ. "Phần lớn trẻ em dưới tám tuổi không được chẩn đoán."

Nghiên cứu xuất hiện trong Tạp chí Y sinh và Tin học Y tế.

Chẩn đoán sớm là rất quan trọng vì trẻ em đáp ứng tốt với điều trị trong khi não của chúng vẫn đang phát triển, nhưng nếu không được điều trị, chúng sẽ có nhiều nguy cơ bị lạm dụng chất kích thích và tự tử hơn sau này.

Chẩn đoán tiêu chuẩn bao gồm một cuộc phỏng vấn bán cấu trúc 60-90 phút với một bác sĩ lâm sàng được đào tạo và người chăm sóc chính của họ.

McGinnis, cùng với kỹ sư y sinh của Đại học Vermont và tác giả cao cấp của nghiên cứu Ryan McGinnis, đã tìm cách sử dụng trí tuệ nhân tạo và máy học để chẩn đoán nhanh hơn và đáng tin cậy hơn.

Các nhà nghiên cứu đã sử dụng một phiên bản điều chỉnh của nhiệm vụ cảm ứng tâm trạng được gọi là Nhiệm vụ căng thẳng xã hội-Trier, nhằm gây ra cảm giác căng thẳng và lo lắng cho đối tượng.

Một nhóm gồm 71 trẻ em trong độ tuổi từ 3 đến 8 được yêu cầu ứng biến một câu chuyện dài 3 phút và nói rằng chúng sẽ được đánh giá dựa trên mức độ thú vị của nó. Nhà nghiên cứu đóng vai trò là thẩm phán vẫn nghiêm khắc trong suốt bài phát biểu và chỉ đưa ra phản hồi trung lập hoặc tiêu cực. Sau 90 giây và một lần nữa khi còn lại 30 giây, một còi sẽ phát ra và trọng tài sẽ cho họ biết thời gian còn lại.

Ellen McGinnis nói: “Nhiệm vụ được thiết kế để trở nên căng thẳng và khiến họ nghĩ rằng ai đó đang đánh giá họ.

Những đứa trẻ cũng được chẩn đoán bằng cách sử dụng một cuộc phỏng vấn lâm sàng có cấu trúc và bảng câu hỏi dành cho phụ huynh, cả hai cách đều được thiết lập để xác định các rối loạn bên trong ở trẻ em.

Các nhà nghiên cứu đã sử dụng thuật toán học máy để phân tích các đặc điểm thống kê của bản ghi âm câu chuyện của từng đứa trẻ và liên hệ chúng với chẩn đoán của trẻ. Họ nhận thấy rằng thuật toán đã rất thành công trong việc chẩn đoán trẻ em và giai đoạn giữa của các bản ghi, giữa hai bộ rung, là dự đoán chính xác nhất về một chẩn đoán.

Ryan McGinnis cho biết: “Thuật toán có thể xác định chẩn đoán trẻ mắc chứng rối loạn nội tâm hóa với độ chính xác 80% và trong hầu hết các trường hợp, nó thực sự tốt so với độ chính xác của danh sách kiểm tra dành cho cha mẹ.

Nó cũng có thể đưa ra kết quả nhanh hơn nhiều - thuật toán chỉ yêu cầu một vài giây thời gian xử lý sau khi tác vụ hoàn tất để đưa ra chẩn đoán.

Thuật toán đã xác định tám đặc điểm âm thanh khác nhau trong lời nói của trẻ, nhưng ba đặc điểm nổi bật là có dấu hiệu cao về rối loạn nội tâm: giọng nói trầm, với nội dung và nội dung giọng nói lặp đi lặp lại và phản ứng có âm vực cao hơn đối với tiếng rung đáng ngạc nhiên.

Ellen McGinnis cho biết những đặc điểm này rất phù hợp với những gì bạn có thể mong đợi ở một người bị trầm cảm. Ellen McGinnis nói: “Giọng nói the thé và các yếu tố nói có thể lặp lại phản ánh những gì chúng ta nghĩ đến khi nghĩ về bệnh trầm cảm: nói với giọng đều đều, lặp lại những gì bạn đang nói.

Phản ứng có cường độ cao hơn đối với tiếng rung cũng tương tự như phản ứng mà các nhà nghiên cứu đã tìm thấy trong công trình trước đây của họ, nơi trẻ em bị rối loạn nội tâm hóa được phát hiện có phản ứng quay lưng lớn hơn trước một kích thích sợ hãi trong nhiệm vụ cảm ứng sợ hãi.

Phân tích giọng nói có độ chính xác chẩn đoán tương tự như phân tích chuyển động trong công trình trước đó, nhưng Ryan McGinnis cho rằng nó sẽ dễ sử dụng hơn nhiều trong môi trường lâm sàng.

Nhiệm vụ sợ hãi yêu cầu một căn phòng tối, con rắn đồ chơi, cảm biến chuyển động gắn liền với trẻ và một người hướng dẫn, trong khi nhiệm vụ thoại chỉ cần một thẩm phán, một cách để ghi âm lời nói và một còi để ngắt lời. Ông nói: “Điều này sẽ khả thi hơn để triển khai.

Ellen McGinnis cho biết bước tiếp theo sẽ là phát triển thuật toán phân tích giọng nói thành một công cụ sàng lọc toàn cầu để sử dụng trong lâm sàng, có thể thông qua một ứng dụng điện thoại thông minh có thể ghi lại và phân tích kết quả ngay lập tức.

Phân tích giọng nói cũng có thể được kết hợp với phân tích chuyển động thành một loạt các công cụ chẩn đoán được hỗ trợ bởi công nghệ, để giúp xác định trẻ em có nguy cơ lo lắng và trầm cảm trước khi cha mẹ của chúng nghi ngờ rằng có bất cứ điều gì không ổn.

Nguồn: Đại học Vermont

!-- GDPR -->