Lắng nghe ‘Hiệu ứng tiệc cocktail’ trong não

Một số cá nhân có thể tập trung vào một người nói mặc dù môi trường xung quanh che khuất giọng nói của một người. Bối cảnh có thể là lớp học, quán bar hoặc sự kiện thể thao – khả năng này không phải là duy nhất và đã được các nhà tâm lý học mô tả là “hiệu ứng tiệc cocktail”.

Một nỗ lực nghiên cứu mới do một nhà giải phẫu thần kinh của Đại học California - San Francisco và một nghiên cứu sinh sau tiến sĩ đã tập trung vào việc khám phá cách hoạt động của thính giác có chọn lọc trong não.

Edward Chang, M.D., và Nima Mesgarani, Ph.D., đã làm việc với ba bệnh nhân đang phẫu thuật não vì chứng động kinh nặng.

Một phần của phẫu thuật này liên quan đến việc xác định chính xác các bộ phận của não chịu trách nhiệm vô hiệu hóa các cơn động kinh. Bài tập này liên quan đến việc lập bản đồ hoạt động của não trong hơn một tuần, với một tấm mỏng có tới 256 điện cực được đặt dưới hộp sọ trên bề mặt ngoài của não hoặc vỏ não. Các điện cực ghi lại hoạt động ở thùy thái dương - nơi có vỏ não thính giác.

Chang cho biết khả năng ghi lại các bản ghi âm nội sọ một cách an toàn mang lại cơ hội duy nhất để nâng cao kiến ​​thức cơ bản về cách thức hoạt động của não.

Chang nói: “Sự kết hợp của các bản ghi âm độ phân giải cao của não và các thuật toán giải mã mạnh mẽ sẽ mở ra một cánh cửa dẫn vào trải nghiệm chủ quan của tâm trí mà chúng ta chưa từng thấy trước đây.

Trong các thí nghiệm, bệnh nhân nghe đồng thời hai mẫu giọng nói trong đó các cụm từ khác nhau được nói bởi những người nói khác nhau. Họ được yêu cầu xác định những từ họ nghe được nói bởi một trong hai người nói.

Sau đó, các tác giả đã áp dụng các phương pháp giải mã mới để “tái tạo lại” những gì đối tượng nghe được từ việc phân tích các mô hình hoạt động não của họ.

Đáng chú ý, các tác giả nhận thấy rằng phản ứng thần kinh trong vỏ não thính giác chỉ phản ánh phản ứng của người nói được nhắm mục tiêu. Họ phát hiện ra rằng thuật toán giải mã của họ có thể dự đoán người nói nào và thậm chí những từ cụ thể mà đối tượng đang nghe dựa trên các mẫu thần kinh đó. Nói cách khác, họ có thể biết khi nào sự chú ý của người nghe chuyển sang người nói khác.

“Thuật toán hoạt động tốt đến mức chúng tôi không chỉ có thể dự đoán các câu trả lời đúng mà còn cả khi họ chú ý đến từ sai,” Chang nói.

Những phát hiện mới cho thấy sự thể hiện của lời nói trong vỏ não không chỉ phản ánh toàn bộ môi trường âm thanh bên ngoài mà thay vào đó là những gì chúng ta thực sự muốn hoặc cần nghe.

Chúng đại diện cho một tiến bộ lớn trong việc hiểu cách não người xử lý ngôn ngữ, có ý nghĩa tức thì đối với việc nghiên cứu sự suy giảm trong quá trình lão hóa, rối loạn thiếu tập trung, chứng tự kỷ và rối loạn học ngôn ngữ.

Ngoài ra, Chang nói rằng một ngày nào đó chúng ta có thể sử dụng công nghệ này cho các thiết bị thẩm mỹ thần kinh để giải mã ý định và suy nghĩ của những bệnh nhân bị liệt không thể giao tiếp.

Sự hiểu biết về cách bộ não của chúng ta có dây để ủng hộ một số tín hiệu thính giác hơn những tín hiệu khác có thể khuyến khích các phương pháp tiếp cận mới nhằm tự động hóa và cải thiện cách các giao diện điện tử kích hoạt bằng giọng nói lọc âm thanh để phát hiện đúng các lệnh bằng lời nói.

Phương pháp mà bộ não có thể tập trung hiệu quả vào một giọng nói là một lĩnh vực được các công ty phát triển thiết bị điện tử có giao diện hoạt động bằng giọng nói quan tâm nhiều.

Trong khi các công nghệ nhận dạng giọng nói cho phép các giao diện như Siri của Apple đã đi được một chặng đường dài trong vài năm qua, chúng vẫn chưa tinh vi như hệ thống giọng nói của con người. Ví dụ, một người bình thường có thể bước vào một căn phòng ồn ào và trò chuyện riêng một cách tương đối dễ dàng - như thể tất cả các giọng nói khác trong phòng đều bị tắt tiếng.

Mesgarani, một kỹ sư có nền tảng về nghiên cứu nhận dạng giọng nói tự động cho biết, nhận dạng giọng nói là “thứ mà con người rất giỏi, nhưng hóa ra việc mô phỏng khả năng này của con người là vô cùng khó khăn”.

Bài báo nghiên cứu xuất hiện trên tạp chí Thiên nhiên.

Nguồn: Đại học California, San Francisco (UCSF)

!-- GDPR -->