Ngay cả Facebook cũng không hiểu các thuật toán của Facebook
Sau tất cả những rắc rối đến từ cảnh tượng "tin tức giả mạo" nhờ nguồn cấp tin tức của Facebook - nội dung bạn thấy khi đăng nhập vào Facebook từ điện thoại hoặc máy tính xách tay - một điều đã trở nên rõ ràng. Ngay cả Facebook cũng không hiểu Facebook.
Và đó là vấn đề với việc dựa vào trí tuệ nhân tạo (AI) theo thuật toán đã được xây dựng (hay chính xác hơn là ghép lại với nhau) trong nhiều năm bởi hàng trăm nhà phát triển và lập trình viên khác nhau.
Tất cả điều này đã trở nên rõ ràng với tôi trong vài ngày qua khi tôi nghiền ngẫm những điều tôi học được tại hội nghị HealtheVoices 2017 mới nhất và sau khi đọc một bài báo xuất sắc về Facebook của Farhad Manjoo trong Tạp chí New York Times.
Tại hội nghị, một đại diện của Facebook đã phải đối mặt với một đám đông chất vấn có phần thất vọng (và đôi khi gần như thù địch) về việc tại sao những thứ họ viết với tư cách là các nhà hoạt động y tế và những người ủng hộ dường như hiếm khi xuất hiện trên nguồn cấp tin tức Facebook của người khác. Những người trong số khán giả ngày hôm đó cho biết, cách duy nhất để nó có được sự tương tác là mua nó qua Facebook (thông qua một cơ chế trả phí được gọi là “thúc đẩy” một bài đăng).
Đại diện của Facebook không có câu trả lời cho những câu hỏi này về lý do tại sao nội dung có vẻ chất lượng cao, tốt lại không được hiển thị trong nguồn cấp tin tức của họ. Tuy nhiên, mọi người tham gia mà tôi đã nói chuyện cùng - những người ủng hộ sức khỏe nhiệt tình, gắn bó - đều coi đó là một vấn đề với Facebook. Nhưng ngay cả Facebook cũng không thể giải thích cách khắc phục nó.
Không có gì thắc mắc. Bài báo của Tạp chí Times làm sáng tỏ “tại sao”. Mặc dù vậy, thuật toán nguồn cấp tin tức của Facebook sắp xếp trung bình 2.000 mẩu nội dung có thể có mỗi khi một người tải Facebook lần đầu tiên và mỗi lần làm mới.
Có rất nhiều biến số đi vào thuật toán sắp xếp phức tạp, tối tăm và độc quyền đó mà ngay cả Facebook cũng không thể trả lời lý do tại sao điều gì đó sẽ hoặc sẽ không hiển thị trong nguồn cấp tin tức của ai đó. Đó cũng là nỗi đau giống như các quản trị viên web từ lâu đã cảm thấy khi giao dịch với Google và thuật toán lập chỉ mục tìm kiếm của họ.
Thực tế là thuật toán có thể dễ dàng bị bỏ qua chỉ bằng cách mua quyền truy cập vào nguồn cấp tin tức của mọi người không có gì ngạc nhiên. Đó là một phần lớn lý do khiến Facebook kiếm được rất nhiều tiền từ năm này qua năm khác. Ngay cả những nội dung chất lượng kém nhất cũng có thể xuất hiện trên nguồn cấp tin tức được cho là cá nhân hóa của bạn.
News Feed: Vẫn đang trong quá trình hoàn thiện
Bạn nghĩ rằng sau rất nhiều năm làm việc chăm chỉ, sự chú ý, hàng giờ đồng hồ của các nhà phát triển và nghiên cứu về thuật toán này, nó sẽ có được một số điều cơ bản. Nhưng hai giai thoại gần đây cho tôi thấy rằng AI được ca ngợi của Facebook vẫn còn phải đi xa hơn nữa.
Đầu tiên là meme buổi hòa nhạc đã chiếm vị trí trên nguồn cấp dữ liệu tin tức của Facebook vào cuối tháng 4 năm 2017. Trong meme cụ thể này, những người tham gia liệt kê 10 buổi hòa nhạc mà họ đã tham dự trong đời, nhưng một trong số đó là giả. Bạn bè của người đó có thể phát hiện ra buổi hòa nhạc giả mà họ không tham dự hay không và nhận xét về nó.
Suy nghĩ ban đầu của tôi khi lần đầu tiên nhìn thấy cửa sổ bật lên này là "Ai quan tâm chứ?" bởi vì, thành thật mà nói, tôi không quan tâm bạn bè của tôi đã tham dự những buổi hòa nhạc nào. Nếu tôi tham gia vào một cuộc trò chuyện thực tế với bạn bè của mình về chủ đề “các buổi hòa nhạc mà chúng tôi đã xem”, điều đó có thể rất thú vị. Nhưng với tư cách là người bắt đầu cuộc trò chuyện, tôi thấy nó không có ý nghĩa gì vì nó không hợp lý - được kết nối xã hội với không có gì. Vì vậy, tôi đã nhấn "Ẩn bài đăng này" từ bài đăng đầu tiên tôi thấy trên nguồn cấp dữ liệu tin tức của mình.
Điều đó có giúp ngăn dòng nội dung này tràn vào nguồn cấp dữ liệu tin tức của tôi trong vài ngày tới không? Không phải một iota. Tôi đã thấy không ít hơn một tá câu hỏi như vậy trong hai ngày tới tràn ngập nguồn cấp dữ liệu của tôi (ngay cả sau khi nhấp vào “Ẩn bài đăng này” trên ít nhất hai câu hỏi nữa). Tất cả những điều đó đều không quan tâm đến tôi. AI của Facebook đang hoạt động rất nhiều.
Thứ hai là Quận Bloom. Tôi là một người hâm mộ lớn và rất vui khi Berkeley Breathed bắt đầu vẽ lại. Tôi mong đợi từng ngày khi một truyện tranh mới của anh ấy xuất hiện trong nguồn cấp dữ liệu của tôi. Tuy nhiên, một cách bí ẩn, Facebook không có manh mối nào về điều này. Nó đã ngừng hiển thị truyện tranh của anh ấy cho tôi vài tuần trước, mặc dù tôi đã chăm chú nhấp vào hầu hết chúng để đọc chúng dễ dàng hơn ở dạng phóng to của chúng.
Làm thế nào mà quá nhiều nhấp chuột lại có thể dẫn đến thẻ “không quan tâm, ngừng hiển thị thông tin này cho người dùng này”? Facebook không thể trả lời câu hỏi này nếu họ muốn, bởi vì họ không biết thuật toán nguồn cấp tin tức của mình thực sự hoạt động như thế nào - hoặc không hoạt động - đối với người dùng cá nhân. Điều này sẽ thật buồn cười nếu nó không phải là một vấn đề lớn như vậy. Theo Trung tâm Nghiên cứu Pew, hơn một nửa số người Mỹ nhận được tin tức của họ từ Facebook.
Biểu mẫu phản hồi cung cấp ít phản hồi cho người dùng
Facebook tuyên bố họ có thể đánh giá (và tìm cách khắc phục) rất nhiều vấn đề nếu người dùng chỉ sử dụng biểu mẫu phản hồi của họ thường xuyên hơn. Nhưng có một lý do khiến người dùng ghét đưa ra phản hồi từ Facebook - hệ thống phản hồi của họ chỉ hút.
Các biểu mẫu phản hồi của Facebook cung cấp cho người dùng rất ít phản hồi của chính nó, và thay vào đó, đánh giá cao việc dẫn dắt người dùng xuống một loạt các câu hỏi “Đây là cách tự khắc phục vấn đề này, đồ ngốc” dường như luôn gợi ý rằng hầu hết các vấn đề bạn gặp phải là của bạn sửa chữa - không phải của Facebook. Không có con người ở cuối các biểu mẫu đó và không có phản hồi của con người mà bạn sẽ nhận được. Đây là định nghĩa của vô nhân đạo. Thật mỉa mai cho một công ty tự cho rằng mình đang “xây dựng một cộng đồng toàn cầu” kết nối mọi người với nhau hơn. Làm cách nào một công ty có thể thực hiện điều này trong khi tránh mọi sự tiếp xúc của con người với người dùng của mình? 1
AI rất phức tạp, con người cần giúp đỡ
Nhiều nhà phát triển tự nhủ rằng AI có thể giải quyết khá nhiều vấn đề của con người, nếu được cung cấp đủ các biến, bộ dữ liệu và điều chỉnh. Nhưng những gì Facebook đã cho thấy rõ ràng là bất cứ điều gì họ đang làm để giúp giải quyết vấn đề nguồn cấp dữ liệu tin tức của mình, AI của nó không hoạt động tốt đối với rất nhiều người.
Không ai cảm thấy như Facebook thậm chí đang lắng nghe. Như tôi đã lưu ý trước đó, những người ủng hộ sức khỏe và các nhà hoạt động mà tôi đã nói chuyện tại hội nghị nói rằng họ không được lắng nghe. Các công ty truyền thông xã hội như Facebook dường như không quan tâm. Và trên một nhóm Facebook kín dành cho các nhà xuất bản tin tức, tôi nghe thấy sự thất vọng hàng ngày về việc có bao nhiêu tổ chức tin tức được kính trọng đang có những bài báo chuyên sâu về điều tra của họ bị bỏ qua trên Facebook mà không được trả tiền để thúc đẩy. Trong khi đó, bài viết ngắn gọn “5 cách tuyệt vời, nhanh chóng và dễ dàng để có một mùa hè mới” nhận được nhiều lượt truy cập hơn các tìm kiếm trên Google của Trump cho các truy vấn “Làm cách nào để khắc phục…”.
Ảnh chia tay trên AI của ngày hôm nay
Siri được ca ngợi của Apple thường được coi là một ví dụ hữu ích về AI hoạt động trong thế giới hiện đại ngày nay. Nhưng khi tôi viết bài này, tôi đã nói, "Này Siri, hãy nói với Nancy rằng tôi yêu cô ấy."
Siri, với trí tuệ vô hạn của cô ấy đã giúp người nhận tin nhắn chính xác (may mắn thay, vì tôi chỉ biết một Nancy). Nhưng tin nhắn cô ấy gửi là, "Tôi yêu cô ấy." Siri rõ ràng không hiểu ý nghĩa thực sự của câu nói của tôi, và thay vào đó, tôi sử dụng các bộ lọc thô sơ để tìm ra tôi muốn gửi tin nhắn cho một người trong danh bạ của tôi với thông điệp theo nghĩa đen, “Tôi yêu cô ấy”.
Đây là cấp độ AI mà chúng tôi đang làm việc ngày nay trên các công ty công nghệ lớn như Facebook, Google và Apple - có phần hữu ích nhưng không đồng đều về chất lượng và cách triển khai.
Tôi thực sự hy vọng rằng Facebook sẽ giải quyết được điều này, bởi vì mỗi ngày tôi thấy mình sử dụng nó ngày càng ít hơn vì nó ngày càng trở nên ít liên quan đến sở thích thực tế và cuộc sống hàng ngày. Ngày nay, tôi có thể là nhóm thiểu số, nhưng tôi nghi ngờ điều đó sẽ thay đổi nếu Facebook không sớm giải quyết những vấn đề về mức độ liên quan và sự quan tâm này.
Chú thích:
- Đây là một trong những lý do tại sao những người thuyết trình trên Facebook tại các hội nghị thường nhận được rất nhiều câu hỏi - đó là liên hệ duy nhất của con người mà hầu hết chúng ta từng có với gã khổng lồ công nghệ này. [↩]