Công cụ tìm kiếm có tạo ra kiến ​​thức không?

Các học giả nói rằng dữ liệu tạo ra thông tin và kiến ​​thức đó là sản phẩm của thông tin có cấu trúc tốt. Do đó, các nhà khoa học hiện đang điều tra xem các công cụ tìm kiếm như Google có phải là nguồn kiến ​​thức hay không.

Không nghi ngờ gì nữa, Google và các công cụ tìm kiếm khác đã trở thành một phần của cuộc sống hàng ngày. Nhưng nếu kiến ​​thức là sức mạnh, thì các công cụ tìm kiếm có phải là nút nguồn không?

Đối với những người dùng web chính thức và học thuật, các chuyên gia cho rằng các nhà nghiên cứu cần phải biết cách hoạt động của các công cụ tìm kiếm, để đảm bảo chất lượng chứ không chỉ sự phổ biến thúc đẩy việc lựa chọn nguồn của họ.

Trong một bài báo trong Tạp chí Nghiên cứu Văn hóa Quốc tế, José van Dijck của Đại học Amsterdam, Hà Lan, lập luận rằng các công cụ tìm kiếm nói chung và Google Scholar nói riêng, đã trở thành nhà đồng sản xuất kiến ​​thức hàn lâm quan trọng, thay vì các công cụ trung lập.

Google Scholar tìm kiếm các nguồn khác nhau từ một nơi thuận tiện để tìm thông tin ở nhiều định dạng (bài báo, luận văn, sách, tóm tắt hoặc ý kiến ​​của tòa án) và giúp xác định những nguồn này thông qua thư viện hoặc trực tuyến.

Cho đến nay, có rất ít nghiên cứu thực nghiệm hoặc dân tộc học về cách sinh viên thực sự tiếp cận các tìm kiếm mở. Nhưng các cuộc khảo sát cho thấy rằng sinh viên thực hiện tìm kiếm chủ đề cho các bài báo học thuật chọn công cụ tìm kiếm, thay vì các mạng khám phá nghiên cứu dựa trên thư viện, làm điểm xuất phát ưa thích của họ.

Nhiều sinh viên coi các dịch vụ thư viện như một “tiện ích bổ sung” cho Google Scholar chứ không phải ngược lại.

Theo van Dijck, một trong những điểm chính về hệ thống xếp hạng và hồ sơ của các công cụ tìm kiếm là những hệ thống này không mở theo các quy tắc giống như các phương pháp học bổng thư viện truyền thống trong miền công cộng.

Bà nói: “Các hệ thống tìm kiếm tự động được phát triển bởi những gã khổng lồ Internet thương mại như Google đã khai thác các giá trị công cộng tạo nên hệ thống thư viện, tuy nhiên, khi nhìn vào bên dưới bề mặt này, các giá trị cốt lõi như tính minh bạch và cởi mở rất khó tìm thấy.

Người dùng thiếu kinh nghiệm có xu hướng tin tưởng các động cơ độc quyền như những người trung gian kiến ​​thức trung lập, cô nói. Trên thực tế, các nhà điều hành công cụ sử dụng siêu dữ liệu để diễn giải hồ sơ chung của các nhóm người tìm kiếm.

Ngay từ cái nhìn đầu tiên, Google Scholar áp dụng một trong những giá trị học thuật cơ bản — phân tích trích dẫn — bằng cách sử dụng trình thu thập dữ liệu web theo thuật toán để tạo chỉ mục cho một trang web rộng lớn gồm các tài liệu học thuật.

Giống như công cụ mẹ của nó, Google Scholar hoạt động như một hệ thống xếp hạng dựa trên các liên kết ngữ nghĩa với một kho chứa lớn các nguồn mà thông qua xuất xứ của chúng có thể được coi là hợp lý về mặt học thuật.

Tuy nhiên, thuật toán của Google Scholar hoạt động trên cơ sở phân tích trích dẫn định lượng. Các học giả đi theo hướng khác, xếp hạng các trích dẫn theo tình trạng tương đối và trọng lượng của chúng trong các lĩnh vực chuyên môn cụ thể.

Thông tin xếp hạng thông qua Google Scholar khá giống với Google Tìm kiếm: Nó xếp hạng các nguồn dựa trên mức độ phổ biến hơn là giá trị sự thật hoặc mức độ liên quan. Các bài báo có nhiều liên kết đến chúng hơn sẽ đánh bại nghiên cứu chất lượng cao hơn không được thuật toán Google Scholar chọn.

Vấn đề này còn phức tạp hơn vì một số tổ chức nhất định từ chối truy cập vào cơ sở dữ liệu của họ. Google sẽ không tiết lộ danh sách đầy đủ các cơ sở dữ liệu mà nó bao gồm hoặc tần suất cập nhật để chỉ ra một khoảng thời gian. Người dùng bị bỏ qua về phạm vi tìm kiếm và tính kịp thời.

Sự giám sát của Van Dijck về việc xây dựng kiến ​​thức học thuật thông qua các động lực học được mã hóa của công cụ tìm kiếm dựa trên lý thuyết mạng diễn viên của nhà xã hội học Bruno Latour và công trình của Manuel Castells. Trong lý thuyết mạng tác nhân, công cụ tìm kiếm không chỉ đơn giản là các đối tượng, mà là một phần của mạng công nghệ con người tham gia vào quá trình sản xuất tri thức.

Castells đề xuất hoạt động mạng "tháo cuộn" để xem xét kỹ hơn các mối quan hệ sức mạnh phức tạp của mạng kỹ thuật số trước khi tua lại nó một cách cẩn thận.

Van Dijck kêu gọi nâng cao kiến ​​thức thông tin bao gồm hiểu biết cơ bản về các khía cạnh kinh tế, chính trị và văn hóa xã hội của các công cụ tìm kiếm. Cô nói: “Nếu không có hiểu biết cơ bản về kiến ​​trúc mạng, động lực của các kết nối mạng và giao điểm của chúng, thì khó có thể nắm bắt được các tác động xã hội, luật pháp, văn hóa và kinh tế của các công cụ tìm kiếm.

Nếu Google đã trở thành hệ thống thần kinh trung ương trong việc sản xuất kiến ​​thức, chúng ta cần biết càng nhiều càng tốt về hệ thống dây của nó.

“Để đảm bảo các thế hệ học giả có kiến ​​thức và phê bình trong tương lai, chúng ta cần dạy kiến ​​thức thông tin giàu kỹ năng phân tích và phán đoán phê bình. Van Dijck kết luận rằng việc tạo ra kiến ​​thức khoa học là quá quan trọng đối với các công ty và máy móc thông minh.

Nguồn: SAGE Publications UK

!-- GDPR -->