Nghiên cứu tồi: Cụm từ Tìm kiếm Tình dục Phổ biến
Mọi người thích tình dục. Họ rất thích tình dục, họ dành nhiều thời gian để tìm kiếm nó trên mạng. Đi tìm hình. (Bạn có thể nói rằng tôi sắp đi sâu vào những thứ thực sự cao siêu ở đây…)Các nhà nghiên cứu Ogi Ogas và Sai Gaddam gần đây đã xuất bản một cuốn sách, Một tỷ suy nghĩ xấu xa, phân tích chi tiết 400 triệu lượt tìm kiếm mà họ thu thập được từ công cụ tìm kiếm Dogpile. Trong số 400 triệu lượt tìm kiếm đó, 13% (55 triệu) dành cho nội dung khiêu dâm.
55 triệu lượt tìm kiếm đó đã bị phá vỡ như thế nào? Hãy cùng tìm hiểu… nhưng chúng ta hãy cũng xem xét phương pháp luận của những nhà nghiên cứu này để xem liệu những phát hiện của họ có xứng đáng với tài liệu mà chúng được in ra hay không. (Nếu bạn không nghĩ, có lẽ bạn đã đúng.)
Vì vậy, đây là những gì mọi người trên Dogpile tìm kiếm khi đề cập đến sở thích tình dục. Lưu ý rằng các thuật ngữ bên dưới là danh mục tìm kiếm chung cho sở thích đó, bao gồm tất cả các loại hoán vị của các thuật ngữ. Những hoán vị này (chẳng hạn như "tits" cho ngực) không được liệt kê dưới đây; sử dụng trí tưởng tượng của bạn.
- Thanh niên - 13,5 phần trăm
- Đồng tính nam - 4,7 phần trăm
- MILFs (Mẹ tôi muốn F ***) - 4,3 phần trăm
- Vú - 4,0 phần trăm
- Vợ lừa dối - 3,4%
- Âm đạo - 2,8 phần trăm
- Dương vật - 2,4 phần trăm
Rác vào, Rác ra
Có một câu nói cũ trong lập trình máy tính - GIGO: Garbage In, Garbage Out. Nó áp dụng tốt như nhau đối với bất kỳ nỗ lực khoa học nào, chỉ tốt khi dữ liệu bạn chọn để phân tích. Nếu bạn bắt đầu với một tập dữ liệu có khả năng tổng quát hóa hoặc giá trị đáng nghi vấn, bạn có thể thấy mình đưa ra kết luận có rất ít mối liên hệ với thực tế.
Trong trường hợp này, có một vấn đề lớn với dữ liệu nghiên cứu mà các nhà nghiên cứu này đã tổng hợp. Chúng không đến từ Google hay thậm chí Bing. Chúng đến từ một công cụ tìm kiếm ít được biết đến có tên là “Dogpile”, thậm chí không phải là một công cụ tìm kiếm. Dogpile là gì chỉ đơn giản là một công cụ tổng hợp các kết quả tìm kiếm từ Google, Yahoo và Bing (vì Bing hiện cung cấp cho Yahoo dữ liệu tìm kiếm của họ, tôi không chắc tại sao vẫn có sự khác biệt này).
Điều này không giống như tìm kiếm được thực hiện trên Google thông qua Google.com hoặc tìm kiếm được thực hiện trên Bing thông qua Bing.com. Bạn thực sự phải truy cập trang web Dogpile để lấy những kết quả này - kết quả hình thành bộ dữ liệu cho các nhà nghiên cứu hiện tại. Nếu bạn thực hiện tìm kiếm trên Google.com, tìm kiếm của bạn sẽ không được các nhà nghiên cứu này phân tích (điều này có lý, vì Google và Bing không cung cấp dữ liệu thu thập được trên các tìm kiếm cho các nhà nghiên cứu).
Điều có thể khiến Dogpile ít được sử dụng là thực tế là nó xen lẫn các quảng cáo tìm kiếm được tài trợ với các kết quả tìm kiếm không phải trả tiền mà hầu như không có gợi ý trực quan nào về việc nó đang làm như vậy. Chữ in nhỏ ở cuối mỗi kết quả tìm kiếm cho bạn biết liệu đó có phải là kết quả “được tài trợ” hay không - ví dụ: quảng cáo. Trong một tìm kiếm về "trầm cảm" trên Dogpile, 14 trong số 20 kết quả tìm kiếm đầu tiên là quảng cáo - không hẳn là thứ mà hầu hết những người bình thường sẽ đặt ra trong thời gian dài.
Những người tìm kiếm nội dung trực tuyến từ lâu đã quyết định từ bỏ việc sử dụng các công cụ tìm kiếm cố gắng xen lẫn quảng cáo với kết quả thực tế. Lý do rất đơn giản - mọi người sẽ nhấp vào quảng cáo khi họ quan tâm đến sản phẩm hoặc dịch vụ được cung cấp. Họ không muốn bị lừa khi nhấp vào những gì họ nghĩ là kết quả tìm kiếm, chỉ để phát hiện ra đó là một quảng cáo ngụy trang.
Vậy ai sử dụng Dogpile? Ai biết được, nhưng chắc chắn đó không phải là người dùng Internet chính thống. Trong khi hơn 150 triệu người sử dụng Google và 90 triệu người sử dụng Bing.com, Dogpile có 2-3 triệu người mỗi tháng nhạt nhòa so với khi so sánh và thấp hơn rất nhiều so với 0,05% tổng thị trường công cụ tìm kiếm.
Bạn có thể thực hiện một cuộc khảo sát trên một tập dữ liệu nhỏ như vậy và thử sử dụng khói và gương để làm cho nó có vẻ như bạn thực sự đã thực hiện cùng một loại nghiên cứu đột phá mà Viện Kinsey đã thực hiện vào những năm 1950 và 1960? Bạn chắc chắn có thể.
Ví dụ, Ogi Ogas và Sai Gaddam cho biết họ đã phân tích 400 triệu lượt tìm kiếm trên Internet. Nhưng so sánh con số này với 3 tỷ lượt tìm kiếm được thực hiện mỗi ngày, theo Hitwise, một công ty phân tích trực tuyến. Đột nhiên 400 triệu - trong khi dường như là một con số ấn tượng trong chân không - trông kém ấn tượng hơn nhiều khi được đặt vào một số loại bối cảnh dữ liệu. 400 triệu lượt tìm kiếm tương đương với những gì được thực hiện trong khoảng 3 giờ. Một ngày nào đó.
Tất nhiên, bối cảnh là tất cả mọi thứ khi nói đến bộ dữ liệu, đặc biệt là khi những bộ dữ liệu đó có thể bị sai lệch theo những cách mà bạn không bao giờ bận tâm để điều tra. Trong trường hợp này, tập dữ liệu bị sai lệch do việc sử dụng công cụ tìm kiếm Dogpile - một công cụ tìm kiếm nhỏ, thích hợp có nhiều khả năng không được sử dụng bởi một tập hợp con nhất định khác với phần còn lại của tập hợp.
Vì vậy, hãy xem danh sách này với một hạt muối. Điều đó thật thú vị, nhưng tôi không chắc nó phản ánh dân số chung. Và chắc chắn không đáng để mua cả một cuốn sách đào sâu vào tập dữ liệu thiếu sót này.