domingo, 12 de outubro de 2008

Por trás dos resultados: os sistemas de buscas na Web

O desafio desta vez é tentar fazer uma análise comparativa dos cinco primeiros resultados de uma busca sobre “cura do stress” nos seguintes sistemas: Google, Yahoo!, AltaVista, Radar Uol, Clusty, MSN, Ask e DogPile. Para uniformizar a pesquisa e delimitar o universo de atuação, preferi considerar somente os resultados da opção de levantamento feito “na Web” e não apenas em língua portuguesa, por exemplo.

A pesquisa nos oito sites de busca diferentes, totalizaria 40 indicações (veja quadro 01).

Destes endereços, oito apareceram em mais de um resultado (veja o quadro 02). É interessante perceber que o máximo de coincidência que identificamos equivale a aparição de um mesmo site em 50% dos buscadores. É o caso do www.saudevidaonline.com.br. Dos oito endereços que aparecem em mais de um buscador, metade só é indicado por dois buscadores.


Entre diferenças e semelhanças, podemos perceber variações relacionadas à língua, como Clusty e Ask. Ainda o DogPile que vasculha os bancos de dados do Google, Yahoo!, MSN e Ask e ainda assim traz respostas diferentes dos próprios buscadores onde pesquisa. Outro aspecto interessante, que não vamos detalhar aqui, mas que vale destacar, é a alteração de resultado no mesmo buscador em dias diferentes.

Endereços patrocinados e o caminho mais curto

Neste sentido, destacamos duas questões: uma que se refere aos serviços patrocinados, que dispõem de mecanismos que intensificam a localização do site, e a outra relacionada os tipos de buscadores.

O maior número de endereços patrocinados, eu encontrei no Radar Uol. Um aspecto que me chama a atenção é que o internauta desavisado sequer tem noção de detalhes como este na hora de consumir a informação, medir a qualidade e veracidade da mesma. Além disso, não levamos em consideração o critério de escolha das palavras-chave na indexação de uma publicação – o que pode supervalorizar materiais irrelevantes ou tornar subutilizados trabalhos magníficos.

Sistemas de busca

Entre os principais tipos de sistemas de busca na Web, destacamos os buscadores globais, que procuram todos os documentos na rede, fornecendo um resultado aleatório. Normalmente, o que pesa são os sites mais acessados.

Os buscadores verticais têm bases de dados próprias. Para ser incluído num buscador deste modelo é preciso pagar mensalidade. Já os diretórios de websites organizam em categorias e subcategorias índices de sites. A idéia é entrar rapidamente onde se deseja, mas é preciso buscar por categoria e não por palavra-chave. Parece que o caminho agora segue em direção aos ontobuscadores, que se baseiam em ontologias.

A intenção é possibilitar consultas com grande quantidade de texto (até 15 mil caracteres). Um exemplo é o Ontoweb.

Nenhum comentário: