O que sistemas de busca podem descobrir sobre nós


O Google divulgou seu mapa nacional de cérebros e apetites para 2008, e ao que parece muita gente nos Estados Unidos perguntou na Internet "o que é amor" e "como beijar", ao longo do ano.

E, para permitir um foco mais estreito, o Google também ofereceu uma lista de solicitações de busca propostas por pessoas de Nova York. Ao que parece os moradores da cidade de Nova York estão em busca de algo diferente. Em uma lista dos 10 assuntos que registraram mais ascensão como termos de busca este ano, o país em geral parecia estar interessado na Fox News e em David Cook, o ganhador da mais recente versão do programa de calouros American Idol.

Nenhum dos dois assuntos entrou na lista de Nova York. Mas a lista nacional tampouco incluía dois dos itens mais procurados na cidade: Walter Gropius, o fundador do estilo Bauhaus de arquitetura, e o Large Hadron Collider (LHC), um túnel subterrâneo de 27 quilômetros localizado sob a fronteira da Suíça, construído para promover colisões de prótons em velocidade próxima à da luz.

Sem dúvida deve existir alguém no ciberespaço capaz de explicar a disparada no interesse por Gropius na cidade. O arquiteto morreu em 1969 e só tem um edifício notável em Nova York, o antigo edifício da Pan Am.

É fácil compreender o interesse pelo LHC. Havia a preocupação de que a colisão de prótons criaria instantaneamente um buraco negro, mas a boa notícia que passou quase ignorada é o fato de que não surgiu - ou desapareceu? - qualquer buraco negro em 10 de setembro, o dia em que a máquina foi ativada. O interesse pelo LHC entre os usuários do serviço de busca logo despencou, e as pessoas passaram a concentrar suas ansiedades e preocupações em "Wall Street". (E Wall Street, aliás como o LHC, está com defeito.)

Essas listas supostamente serviriam para revelar o que o Google define como o "zeitgeist" de 2008, ainda que não seja grande surpresa que as pessoas se tenham interessado por Sarah Palin e Barack Obama. No entanto, elas também servem para revelar o número de detalhes pessoais que as pessoas hoje fornecem aos serviços de buscas e às empresas que os operam, sem que estejam muito cientes disso.

As listas, diz o tenente-coronel Greg Conti, professor de ciência da computação na Academia Militar de West Point, "são apenas as grandes atividades, em escala tsunami - as grandes ondas nas buscas online".

Conti, autor de um livro que tenta avaliar o quanto o Google sabe sobre cada um de seus usuários, alega que as ferramentas internas de que a empresa dispõe tornam possível desenvolver quadros detalhados sobre os interesses pessoais dos usuários, e não apenas descobrir que milhões de meninas estão procurando informações sobre a cantora Miley Cyrus.

"Um retrato completo de cada pessoa como indivíduo e de cada companhia emerge - as inclinações políticas, os problemas médicos, as aquisições de negócios sinalizadas por buscas de empregos", ele diz. "Se fosse possível avaliar cada pesquisa realizada, o resultado seria assustador. As pesquisas podem ser associadas de maneira muito precisa a um indivíduo. Pode-se observar todas as escalas, da molécula individual de água ao tsunami".

A informação parece gratuita na web, mas na verdade é trocada por pequenas porções de dados que são úteis para as empresas. O Google registra os endereços de Internet gerados pelos computadores dos usuários, os cookies que os usuários aceitam, o modelo de navegador em uso e o sistema operacional do computador, diz Heather Spain, porta-voz da empresa.

Depois de nove meses, ela acrescenta, o Google "anonimiza" os dados que recolheu.

"Quando chega o momento, nós eliminamos permanentemente os dois dígitos finais do endereço IP e partes dos números dos cookies", ela diz. "Isso quebra o elo entre a busca e o computador da qual ela foi gerada. É um processo semelhante à maneira pela qual as operadoras de cartões de crédito substituem os números por traços em seus recibos para reforçar a segurança de seus clientes".

Conti diz que pouca gente faz idéia da trilha que deixa ao percorrer a Internet. "As pessoas tendem a pensar que deixam traços apenas em sites nos quais confiam", ele diz, mas muitos sites contêm códigos não visíveis, como o do Google Analytics, que pode acompanhar o movimento de usuários pela rede.

As listas de buscas mais populares, diz Spain, resultam de consultas realizadas por milhões de pessoas e não representam ameaça à privacidade individual. As ferramentas que o Google oferece aos usuários para analisar buscas em geral só tornam possível estudar as buscas em base de Estado a Estado, e não em cidades individuais.

Por enquanto, fornecer informações pessoais é o preço que se deve pagar pela possibilidade de fazer perguntas e receber respostas rapidamente. Todas as medidas de proteção à privacidade tendem a complicar o processo.

"Eu falo sobre o assunto em conferências de hackers", diz Conti, "e se esse pessoal diz que alguma coisa é difícil de usar, pode acreditar que é difícil. A verdade é que não existe solução no momento - exceto a abstinência. E se você optar por não usar ferramentas de Internet, não estará vivendo no século 21".

0 comentários: