Google cache com strip
Mais uma dica exclusiva que descobri pessoal. Muita gente não entende que o Googlebot é cego. Ele não entende recursos especiais como CSS, imagens ou javascript. Ele só entende texto. Existem algumas ferramentas que simulam como o Googlebot enxerga as páginas, mas nada como checar direto com o Google para ver como ele entende o conteúdo da página. Para vermos como é uma página sem estes recursos especiais, vamos usar um macete.
O Google tem um recurso chamado cache. Ele é uma cópia da página que o Google armazena em um banco de dados. Você já deve ter notado na SERP que na última linha, após o tamanho da página, tem um link escrito “Em cache”.

Se você clicar neste link da SERP, será aberta uma página com a versão que o Google tem do seu site no cache dele. Esta pode não ser a versão atual da sua página já que o GoogleBot tem que visitar novamente a sua página após as alterações para poder extrair a nova versão para o cache. Entendido isto, siga estes passos para encontrar a versão clean da página.
Primeiro procure pela página desejada no Google. Tente digitar a URL da página na caixa de busca para facilitar. Após localizar na SERP o resultado, clique no link, “Em cache”. Você verá uma uma página que logo na primeira página diz a data que a página foi armazenada no cache. Informação útil. No quarto parágrafo, você verá um link “o texto em cache” que ao ser clicado, mostrará a versão texto da sua página. Se preferir, você pode pegar uma URL do Google cache e acrescentar o comanto strip. Inclua este texto sem as aspas para ver a versão de texto: “&strip=1″.
Isto é útil quando você quer explicar para alguém que não entende nada de SEO que aquele site maravilho todo feito em Flash ou AJAX não será visto com bons olhos pelo Google. Literalmente pode não ser visto.
apieve said,
Fevereiro 13, 2008 @ 10:57 am
Realmente as melhores idéias são as mais simples!!
E pensar que já tentei explicar o que é Lynx e como os mecanismos de buscas lêem as páginas… Foi trabalhoso e pouco convincente! rsrsrs
Obrigado, Paulo, grande sacada!
Paulo Rodrigo Teixeira said,
Fevereiro 13, 2008 @ 2:04 pm
Eu também já fiz isto Adalberto.
Depois passei a usar o Firefox com o plugin developer desabilitando as opções.
Um grande abraço
Cleber said,
Fevereiro 14, 2008 @ 7:53 am
Nossa!!! Valeu pela dica, já implantei.
Mauricio Filho said,
Fevereiro 15, 2008 @ 2:24 pm
Olá Paulo,
Muito interessante o seu post.
Porém eu tenho algumas indagações.
- Se o Googlebot é cego (nao le css), como o web-spam consegue identificar se voce esta fazendo cloaking?
Se eu não me engano o prato fundo do matt cutts andou dizendo que há um algoritimo la que compara as classes com o o body. Mais realmente nao lembro onde li isso.
Paulo Rodrigo Teixeira said,
Fevereiro 15, 2008 @ 9:18 pm
Oi Maurício,
O Googlebot é apenas um robô faminto que coleta informações de texto e armazena em bancos de dados. Na verdade depois disso é que começam a funcionar os algoritimos em cima destes conteúdos.
Por exemplo, tem programas que “retiram código fonte” do (X)HTML, tem programas que recolhem as palavras-chave e as armazenam em bancos de dados e tem também programas que analizam o código. As análises são diversas como entender o conteúdo do texto âncora, contar a quantidade de links e até checar se uma classe css tem background igual a cor de fonte de uma classe que está dentro dela.
Realmente o Matt falou que o algoritmo estava “segurando tudo”, mas também lembro na época de ter lido em um blog SEO alguém contestando isto e mostrando até um exemplo de black hat não pego.
Um grande abraço
Thomas said,
Fevereiro 18, 2008 @ 1:58 pm
Bem interessante, eu também já cheguei até a instalar o Linx para windows só para demonstrar a “cegueira” do google bot.
Valeu pela dica
Anderson said,
Maio 16, 2008 @ 10:54 pm
muito obrigado pela dica,
minhas visitas cairam muito depois que mudei o
layout do meu site.
vania said,
Junho 8, 2008 @ 9:53 pm
Oi Paulo….
Estou desenvolvendo uma pesquisa, sobre preservação de informação no ciberespaço, e vou citar o cache do google como sendo uma ferramenta de memória, mas estou encontrando dificudades em explicar como funciona, afinal não há literatura cientifica a respeito. Será que vc poderia me ajudar, explicando como funciona esse recurso, e se quando a página está of line os links se quebram, se as imagens desaparecem, de quanto em quanto tempo os robos passam atualizando,
Se vc puder me ajudar agradeço mt mt mt…
Abs.
PS. pode enviar no meu e-mail a resposta
Renan Hagiwara said,
Junho 19, 2008 @ 8:47 am
Pois é, já utilizei muito este recurso de como as páginas são vistas e estão armazenadas no google para “convencer” o cliente a fazer/re-fazer seu site com webstandards, é um recurso gratuito e muito útil para nós
abraço!
José Carlos said,
Julho 19, 2008 @ 1:55 pm
Google e seo a caminho do futuro