A importância da URL na implementação de ferramentas de webanalytics
Publicado em December 4th, 2008 por Rafael Campos
Nas implementações de ferramentas de webanalytics baseadas em tags javascript é comum achar que basta inserir a tag em todas as páginas para termos uma ótima instalação da ferramenta. No entanto, diversos outros pontos devem ser observados para que não ocorram problemas. Nesse post, foco na importância da URL para captura dos dados, abordando exemplos de boas práticas na implementação e erros comuns.
A URL, juntamente com os parâmetros URL e os cookies, formam a base dos mecanismos de captura de dados. Portanto, é importante que seja dado especial atenção a esses três fatores para que desde o início do projeto sejam coletados dados otimizados, evitando dores de cabeça no futuro. Imagine que logo no planejamento estratégico seja identificado a necessidade de haverem relatórios específicos sobre os visitantes da seção de Esportes de determinado site de conteúdo. Ter isso identificado no início do projeto é uma grande vantagem, visto que a URL pode ser estruturada, por exemplo, em diretórios que reflitam essa organização e que perfis específicos e filtros sejam criados para que desde o início sejam capturados os dados desejados. (do contrário, provavelmente haverá dificuldades em processar dados históricos para gerar relatórios em ferramentas como o Google Analytics. Os filtros do GA só contabilizam dados capturados a partir do momento da criação do filtro).
A URL em geral é formada pelo domínio, a estrutura de diretórios, o nome do arquivo e parâmetros da URL. Por exemplo, veja a seguinte URL:
http://www.nytimes.com/2008/12/04/sports/football/04giants.html?_r=1&hp
- nytimes.com -> domínio
- /2008/12/04/sports/football/ -> estrutura de diretórios
- 04giants.html -> nome do arquivo
- ?_r=1&hp -> parâmetros URL
Segue abaixo alguns pontos importantes a serem observados (focado no Google Analytics)
Checar se a tag foi instalada em todas as páginas.
Utilize a ferramenta gratuita http://sitescanga.com/ para analisar se todas as páginas de seu site contêm a tag do GA.
Configuração da Página Padrão
Um erro comum, mas de fácil solução, é esquecer de definir a página padrão do site. O Google Analytics trata como páginas diferentes www.seudominio.com.br e www.seudominio.com.br/index.html, de forma que nos relatórios aparecerão páginas exibidas para “/” e “/index.html”, ainda que, como sabemos, trata-se da mesma página.
No GA, basta informar na configuração do perfil qual é a página padrão do site. Então o GA passará a entender “/” e “/index.html” (ou default.asp, index.php, etc, dependendo de qual é sua página padrão) como sendo a mesma página.
Maiúsculas e minúsculas
O Google Analytics trata de forma diferente maiúsculas e minúsculas na URL. Assim, www.seudominio.com.br/ola/index.html é diferente de www.seudominio.com.br/Ola/index.html. É comum encontrar nos relatórios de conteúdo a diferenciação entre default.php e Default.php, por exemplo.
Para resolver essa questão, basta criar um filtro que force a URL para ser toda minúscula:
Filter Name: Forçar URI para minúscula
Filter Type: Custom filter
(selecione “Lowercase”)
Filter Field: Request URI
Esse filtro pode ser aplicado também a parâmetros de URL, como por exemplo informações sobre nome e origem da campanha.
Mais informações em: http://www.google.com/support/analytics/bin/answer.py?hl=en&answer=90397
Filtrar parâmetros URL desnecessários
Dados de sessões dinâmicas e outros parâmetros de URL que não impliquem na exibição de uma página diferente devem ser excluídos dos relatórios. Por exemplo, a url www.seudominio.com.br/produtos.asp?id=10&session_id=34788909584. O identificador único da página é o id. O session_id não importa para a ferramenta de webanalytics, portanto, deve ser excluída. Do contrário, a mesma página, porém com session_id diferente, será contabilizada como sendo duas páginas diferentes. Aqui cabe uma observação de que isso é um problema também para os mecanismos de busca, cujos robôs agirão da mesma forma, indexando conteúdo duplicado. Portanto, quanto mais a URL seja mantida limpa de parâmetros desnecessários, melhor para todos, inclusive para os visitantes do site.
É importante ficar atento ao relatórios de conteúdo. Recentemente encontrei nas páginas de um cliente a exibição de páginas com parâmetro url CFID e CFTOKEN, sendo que eu estava ciente que o site não fazia uso de tais parâmetros (provavelmente algum link para o site continha esse parâmetro sabe-se lá porque). Então fiz a exlusão de tal parâmetro.
É importante notar também que uma vez feito isso, esses dados serão excluídos completamente do GA. Portanto se você tiver filtros ou funis configurados o esse parâmetro excluído, eles deixarão de funcionar. Lembrando que os filtros são aplicados apenas aos dados coletados após sua configuração.
Subdomínios
Subdomínios podem ser facilmente acompanhados através de um novo perfil que filtre apenas os acessos a determinado subdomínio.
Veja as seguintes instruções caso seja necessário que os dados de diferentes subdominios estejam dentro de um mesmo perfil: http://www.google.com/support/analytics/bin/answer.py?hl=en&answer=555
