<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Blog SEO: référencement et optimisation &#187; analytics</title>
	<atom:link href="http://www.mon-seo.com/category/analytics/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.mon-seo.com</link>
	<description>Référencement, WebAnalytics et Ergonomie</description>
	<lastBuildDate>Thu, 31 Mar 2011 17:50:30 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.2</generator>
		<item>
		<title>Googleusercontent.com : nouveau domaine, nouveaux problèmes</title>
		<link>http://www.mon-seo.com/2010/04/googleusercontent-com-nouveau-domaine-nouveaux-problemes/</link>
		<comments>http://www.mon-seo.com/2010/04/googleusercontent-com-nouveau-domaine-nouveaux-problemes/#comments</comments>
		<pubDate>Thu, 08 Apr 2010 21:50:50 +0000</pubDate>
		<dc:creator>seb</dc:creator>
				<category><![CDATA[analytics]]></category>
		<category><![CDATA[Produits Google]]></category>
		<category><![CDATA[analytics cache google referrer googleusercontent]]></category>

		<guid isPermaLink="false">http://www.mon-seo.com/?p=170</guid>
		<description><![CDATA[Depuis deux jours, un changement passé presque inaperçu dans les serp a eu lieu. Auparavant, quand on visualisait une page du cache de Google, le host qui nous permettait de visualiser le page en cache était une adresse ip. Aucun nom de domaine n&#8217;était associé (http://209.85.229.132/search). J&#8217;ai toujours trouvé cela un peu amateur et brouillon [...]]]></description>
			<content:encoded><![CDATA[<p>Depuis deux jours, un changement passé presque inaperçu dans les serp a eu lieu. Auparavant, quand on visualisait une page du cache de Google, le host qui nous permettait de visualiser le page en cache était une adresse ip. Aucun nom de domaine n&#8217;était associé (http://209.85.229.132/search). J&#8217;ai toujours trouvé cela un peu amateur et brouillon dela part de Google et j&#8217;avais supposé qu&#8217;il devait y avoir une bonne raison (soulager les serveurs DNS ?).<strong> Depuis deux jours cela a changé</strong>. Désormais l&#8217;url de cache a un vrai nom de domaine<strong> http://webcache.googleusercontent.com/search</strong></p>
<h2>Googleusercontent.com ou comment Google s&#8217;auto-spamme?</h2>
<p style="text-align: center;"><a href="http://www.mon-seo.com/wp-content/uploads/2010/04/googleusercontent-site.jpg"><img title="googleusercontent site" src="http://www.mon-seo.com/wp-content/uploads/2010/04/googleusercontent-site.jpg" alt="" width="544" height="24" /></a></p>
<p>Avec un petit Whois, on apprend que ce domaine est enregistré depuis seulement 2008 et appartient logiquement à Google. A en croire l<a href="http://siteexplorer.search.yahoo.com/fr/search;_ylt=A0oG7zZKL75L_RsBhiKXORh.?p=http://googleusercontent.com&amp;bwm=p&amp;bwms=p&amp;fr=yfp-t-703&amp;fr2=seo-rd-se&amp;b=1">&#8216;index de Yahoo</a>, ce domaine est principalement utilisé pour héberger des PDF. Etrangement, beaucoup de ces pdf ne se retrouvent pas dans Google. Regardons de plus près ce que Google connaît de ce nouveau domaine. Faisons un simple <a href="http://www.google.fr/search?num=100&amp;hl=fr&amp;q=site:googleusercontent.com&amp;meta=&amp;aq=f&amp;aqi=g10&amp;aql=&amp;oq=&amp;gs_rfai=" target="_blank">site:googleusercontent.com</a></p>
<p>Et nous apercevons plein de résultats de recherches indéxés ! Or, Google précise bien qu&#8217;il faut faire désindexer ces résultats de recherche en utilisant le robots.txt. Google est donc, encore une fois, pris en <strong>plein flagrant délit d&#8217;auto-spam</strong>.</p>
<p>Désormais, le <a href="http://googleusercontent.com/robots.txt">robots.txt</a> semble comprendre cette interdiction désormais, mais il reste encore beaucoup de mauvaises pages : des <a href="http://webcache.googleusercontent.com/search?hl=en&amp;q=cache&amp;start=30&amp;sa=N" target="_blank">pages de résultats</a>, des <a href="http://webcache.googleusercontent.com/custom?q=cache:P2X4PoXJtxIJ:www.vertor.com/download/belladonna%2Bmetaphysical%2Battraction+Belladonna&amp;cd=44&amp;hl=ru&amp;ct=clnk&amp;ie=UTF-8&amp;client=pub-9907426193122544" target="_blank">vraies pages de cache</a>. Oui, on peut même voir le cache de pages de cache. Voila un amateurisme qui ne m&#8217;étonne pas vraiment. Google aurait besoin de conseils SEO parfois <img src='http://www.mon-seo.com/wp-includes/images/smilies/icon_wink.gif' alt=';-)' class='wp-smiley' /> </p>
<h2>Des conséquences sur Analytics</h2>
<div><a href="http://www.mon-seo.com/wp-content/uploads/2010/04/cache-googleuser.jpg"><img class="alignleft size-full wp-image-173" title="cache googleuser" src="http://www.mon-seo.com/wp-content/uploads/2010/04/cache-googleuser.jpg" alt="" width="260" height="175" /></a>Plus grave et plus intéressant, ces changements de domaine ont un impact sur les données Analytics. Auparavant, les visites en provenance du cache de Google était marquées comme venant d&#8217;un lien référent . Désormais, <strong>les pages en cache sont considérées comme venant de Google</strong> ! C&#8217;est plus logique mais ça booste légèrement les stats (environ 0.2% pour mon principal site). Le plus énervant, c&#8217;est surtout de retrouver désormais dans les keywords des <strong>mots-clés commençant par cache:-i2chypzkq4j:www </strong>. Les vrais mots-clés se situent après votre url; il y a donc moyen de les récupérer avec un filtre avancé ou avec un script javascript installé sur vos pages. Mais, pour cela, je ferai un autre post !</div>
]]></content:encoded>
			<wfw:commentRss>http://www.mon-seo.com/2010/04/googleusercontent-com-nouveau-domaine-nouveaux-problemes/feed/</wfw:commentRss>
		<slash:comments>6</slash:comments>
		</item>
	</channel>
</rss>

