Non, non, non Le SEO n’est pas mort

Alors ça y est, le SEO serait mort ? Même Pedro de Google Search l’a annoncé (assez ironiquement) sur son Twitter. Pour ceux qui étaient enfermés dans une cave depuis hier soir, je rappelle que Google a ajouté une nouvelle fonctionnalité, le +1. C’est un peu comme le Like de Facebook mais version Google. On peut déjà imaginer qu’au lieu de regarder les backlinks, Google va regarder les +1 et que l’équipe Search achèvera sa transformation en équipe anti-abus et pourchassera les faux comptes Google créés juste pour faire du +1… C’est encore de la science-fiction, mais, après tout, pourquoi pas ? L’idée originale du PageRank est bien de considérer les liens entrants comme des votes. Alors, si les gens se mettent à voter spontanément pour des résultats de recherche (ce qui reste à prouver), les liens ne devraient plus être si utiles ?

Comprendre le SEO

Tout d’abord, il faut bien comprendre le SEO. Et d’ailleurs, en fait, on devrait plutôt parler de SET, Search Engine Tweaking, à traduire en français par BIdouillage des MOteurs de REcherche (BiMoRe). Le but d’un (bon ?) SEO est de garantir à ses clients un maximum de visibilité sur les moteurs. On ne cherche donc pas à optimiser les moteurs de recherche, mais bien à bidouiller pour les manipuler, pour les plier à notre génie ultime qu’il porte un chapeau blanc, noir, ou arc-en-ciel. Une partie du travail du SEO est bien de faire, en quelque sorte, du reverse engineering, de chercher ce que les ingénieurs de Google ont bien pu mettre dans la sauce algorithmique. Peu importe si c’est du +1, du link, du like, du tweet ou l’avis de Tata Jacqueline, le travail du SEO est de réussir à trouver les astuces pour obtenir ses +1, ses links quitte à bousculer un peu Tata Jacqueline ! Non, le SEO n’est pas mort, il évolue doucement.

SEO, oui mais, optimisation de quoi ?

Et d’ailleurs cette évolution a déjà bien commencé. Certes, en France, on parle encore de référencement, terme qui sent bon l’inscription annuaire et l’inscription premium sur Lycos et Hotbot…  mais nous devrions plutôt parler uniquement de SEO (ou BiMoRe pour les plus funky). Avec l’optimisation de visibilité comme unique souci, les problèmes d’ergonomie et d’analyse de trafic deviennent centraux. Un site ne pourra obtenir des +1 que s’il possède une structure adaptée, un contenu agréable et des mots-clés bien choisis. Cela ne vous rappelle rien ? Si, les conseils de base en SEO… Comme quoi, je vous le disais, le SEO n’est pas mort !

Retour sur le SEOCamp’us 2011 : Pourquoi Google ne peut rien dire

Je voudrais faire un petit retour sur les deux jours du SEOCamp’us que j’ai fortement appréciés. L’organisation était vraiment sympa et détendu, cela donnait une bonne ambiance… très SEO. Et ma présentation s’est bien passée, j’ai été très content du niveau des questions à la fin alors je vous encourage à aller consulter mes trucs et astuces SEO pour Google Analytics. Au niveau des conférences, je retiendrai surtout celles de Philippe Yonnet : il sait vraiment bien remettre les choses en perspective. Je sens que ce week-end, je vais me mettre un peu plus dans l’analyse des logs… la dernière fois que je suis allé y faire un tour, c’était sur réquisition de la gendarmerie: un peu dommage ! Mais j’aimerais vraiment parler aujourd’hui de l’intervention de l‘équipe de Google Search, en particulier le Site Clinic.

Google Search Quality : kesaco?

L’équipe Search Quality de Google est une équipe présente dans plusieurs pays, et en particulier Dublin qui s’occupe de l’ensemble du marché des langues européennes. J’y ai travaillé pendant 2 ans et demi. C’est vraiment une équipe extraordinaire où on entend parler 15 langues différentes dans la même journée et où on a accès à beaucoup beaucoup d’infos utiles pour le SEO (outils internes, pénalités…). Historiquement, l’équipe était un peu l’équipe secrète même au sein de Google. Il n’était pas possible de parler du core job (le travail de tous les jours) aux collègues d’autres équipes. La communication était concentrée à Mountain View par l’équipe Webspam de Matt Cutts (qui travaille beaucoup avec l’équipe Search Quality) et par les équipes de communication institutionnelle dans chaque pays. Mais, petit à petit, le besoin s’est fait sentir de communiquer plus directement avec les webmasters. En effet, beaucoup de spam venaient finalement d’une mauvaise connaissance des guidelines Google et des bonnes pratiques web en général. Comme dans toute politique, il faut de la répression, mais aussi de la prévention. Et c’est ce que Google a mis en place avec des personnes se chargeant de la communication directement issus de l’équipe Qualité de Recherche et les actions ont été nombreuses : centre d’aide, forum pour webmasters modéré et lu attentivement par l’équipe, interviews, participations dans les conférences…

Il faut bien penser que Google est une boite américaine et laisser des personnes, non issus de la comm institutionnelle, parler sur un sujet aussi sensible et important que le moteur de recherche est loin d’être évident. Google fait un pas en avant vers les webmasters, je ne vois pas pourquoi le monde du SEO irait leur cracher dessus, par simple désir de critiquer.

Un site clinic décevant ?

Beaucoup de feedbacks sur le site clinic mené par Jean-Yves, Anouar et Johann ont indiqué leur déception sur cette intervention. Mais à quoi vous attendiez-vous ? Je les connais très bien tous les 3 et je peux vous assurer que s’ils pouvaient dire tout ce qu’ils voulaient, ils pourraient donner de vrais conseils pour sur-optimiser un site tout en restant sous le radar Google. Mais, Google ne fait pas de SEO, ne donne pas de conseils SEO. Pour prendre une analogie, le centre des impôts vous a-t-il déjà donné des conseils en défiscalisation ? Non, ils vont vous aider à bien remplir votre déclaration car ce qui les intéresse c’est … votre argent. Même chose pour Google, ce qui les intéresse, c’est le contenu utile pour l’utilisateur facilement crawlable par le bot. Les conseils ne peuvent rester que basiques et ils ne sont pas vraiment autorisés à dire autre chose que ce qui se trouve dans le centre d’aide. Et, remarquez que ce n’est pas inutile, les conseils donnés étaient certes basiques pour les experts mais les sites présentés étaient des sites proposés par des personnes présentes à la conférence ! N’oubliez pas que tout le monde n’a pas votre niveau d’ « expert SEO ».

Et le Spam report alors?

Cette année, il y a eu pas mal de questions autour du Spam Report. Johann a répondu, avec beaucoup d’enthousiasme qu’il encourageait vivement le spam report mais n’a pas vraiment précisé ce que Google en faisait. Je me permets d’aller un peu plus loin dans la réponse : Oui, Google Search Quality lit les Spam Reports, avec du retard sans doute, peut-être pas avec le regard ou la précision que vous aimeriez, mais ils sont lus et pris en compte. Pour en avoir lu une bonne quantité au cours de mes deux ans et demi, je peux donner quelques conseils et infos :

  • Il n’y a pas tant de spam reports que ça en France. Un problème français avec la délation ?
  • Les sites reportés sont souvent soit totalement clean soit déjà pénalisés
  • Les spam reports sont parfois incompréhensibles et témoignent quelquefois de la fragilité psychologique de la personne qui le rédige. Soyez clair, concis, sympa et surtout précis. Pas besoin de rappeler la préhistoire du web, indiquez juste les mauvais comportements, cela suffit.

Conclusion

Je sens qu’on va m’accuser de corporatisme et de protéger mes amis de Google. C’est certes un peu vrai, mais c’est surtout que je connais bien ce qui se passe derrière la scène car si je n’avais pas démissionné, il y a de fortes chances que j’aurais été au côté de Jean-Yves et mes réponses n’auraient pas été bien différentes! A tous ceux qui critiquent, pensez aussi que les réponses sont parfois juste à la hauteur des questions

Lancement de la beta woptimo.com

A l’occasion du SEO Camp’us où j’interviendrai mercredi après-midi, je sors une version beta du site de l’agence de performance web que je suis en train de créer :  Woptimo . Le site est donc tout à fait en construction. Mais c’est ici que vous pourrez retrouver les 15 trucs et astuces Google Analytics pour le SEO que je vais présenter mercredi.

En attendant la version définitive du site, n’hésitez pas à me contacter pour en savoir plus.

Le sujet des évaluations de cm2 en ligne … sur des sites d’académies

Je viens de voir, dans un article sur lci.fr, que des courageux (?) profs des écoles avaient mis en ligne l’évaluation des CM2 sur un blog. Colère de Luc Chatel. Je cite :

Cette initiative est contraire à l’éthique et à la déontologie que partage l’immense majorité de nos enseignants. Appeler les élèves à tricher, je pense que c’est l’opposé des valeurs de l’Ecole de la République. (…) J’ai saisi la direction des affaires juridiques (du ministère) et je me réserve le droit d’engager les poursuites qui s’imposent« 

Evidemment, les responsables de la fuite ont dû facilement céder sous la pression et ont supprimé leur blog. Mais, le cache de Google existe ! Je me suis alors demandé si ce fameux livret secret diffusé en avant-première à l’ensemble des écoles de France avait déjà été diffusé ailleurs. J’ai alors fait une petite recherche avec un petit extrait unique : « Extrait de l’ouvrage Le miracle des choux et autres histoires russes de Ludmila OULITSKAIA » . Et là, surprise, les académies d’Amiens, de Martinique et de Nancy-Metz avaient déjà diffusé sur leurs sites le fameux cahier.

Capture de la page de résultat de Google

Si vous voulez le télécharger, allez juste sur http://cms.ac-martinique.fr/jml/circo_mornerouge/images/stories/evaluation/cahier_eleve_cm2_2011.pdf et faites-vous plaisir. Sinon, http://www.scribd.com/doc/46968491/eval-cm2-2011 est une autre solution :)

Conclusion de tout ça ?

Il faut que le ministère prenne conscience que désormais si on diffuse une information à quelques dizaines de milliers de personnes, il est totalement illusoire de vouloir la garder confidentielle. Internet garantit la liberté de circulation des idées et des informations ! Et d’ailleurs, à quand des questions sur Google et le référencement dans les évaluations de cm2 ? Ah oui, mais le problème est que les CM2 risqueraient d’en connaître plus que le ministre, ce serait gênant…

NB: Je n’ai aucun avis partisan sur le bien fondé ou non de ces évaluations.

Edit : Contrairement à mes premières affirmations, c’est l’auteur qui a retiré de lui-même son blog.

La Google car : une voiture automatisée !

Google vient juste d’annoncer qu’il travaillait sur un produit révolutionnaire : une voiture qui se conduit toute seule. On pourrait croire à un poisson d’avril, surtout pour une news postée au milieu du week-end, mais non, c’est bien réel. Sans doute les Googlers ont-ils eu la news avant tout le monde dès la veille au soir lors du traditionnel TGIF :)

Techchrunch a déniché une vidéo d’il y a quelques mois où on voit cette voiture révolutionnaire :

Etat des lieux

Ne nous enflammons pas. La voiture automatique est encore en prototype, mais elle a déjà parcouru 225 000 km (soit 140 000 miles) dont des kilomètres d’autoroute et le Golden Gate Bridge.

Nos voitures automatiques utilise des caméras vidéos, des radars sensoriels et un détecteur laser pour « voir » les autres véhicules. Elles utilisent aussi des cartes détaillées (collectées avec des véhicules normaux) pour circuler sur la route. Tout ceci est rendu possible grâce à la puissance de calcul des data center de Google qui peut traiter la masse d’informations récoltées par les voitures. (traduit par mes soins)

Rassurez-vous, les voitures n’ont jamais été laissées sans personne pour surveiller. Elles ont toujours eu un conducteur derrière le volant pour arrêter le pilotage automatique en cas de défaillance ainsi qu’un ingénieur pour pouvoir surveiller le programme. Avant chaque test, des voitures conduites manuellement préparaient le terrain en enregistrant le marquage au sol, les panneaux, les spécificités de la route … Ils ont aussi prévenu la police locale de leur projet (la police français aurait-elle été aussi tolérante ?).

Pourquoi une telle technologie ?

Pourquoi Google se lance-t-il donc dans une telle aventure ? Voici les raisons officielles avancées:

  • 1.2 millions meurent chaque année dans des accidents de voiture. Cette technologie pourrait, selon Google, réduire ce nombre de moitié. (sur ce million de morts, je pense qu’une bonne partie doit se trouver en Inde ou en Chine, vu les conditions de trafic là-bas, ce n’est pas pour demain, la voiture automatique)
  • Cela permettra d’augmenter le covoiturage et ainsi réduire la pollution.
  • Le département américain des transports estime à 52 minutes le temps que les gens passent dans leur voiture. Imaginez ce que vous pourriez faire avec ces 52 minutes…
  • Eric Schmidt, considère que c’est une sorte de bug que la voiture ait été inventée avant l’ordinateur.

Quel interêt pour Google ?

Et quelles sont les raisons officieuses?

  • Ce n’est pas la première fois que Google s’intéresse de près aux voitures. Mettre Android OS sur l’ensemble des voitures, c’est aussi fondamental que sur les téléphones mobiles !
  • Qu’allez-vous faire pendant les minutes économisées ? Faire des recherches sur Google? Regarder des vidéos sur Youtube? Peu important, tant que vous voyez de la pub !
  • Certains pays ont peur de Google Street View. Cela donne un bon argument pour montrer qu’il est indispensable que Google collecte un maximum d’informations partout et sur tout…

Et le SEO dans tout ça? Quand va-t-on devoir optimiser les façades de magasin pour mettre des mots-clés dans la vitrine pour qu’ils soient mieux trouvé par la Google Car? En tout cas, une chose est certaine, cette information va bien dans le sens d’un SEO de plus en plus géolocalisé.

B-links : un système d’échange de liens à éviter

Qu’est-ce que b-links ?

B-links est un nouveau service d’échange de liens en dur automatique lancé début août par l’agence de création de sites Dream me up basée dans le Morbihan. Voici ce qu’ils annoncent sur leur site :

Vous pouvez obtenir jusqu’à 450 liens vers votre site internet automatiquement, uniquement des liens en dur et de qualité, tout en respectant les moteurs de recherche et juste en intégrant 2 lignes de code PHP

Ca donne envie…

Comment cela fonctionne?

C’est très simple, il suffit de s’inscrire sur le site puis d’insérer un petit code php sur votre site. Vous n’avez plus qu’à choisir vos ancres, la thématique du site et le tour est joué. Vous aurez plein de backlinks….
Voici comment se présente le code :

$h=@fsockopen("www.b-links.fr",80,$en,$es,2);$out="GET /apiblinks?i=268&k=a49c654ddc&s=".urlencode($_SERVER['HTTP_HOST'].$_SERVER['REQUEST_URI'])." HTTP/1.0\r\nHost: www.b-links.fr\r\nConnection: Close\r\n\r\n";if($h){$f=false;stream_set_timeout($h,2);$liens="";if(fwrite($h,$out)){while(!feof($h)){if($f){$liens.=fgets($h,128);}else{if(fgets($h,128)=="\r\n")$f=true;}}}fclose($h);echo $liens;}

Et voici quelques sites qui utilisent ce service : http://www.sportclubs.fr/ , http://www.gwanyong-taekwondo.com/, http://calculsportif.free.fr/testcooper.php

Où est l’arnaque ?

Ce service est, à mon goût, très peu recommandables  pour plusieurs raisons :

  • Intégrer un code PHP sur son site dont on ne maîtrise pas le contenu et qui fait appel à des ressources externes est une grave faille de sécurité. Aujourd’hui, ils insèrent quelques liens, pourquoi pas un jour un pop-up ou une redirection vers un site peu fréquentable ?
  • Leur réponse à la question « Est-ce bien vu par les moteurs de recherche » m’a bien fait rire :

Notre algorithme est pensé pour éviter toute détection d’un échange de lien automatique ainsi que toute mise en sandbox, à condition d’êtrehonnête sur l’ancienneté de votre site internet lorsque vous l’ajoutez. Si vous indiquez que votre site à 1 an alors qu’il n’a qu’un 1 mois, il y a toutes les chances que votre site finisse en sandbox.

Qu’est-ce que la sandbox ? Il s’agit d’un recalage très fort dans les résultats de Google. Si vous obtenez trop de liens de bonne qualité alors que votre site vient d’être créé, cela ne paraîtra pas naturel, et vous serez recalé très loin des 10 premières pages.

Ils ont à l’air de penser que la sandbox (seule pénalité Google à leurs yeux) est liée à l’ancienneté du site, ce qui est, dans ce cas, totalement faux. Pour faire un vague rappel sur ce sujet, on va estimer que la sandbox est une pénalité qui fait chuter un site dans le moteur sans toutefois le faire disparaitre entièrement. C’est en effet ce qui peut arriver à des sites pratiquant du linking sauvage, notamment (suivez mon regard), des échanges de liens automatisés. Par malhonnêteté intellectuelle ou par ignorance, ils associent cela à un légendaire effet sandbox qui toucherait les sites nouvellement créés. Bref, l’affirmation comme quoi : « Tout est fait pour que tous les échanges de lien paraissent naturels pour les moteurs de recherche, comme si vous les aviez ajoutés manuellement. » est bien fausse pour les raisons que je vais exposer.

  • Il est facile pour un évaluateur humain de Google de remonter l’intégralité d’un réseau de ce type. C’est même assez marrant et en quelques heures, il est facile de faire tomber tout un réseau de liens automatisés. Je l’ai fait à de nombreuses reprises et mes anciens collègues sont toujours aussi efficaces…
  • Comme b-links est très sympa, ils ont laissé une belle signature dans leur code html, qui rend leur réseau très facile à repérer avec un petit robot (imaginez ce que Google peut faire avec un gros robot … ). Que les plus futés essaient de repérer la signature dans les commentaire de ce post, le gagnant aura le droit à ma reconnaissance et un backlink :) Edit 30-09 : Bravo à Lupus actualité du marketing ;) .
  • Ce n’est pas les premiers à essayer ce genre de petites astuces. Je me rappelle de RefSEO il y a quelques années qui faisait plus ou moins la même chose, mais avec du texte caché. Cela a duré quelques mois mais je ne suis pas certain que David Berdah et sa société Souany en ait gardé un si bon souvenir.

Bref, je ne suis pas du tout contre l’échange de liens, mais rien ne vaut la vraie mise en relation avec des vraies échanges : échange d’un article sur un blog contre une place privilégiée parmi les partenaires, échange d’un lien en article contre un petit lien dans une campagne de communiqué de presse … Bref, soyez imaginatifs pour votre linkbuilding, il n’y a jamais de solution miracle!

Googleusercontent.com : nouveau domaine, nouveaux problèmes

Depuis deux jours, un changement passé presque inaperçu dans les serp a eu lieu. Auparavant, quand on visualisait une page du cache de Google, le host qui nous permettait de visualiser le page en cache était une adresse ip. Aucun nom de domaine n’était associé (http://209.85.229.132/search). J’ai toujours trouvé cela un peu amateur et brouillon dela part de Google et j’avais supposé qu’il devait y avoir une bonne raison (soulager les serveurs DNS ?). Depuis deux jours cela a changé. Désormais l’url de cache a un vrai nom de domaine http://webcache.googleusercontent.com/search

Googleusercontent.com ou comment Google s’auto-spamme?

Avec un petit Whois, on apprend que ce domaine est enregistré depuis seulement 2008 et appartient logiquement à Google. A en croire l‘index de Yahoo, ce domaine est principalement utilisé pour héberger des PDF. Etrangement, beaucoup de ces pdf ne se retrouvent pas dans Google. Regardons de plus près ce que Google connaît de ce nouveau domaine. Faisons un simple site:googleusercontent.com

Et nous apercevons plein de résultats de recherches indéxés ! Or, Google précise bien qu’il faut faire désindexer ces résultats de recherche en utilisant le robots.txt. Google est donc, encore une fois, pris en plein flagrant délit d’auto-spam.

Désormais, le robots.txt semble comprendre cette interdiction désormais, mais il reste encore beaucoup de mauvaises pages : des pages de résultats, des vraies pages de cache. Oui, on peut même voir le cache de pages de cache. Voila un amateurisme qui ne m’étonne pas vraiment. Google aurait besoin de conseils SEO parfois ;-)

Des conséquences sur Analytics

Plus grave et plus intéressant, ces changements de domaine ont un impact sur les données Analytics. Auparavant, les visites en provenance du cache de Google était marquées comme venant d’un lien référent . Désormais, les pages en cache sont considérées comme venant de Google ! C’est plus logique mais ça booste légèrement les stats (environ 0.2% pour mon principal site). Le plus énervant, c’est surtout de retrouver désormais dans les keywords des mots-clés commençant par cache:-i2chypzkq4j:www . Les vrais mots-clés se situent après votre url; il y a donc moyen de les récupérer avec un filtre avancé ou avec un script javascript installé sur vos pages. Mais, pour cela, je ferai un autre post !

10 techniques de linking selon Matt Cutts : foutage de gueule?

J’aime Matt Cutts

Je dois vous avouer quelque chose : j’aime Matt Cutts, je kiffe Matt Cutts. Pour avoir travaillé avec lui, je peux vous dire qu’il est aussi bon orateur en public qu’en privé. Toujours à l’aise même avec les situations les plus difficiles, il sait se débrouiller. Il connaît très bien le web et connaît beaucoup mieux l’algorithme qu’il n’y parait. Et, mine de rien, il s’y connait bien en SEO. Il a plus d’expérience que n’importe qui de l’équipe qualité de recherche et sait vraiment analyser une stratégie SEO de fond en comble : assez impressionnant. Mais aujourd’hui je suis déçu par sa vidéo.

Linking Bullshit

Oui, je suis déçu. Je viens de consulter sa dernière vidéo où un référenceur indien lui demande « A part créer du super contenu, peux-tu me donner 5 moyens d’effectuer du linkbuilding, de créer des liens? » J’ai traduit et résumé ses idées :

  • La controverse : en gros, dire du mal de quelqu’un, d’un produit, provoquer des réactions fortes chez les gens. Comme premier point, c’est bien gentil mais quand on travaille pour une banque, un hôtel de luxe, un site d’un grand groupe … on ne peut pas faire de controverse comme cela. C’est strictement impossible. De plus, créer une controverse c’est toujours très éphémère, c’est un post sur un blog mais clairement pas un article sur le long terme sur un site éditorial. Bref, si pour avoir des liens, il faut dire du mal de son voisin ou se mettre à poil sur un calendrier, je préfère encore acheter des liens
  • Participer aux forums. Exemple donné par Matt : voici comment configurer ton .htaccess. Mmm oui, ça va marcher si j’ai un blog SEO; mais si j’ai un hôtel, un restaurant, cela va être un peu difficile de ramener ma fraise pour dire « ah , j’ai une recette. Et d’ailleurs, voici mon restaurant … blabla ». C’est pas le pire des conseils mais ça va concerner des sites d’expertise mais pas des sites pour entreprises.
  • Publier une étude originale : ok avec Matt Cutts, c’est super de créer une étude sur un sujet particulier et de le poster sur son blog. Mais, encore une fois, si j’ai un site de présentation (ma société de construction de matelas pneumatique dans la Creuse), avoir une section R&D sera pour le moins étrange (et moi, SEO, j’aurais bien du mal à générer un buzz autour du meilleur matériel pour construire un matelas résistant).
  • Newsletter : heu, Matt, avoir un lien dans son Outlook ne passe de pas de PageRank, tu le sais bien ….
  • Twitter, Friendfeed, Facebook : ok, ça ramène beaucoup de trafic direct, mais, encore une fois, tout cela est en nofollow… Ne parlions-nous pas de linkbuilding?
  • Créer une liste. Ok, ok, super conseil pour un blog, mais pour un site : un vrai site de présentation. Que faire?
  • Avoir un blog ! Sans rire, je crois qu’on n’avait compris le message. Bloguer, le seul moyen d’avoir des liens selon Matt, j’ai l’impression?
  • Créer un tutoriel, un plugin Firefox…. Avoir du super contenu, quoi. N’est-ce pas exactement ce qu’on demandait pas?
  • Avoir une belle structure interne. Oui, oui, c’est très bien d’avoir un site super bien fait, mais, en tant que tel, si on ne fait rien de plus : les liens ne vont pas tomber du ciel !
  • Faire des vidéos.  C’est utile, surtout si on se rase les cheveux, mais suis-je prêt à sacrifier ma pilosité capillaire juste pour avoir des liens? Rien n’est moins sûr…

Voici la vidéo originale en anglais :

Le mot de la fin

J’avoue avoir fait en sorte de bien casser Matt Cutts pour faire de la controverse. Je pensais même appeler mon article « Fuck Matt Cutts« … Les conseils de Matt sont bons pour un blog et restent toujours dans la catégorie « super contenu ». C’est bien décevant car pour une grande majorité de site vitrine, rien de tout cela n’est vraiment applicable et pourtant il y a des solutions ! Il y en a même des white-hat, mais cela fera l’objet d’un autre post… peut-être

Pourquoi Google a blacklisté E-justice

Avant de commencer, ce post, je voudrais rappeler une chose importante : je parle ici en mon nom propre et non au nom d’un ancien employeur ou de mon employeur actuel.

E-justice attaque Google … en justice

On a appris aujourd’hui que la commission européenne demandait des explications sur l’indexation de 3 sites : Foundem, Ciao et E-justice. Je ne connais pas Foundem. Quant à Ciao, je connais bien des sites qui aimeraient avoir leurs positions sur Google. Cela dit, le cas qui m’intéresse et qui fait le plus parler de lui est le site E-justice.fr. Je connais bien ce site pour être tombé dessus lors de différentes recherches sur Google faites dans le cadre personnel et professionnel.

Qui sont E-justice ?

Je cite leur site :

E justice.fr vous permet d’effectuer vos recherches dans les différents domaines du Droit

A en croire la description, on a affaire à un moteur de recherche spécialisé dans le domaine du droit. On suppose toute une technologie de parcours d’un robot, puis une technique d’indexation et enfin un classement pertinent des résultats. Bref, le travail de tout bon moteur de recherche spécialisé.

Ejustice utilise Google !


Regardons de plus près les pages proposées depuis la page d’accueil. Allez, je clique sur Actualités judiciaires. Je tombe sur des résultats de recherche sur l’immigration (wtf !!) : une recherche fournie par la recherche personnalisée Google !! Vous cherchez du contenu rédigé par Ejustice? Ne cherchez pas, il n’y en a pas (ou très peu) sur cette page. Je passe outre les liens cassés présents sur la page, qui montre à quel point les webmasters se soucient de leurs utilisateurs et des robots !

E-justice ont sélectionné une centaine de sites dans le domaine du droit pour configurer leur recherche personnalisée. C’est une valeur ajoutée, et j’admets que cela peut représenter un intérêt, je ne reproche pas au site e-justice d’exister. Toutefois, la manière de procéder est très étrange. Je m’explique :

Pourquoi une pénalité?


Je ne peux pas mentionner ici les différentes pénalités de Google et les raisons pour lesquelles elles tombent. C’est dans un coin de ma tête et j’arrive très bien à m’en souvenir pour analyse les site de mes clients… Toutefois, je voudrais soulever plusieurs points :

1. Utilisation des produits Google

Ejustice non seulement utilise le moteur de Google pour créer ses pages mais, de plus, monétise l’ensemble de son contenu avec du Adsense. Apparemment aujourd’hui, Ejustice a décidé de supprimer ces publicités de leurs pages, mais les Adsense sont toujours bien visibles dans le cache. Choisir ou non Adsense comme régie sur son site n’a jamais été un facteur pénalisant pour un site, qu’on se le dise ! On peut tout de même se poser des questions sur la logique de Ejustice qui fonde l’ensemble de leur stratégie sur Google (génération de contenu : Google custom search, régie : Adsense, statégie principale : référencement sur Google) et qui ensuite vient porter plainte contre Google. Etrange, mais passsons. Cela ne rentre pas en ligne de compte pour les pénalités.

2. Un site bourré d’erreurs

Exemple : http://www.ejustice.fr/modes-cheveux-mariee.html , http://www.ejustice.fr/sauto20.php?query_string=magasin+alarme+voiture renvoient à l’heure où j’écris ces lignes des grosses erreurs. En soi, ce n’est pas ça qui entraîne une pénalité. Mais avant de porter plainte, il serait mieux d’embaucher un développeur qui sache coder en php (je suis pas disponible, désolé…).

3. Résultats de recherche indexés

Ejustice affirme sur Rue89 :

Google nous a dit  » Si vous travaillez sur notre algorithme, vous n’aurez plus de problèmes. On ne référence plus les moteurs de recherches car ce sont des concurrents. »

Je ne pense pas que Google leur ait dit exactement ça. Google a dû dire : « Nous empêchons l’indexation de nos propres résultats de recherche et nous attendons que les autres moteurs fassent de même à l’aide des standards robots.txt ou des balises meta. » En effet, cela n’a aucun sens pour un moteur d’indexer des résultats de recherche d’un autre moteur. Comment trouver une info si on passe d’un moteur à un autre? C’est le serpent qui se mord la queue ! Faite une simple recherche d’indexation sur Google (commande site:ejustice.fr), vous verrez que la quasi-totalité des pages indexées ne sont que des résultats de recherche !

4. Des résultats totalement aberrants

En faisant la recherche d’indexation, vous avez peut-être constaté les mots clés pour lesquelles Ejustice essaie de se placer : monospace pas cher, Vin de Pays des Cotes de Thongue, … On a le droit à une véritable énumération à la Prévert. L’algorithme n’est pas poète, l’équipe de qualité de recherche non plus… Google est en droit de prendre les actions nécessaires pour ne pas positionner ce genre de sites pour des requêtes aussi éloignées de la thématique principale ! Google a 90% de part de marché parce qu’il filtre ce genre de site et non le contraire!

5. Peu d’amélioration depuis 2007

J’ai travaillé à plusieurs reprise sur ce site depuis 2007. Et je dois avouer que je n’ai vu aucune évolution qui montre un intérêt pour l’utilisateur. Rions un peu avec des pages très user friendly :

http://web.archive.org/web/20070809050422/www.ejustice.fr/recherchedujour1107.php

Le but du site semble avoir toujours été d’indexer un maximum de pages en écrivant le minimum de contenu. Pour moi, seule la page d’accueil est vraiment utile ! Je n’ai pas le droit de vous dire si c’est moi qui ai contribué au blacklistage du site ou si tout a été fait automatiquement. Dans tous les cas, si j’avais eu à pousser le bouton blacklist pour Ejustice, je l’eusse fait avec un grand sourire.

Conclusion

Se plaindre de Google, cela me paraît raisonnable. Son algorithme n’est pas infaillible et aucun site n’est à l’abri d’un bug sur telle ou telle partie. Mais, avant de crier au scandale, il faut réfléchir : les pages qu’on veut faire indexer ont-elles vraiment leur place dans le moteur? Je connais certains sites qui subissent des déclassements pas forcément justifiés et en travaillant sur de nombreux leviers SEO, j’arrive à les faire remonter. Mais, si Ejustice m’avait contacté, ma réponse aurait été simple : « changez de concept, embauchez un (vrai) rédacteur et un (vrai) développeur. » Moi, j’ai une éthique.

Pubs Google pendant le Superbowl : truqué ?

Pendant le Superbowl, ce week-end, Google a diffusé une de leurs publicités. Comme quoi, la crise semble loin derrière pour le moteur de recherche ! Le concept de cette vidéo : un Américain parti étudier en France tombe amoureux d’une jeune fille française. Evidemment, toute leur « relationship » est basée sur les produits Google à grands coups de résultats de recherche « naturelle ».

Résultats Naturels, vraiment ?

Des résultats naturels ? Vvraiment? J’ai regardé la requête effectuée à 0’17 « impress a french girl ». Le premier résultat de la vidéo est http://www.parislogue.com/travel-tips/how-to-impress-a-french-woman.html (Notons au passage que ParisLogue ont été bien réactifs et ont su mettre à profit leur éphémère popularité avec un peu de pub). Mais, quand je fais la recherche chez moi, je tombe sur http://answers.google.com/answers/threadview/id/462348.html ce qui paraît beaucoup plus logique en termes de SEO puisque le terme exact est dans le title et non juste un synonyme. C’est étonnant, Google n’aurait pas voulu mettre en avant un de leur produit Google Answers et aurait préféré un site au hasard? Sans doute ! Rappelez-vous que Google Answers a fermé discrètement il y a quelques mois et que c’est un de leur plus grands échecs. Surtout si on compare avec le succès d’un Yahoo Answer !

Et maintenant ?

Pour rebondir sur la popularité de cette vidéo, je pense que Google devrait organiser sur Youtube un concours des meilleures suites à l’histoire d’amour. Cela pourrait être assez marrant (buzzant plutôt). Il y a déjà quelques parodies qui circulent (cf ci dessous). Petite idée pour quelqu’un qui a un peu de temps, faire une parodie de la pub avec un super moteur comme Voila, Cuil ou Bing… pas sûr qu’avec ces moteurs, l’histoire se terminent aussi bien, hé hé.