Pourquoi Google a blacklisté E-justice
Avant de commencer, ce post, je voudrais rappeler une chose importante : je parle ici en mon nom propre et non au nom d’un ancien employeur ou de mon employeur actuel.
E-justice attaque Google … en justice
On a appris aujourd’hui que la commission européenne demandait des explications sur l’indexation de 3 sites : Foundem, Ciao et E-justice. Je ne connais pas Foundem. Quant à Ciao, je connais bien des sites qui aimeraient avoir leurs positions sur Google. Cela dit, le cas qui m’intéresse et qui fait le plus parler de lui est le site E-justice.fr. Je connais bien ce site pour être tombé dessus lors de différentes recherches sur Google faites dans le cadre personnel et professionnel.
Qui sont E-justice ?
Je cite leur site :
E justice.fr vous permet d’effectuer vos recherches dans les différents domaines du Droit
A en croire la description, on a affaire à un moteur de recherche spécialisé dans le domaine du droit. On suppose toute une technologie de parcours d’un robot, puis une technique d’indexation et enfin un classement pertinent des résultats. Bref, le travail de tout bon moteur de recherche spécialisé.
Ejustice utilise Google !
Regardons de plus près les pages proposées depuis la page d’accueil. Allez, je clique sur Actualités judiciaires. Je tombe sur des résultats de recherche sur l’immigration (wtf !!) : une recherche fournie par la recherche personnalisée Google !! Vous cherchez du contenu rédigé par Ejustice? Ne cherchez pas, il n’y en a pas (ou très peu) sur cette page. Je passe outre les liens cassés présents sur la page, qui montre à quel point les webmasters se soucient de leurs utilisateurs et des robots !
E-justice ont sélectionné une centaine de sites dans le domaine du droit pour configurer leur recherche personnalisée. C’est une valeur ajoutée, et j’admets que cela peut représenter un intérêt, je ne reproche pas au site e-justice d’exister. Toutefois, la manière de procéder est très étrange. Je m’explique :
Pourquoi une pénalité?
Je ne peux pas mentionner ici les différentes pénalités de Google et les raisons pour lesquelles elles tombent. C’est dans un coin de ma tête et j’arrive très bien à m’en souvenir pour analyse les site de mes clients… Toutefois, je voudrais soulever plusieurs points :
1. Utilisation des produits Google
Ejustice non seulement utilise le moteur de Google pour créer ses pages mais, de plus, monétise l’ensemble de son contenu avec du Adsense. Apparemment aujourd’hui, Ejustice a décidé de supprimer ces publicités de leurs pages, mais les Adsense sont toujours bien visibles dans le cache. Choisir ou non Adsense comme régie sur son site n’a jamais été un facteur pénalisant pour un site, qu’on se le dise ! On peut tout de même se poser des questions sur la logique de Ejustice qui fonde l’ensemble de leur stratégie sur Google (génération de contenu : Google custom search, régie : Adsense, statégie principale : référencement sur Google) et qui ensuite vient porter plainte contre Google. Etrange, mais passsons. Cela ne rentre pas en ligne de compte pour les pénalités.
2. Un site bourré d’erreurs
Exemple : http://www.ejustice.fr/modes-cheveux-mariee.html , http://www.ejustice.fr/sauto20.php?query_string=magasin+alarme+voiture renvoient à l’heure où j’écris ces lignes des grosses erreurs. En soi, ce n’est pas ça qui entraîne une pénalité. Mais avant de porter plainte, il serait mieux d’embaucher un développeur qui sache coder en php (je suis pas disponible, désolé…).
3. Résultats de recherche indexés
Ejustice affirme sur Rue89 :
Google nous a dit » Si vous travaillez sur notre algorithme, vous n’aurez plus de problèmes. On ne référence plus les moteurs de recherches car ce sont des concurrents. »
Je ne pense pas que Google leur ait dit exactement ça. Google a dû dire : « Nous empêchons l’indexation de nos propres résultats de recherche et nous attendons que les autres moteurs fassent de même à l’aide des standards robots.txt ou des balises meta. » En effet, cela n’a aucun sens pour un moteur d’indexer des résultats de recherche d’un autre moteur. Comment trouver une info si on passe d’un moteur à un autre? C’est le serpent qui se mord la queue ! Faite une simple recherche d’indexation sur Google (commande site:ejustice.fr), vous verrez que la quasi-totalité des pages indexées ne sont que des résultats de recherche !
4. Des résultats totalement aberrants
En faisant la recherche d’indexation, vous avez peut-être constaté les mots clés pour lesquelles Ejustice essaie de se placer : monospace pas cher, Vin de Pays des Cotes de Thongue, … On a le droit à une véritable énumération à la Prévert. L’algorithme n’est pas poète, l’équipe de qualité de recherche non plus… Google est en droit de prendre les actions nécessaires pour ne pas positionner ce genre de sites pour des requêtes aussi éloignées de la thématique principale ! Google a 90% de part de marché parce qu’il filtre ce genre de site et non le contraire!
5. Peu d’amélioration depuis 2007
J’ai travaillé à plusieurs reprise sur ce site depuis 2007. Et je dois avouer que je n’ai vu aucune évolution qui montre un intérêt pour l’utilisateur. Rions un peu avec des pages très user friendly :
http://web.archive.org/web/20070809050422/www.ejustice.fr/recherchedujour1107.php
Le but du site semble avoir toujours été d’indexer un maximum de pages en écrivant le minimum de contenu. Pour moi, seule la page d’accueil est vraiment utile ! Je n’ai pas le droit de vous dire si c’est moi qui ai contribué au blacklistage du site ou si tout a été fait automatiquement. Dans tous les cas, si j’avais eu à pousser le bouton blacklist pour Ejustice, je l’eusse fait avec un grand sourire.
Conclusion
Se plaindre de Google, cela me paraît raisonnable. Son algorithme n’est pas infaillible et aucun site n’est à l’abri d’un bug sur telle ou telle partie. Mais, avant de crier au scandale, il faut réfléchir : les pages qu’on veut faire indexer ont-elles vraiment leur place dans le moteur? Je connais certains sites qui subissent des déclassements pas forcément justifiés et en travaillant sur de nombreux leviers SEO, j’arrive à les faire remonter. Mais, si Ejustice m’avait contacté, ma réponse aurait été simple : « changez de concept, embauchez un (vrai) rédacteur et un (vrai) développeur. » Moi, j’ai une éthique.

25 février 2010 - 11:19
Je pense que tu veux parler du moteur de recherche personnalisé plutôt que de la rechercher personnalisée. Les moteurs de recherche interdisent aux robots d’indexer leur résultats. Ainsi Bing ne peut crawler les serps de Google.
SI je me souviens bien il est possible d’avoir un Google Custom search dépouillé des pub adsenses pour un certains montant. Deux poids deux mesures, en effet Mahalo fait des ravages en scrapant les contenus des autres sites et reste impuni, mais dès qu’il d’agit de GG, attention
25 février 2010 - 11:38
En effet, je parle de moteur de recherche personnalisé. Je n’ai d’ailleurs pas vérifié s’ils utilisaient Adsense for Search, ou just Custom Search Engine. Dans tous les cas, comme dirait George, « le temps ne change rien à l’affaire » …
25 février 2010 - 12:12
Très bonne analyse, si Google veux rester pertinent aux yeux des utilisateurs : indexer ses propres résultats de recherches n’a aucun sens. C’est dingue que certains ne comprennent pas cela.
26 février 2010 - 07:12
Bonjour @smonnier, bonjour à tous,
Je ne rejoins pas votre avis, sur les mots « poètes », et je ne vois pas pourquoi quoi sur le sujet de fond ?
De mon point de vue technique, combien de temps pour monter un crawler et d’indexation ? vraisemblablement 3 jours ! Les mots clefs ? ca se trouvent tout seul-> c’est sur la durée !
De mon point de vue sociétale, vous parlez l’éthique de quel moteur ? Ce qui est opaque ne restera pas longtemps sous la lumière .-)
Pour conclure rapidement, en passant un petit tour sur votre blog, y’a t’il pas d’autres outils que vous aimerez en discuter ?. Cela va sans doute m’inciter à recommander votre blog .-)
Salutations
Duc.B
26 février 2010 - 12:50
On est d’accords sur l’ensemble des points, un jour faut admettre qu’on a tords et arrêter de faire de la merde. La mort de ejustice ne me chagrinera pas, bien au contraire.
8 mars 2010 - 22:27
« Je ne pense pas que Google leur ait dit exactement ça. Google a dû dire [...] »
Comment peut-on écrire un article en disant cela ? Tu penses donc être mieux placé que le directeur de E-justice pour savoir ce que Google a dit à E-Justice.
Moi je ferai bien le pari que Google a donné un peu d’argent en disant à E-justice : « tiens voilà de l’argent, tu mets google comme moteur sur ton site et t’annules ton action en justice ».
Plus sérieusement, j’ai hâte de voir si cet arrangement à l’amiable et le retrait de la plainte n’aura pas lieu. Selon moi c’est ce que cache ce soudain changement de listes de résultats et cette soudaine adoption de Google…
8 mars 2010 - 23:39
En fait, Ejustice a toujours utilisé Google comme moteur, donc il n’y a pas de soudaine adoption ou quoi que ce soit. D’autre part, je ne suis pas forcément mieux placé que le directeur d’Ejustice, mais comme je faisais partie de l’équipe Google qui traitait ce genre de problèmes, je connais bien la communication externe de Google sur les résultats naturels. Cela dit, si l’interlocuteur d’Ejustice n’a pas été un Googler bien formé, il n’est pas interdit que celui-ci lui ait raconté n’importe quoi, cela m’étonnerait tout de même.
20 avril 2010 - 18:23
Bravo pour cette belle analyse !