Nous rendons le référencement accessible

Votre compte formation

Votre compte formation vous permet d'accéder à la liste de vos formations ou pour vous pré-inscrire à de nouvelles

Félicitation,

Accéder au logiciel Optimiz.me

Se connecter au logiciel
Votre site en première page de Google

Google Panda : tout savoir sur l’algorithme Panda

Environ 2 minutes de lecture

Officiellement lancé le 24 février 2011, Panda est un filtre de l’algorithme de Google qui lutte contre les contenus de mauvaise qualité. On parle de « filtre de nettoyage » (et non de mise à jour de l’algorithme de pertinence) puisque Panda est « lancé » par Google pour nettoyer les résultats du moteur de recherche.

Il s’agit de différencier les sites de bonne qualité de ceux de mauvaise qualité et de sanctionner ces derniers.

La notion de qualité étant ici regardée sous l’angle du contenu. Dorénavant, seront des bons sites, ceux ayant du bon contenu (le contenu devient un critère primordial pour Google).

Avec Panda, c’est « une nouvelle façon de voir le référencement naturel, l’optimisation de sites web et la visibilité organique sur les moteurs de recherche » qui apparait.

 

Sanction Google Panda

Origine du nom

Le nom de Panda vient de l’ingénieur indien Navneet Panda qui a travaillé sur la création de ce filtre.

Historique de la sanction 

Après quelques prémices en janvier 2011 (2% des requêtes touchées aux Etats-Unis) visant à lutter contre les scrapeurs, le lancement officiel de Panda date du 24 février 2011.

  • 24 février 2011 : Panda 1.0. Cette première version du filtre est d’abord lancée uniquement aux Etats-Unis sous le nom de « mise à jour Farmer ». Ce patronyme traduit bien le but majeur de ce filtre : lutter contre les « fermes de contenu ».

 

  • 11 avril 2011 : Panda 2.0 est lancé. En plus des USA, le filtre s’applique désormais à tous les sites anglophones (Grande Bretagne, Australie, …).

 

  • 12 août 2011 : lancement de Panda, version 2.4 (ou 3.0) dans le monde entier (hors pays asiatiques).

 

  • Total fin 2013 : on comptabilise 26 lancements du filtre de nettoyage Panda.

 

  • Mise à jour avec Panda 28 (ou Panda 4.0) : 20 mai 2014.  De nouveaux critères sont intégrés à Panda.

 

  • Septembre 2014 : version 4.1.

 

  • Panda Everflux : depuis mars 2013 le filtre Panda fait partie intégrante de l’algorithme de Google (fonctionnement synchrone). Il n’y a plus de lancement mensuel, les mises à jour se font en temps réel.

 

Techniquement il ne s’agit donc plus d’un filtre au sens classique (comme l’est toujours Penguin). Désormais Panda est intégré au process d’indexation, ce qui signifie qu’à part des mises à jour importantes comme Panda 4 (mise à jour du filtre Panda, à ne pas confondre avec un lancement du filtre) les effets sont moins visibles.

Le suivi des dates de Panda devient moins aisé (même si les mises à jour semblent toujours fonctionner sur une fréquence mensuelle).

Panda, les raisons du lancement

 

Après des vagues de spam et de sites présentant des contenus faibles et de mauvaise qualité, Google a souhaité faire le grand ménage et améliorer la qualité de ses résultats naturels.

Dans quelle optique ? Dépolluer son index des pages de trop faible qualité et rester le moteur de recherche n°1 !

Comment faire ?

  • Pénaliser les sites présentant du contenu de « faible qualité »
  • Favoriser les sites avec du contenu jugé de « bonne qualité »

 

Le fonctionnement de la sanction

Particularité de la sanction : la pénalité peut s’appliquer à tout le site ou juste aux pages repérées comme de mauvaise qualité.

Bilan des opérations ? Panda ne présente plus que le contenu de qualité (on désindexe le reste). On dit parfois que Google applique une « double peine » : le site complet risque d’être sanctionné et un  site pénalisé sera moins crawlé par les robots du moteur.

 

Votre site en première page de google

J’essaye gratuitement 14 jours

 

Qu’est-ce que le contenu de mauvaise qualité ?

 

Comme l’explique Olivier Andrieu dans son livre « Réussir son référencement web », la notion de « contenu de mauvaise qualité » correspond à deux éléments :

  • Le type de site web
  • Le type de contenu visé

Revenons point par point sur ces deux sujets.

Les sites visés par Panda

Sont spécialement visés par Panda :

  • Les fermes de contenu

Les fermes de contenu (ou content farms en anglais) sont des sites créés à partir des mots-clés les plus tapés par les internautes. A partir de ces mots-clés, le site produit du contenu de très faible qualité, qui est mis en ligne sur des pages optimisées.

Ces pages, parfaitement travaillées en termes de référencement, seront donc celles qui apparaissent le plus dans les premiers résultats des SERP (page de résultats de Google). Le but de ces sites étant ensuite de faire du chiffre grâce aux très nombreuses publicités présentes sur ces pages.

Les américains ont été les grands spécialistes de ce genre de pratique, bien plus que les français (qui n’ont peut-être finalement pas eu le temps de se lancer à la conquête de ce marché avant l’arrivée de Panda).

  • Les agrégateurs de contenu

Un site agrégateur de contenu est un site qui reprend du contenu sur d’autres sites (contenu dont il n’est donc pas propriétaire) pour le publier sur ses pages. Il peut s’agir d’une pratique légale avec un fonctionnement en marque blanche ou d’un système illégal avec du contenu scrapé, c’est-à-dire repris mot pour mot sur des sites, sans leur accord.

  • Les comparateurs de prix

Un comparateur de prix permet, via un moteur interne, de comparer les prix d’un même produit trouvé à plusieurs endroits sur internet.

Google ayant lui-même racheté plusieurs sites de ce type et investi dans Google Shopping, on comprend d’autant plus, ses réticences à référencer ces pages.

  • Les forums et sites de questions/réponses

Indexer des pages web a un coût pour Google. Et comme il n’est pas dans son intérêt (ni dans celui des internautes) d’indexer des pages de faible contenu, les forums sont peu appréciés de Google. La plupart des sites de type forums et questions réponses présentent en effet des pages sans contenu ou avec des questions sans réponse, donc sans intérêt.

  • Le duplicate content

Le duplicate content désigne le contenu dupliqué, c’est-à-dire le contenu identique (similaire ou très proche) sur 2 pages web distinctes.

Il peut s’agir d’un contenu repris à l’identique entre 2 pages d’un même site ou d’un contenu dupliqué entre 2 sites différents.

Puisque l’indexation coûte cher à Google il ne va pas indexer plusieurs versions d’un même contenu. Il va définir un contenu comme étant l’original (le contenu d’origine, dit « canonique ») et identifier les autres contenus identiques comme des copies (des contenus dupliqués). Le contenu canonique sera mis dans l’index principal.

Toutes les autres pages au contenu proche seront considérées comme dupliquées et iront dans l’index secondaire, ce qui a pour effet de fortement les déclasser dans les SERP.

La notion de « canonique » est définit par deux critères : l’antériorité et la popularité (concept de popularité définit en fonction des backlinks de la page).

Les contenus visés par Panda

 

  • Les pratiques de cloaking

Le cloaking est une façon de mettre en ligne deux contenus différents : un destiné aux internautes et un spécialement conçu pour les moteurs de recherche. C’est une pratique officiellement interdite et sanctionnée par Google. Le contenu doit être le même pour les visiteurs humains et pour Google.

  • Le content spinning

Le content spinning consisite à créer du nouveau contenu à partir d’un contenu existant en changeant seulement certains mots, verbes ou expressions. C’est une façon de ne pas faire du contenu dupliqué. Au lieu de copier-coller un texte identique, on le réécrit de manière automatique. Ces méthodes ont été rendes possibles par des logiciels en ligne de content spinning.

  • Le scraping

Scraper un texte consiste tout simplement à reprendre mot pour mot un texte déjà présent sur un site pour le mettre sur un autre site, avec l’accord ou pas du site propriétaire du contenu original. C’est ce que l’on appelle aussi le pillage de contenus (scrapers).

Comment savoir si mon site est sanctionné ?

La sanction avec Panda est une sanction dite automatique (sanction algorithmique et non manuelle). Il n’y a donc aucun avertissement de la part de Google, vous ne recevez aucun mail : aucun moyen de savoir à 100% si votre site a été touché par Panda.

Néanmoins quelques signes peuvent vous mettre sur la voie :

  • Un site de moins en moins visité par les robots de Google peut être la conséquence d’une sanction Panda. Car rappelons-le, un site pénalisé par Panda sera moins visité par les robots qu’un site non pénalisé.
  • Des pages moins bien indexées.
  • Une perte de position dans les SERP sur certaines de vos requêtes clés.
  • Un site qui perd subitement beaucoup de visites peut aussi avoir été touché par l’animal monochrome. Il est donc important de se tenir régulièrement informé des mesures d’audience en utilisant par exemple l’outil Google Analytics.
  • Des pages qui perdent subitement des positions dans les résultats Google (signe que certaines de vos pages sont indexées dans l’index secondaire de Google).

Comment éviter la sanction Panda ?

Afin d’éviter Panda, votre contenu doit être :

  • Unique (la zone utile de la page doit être composée de contenu textuel original, c’est-à-dire non repris à l’identique sur d’autres pages). Si plusieurs pages de votre site sont trop similaires, il sera alors judicieux de ne pas toutes les indexer.
  • Utile (répondre aux requêtes des internautes) et avec une vraie valeur ajoutée (se distinguer de ce qui est déjà proposé sur d’autres sites ou le rédiger  sous un angle différent et avec des éléments complémentaires).

 

Enfin, nous vous recommandons également la lecture des recommandations de Google publiées en 2011 et indiquant les questions à se poser pour savoir si un contenu est susceptible d’être visé par Panda.

Des informations toujours intéressantes pour être à l’abri d’une pénalité Google Panda.

Comment sortir d’une pénalité Google Panda ?

 

  • vérifier tous les problèmes d’indexation qui peuvent exister sur votre site (désindexer les pages inutiles, les pages au contenu dupliqué et les pages avec un fort taux de rebond par exemple). Avec ce type d’actions vous allez dans le bon sens : vous favorisez le crawl du robot et vous améliorez l’expérience utilisateur.

 

  • améliorer vos contenus (ajouter du contenu textuel unique, informatif, pertinent !) Vous devez impérativement éviter tout contenu pauvre, sur-optimisé ou dupliqué et mettre en place une vraie stratégie éditoriale.

Donc si vous n’avez pas le temps de reprendre vos contenus éditoriaux : supprimer les pages au contenu de trop mauvaise qualité.

  • supprimer toutes les pratiques « black hat » mentionnées auparavant (scraping, fermes de contenu, syndication de contenus,… ).

 

  • favoriser l’expérience utilisateur. Pour cela, vous pouvez notamment revoir les points suivants : temps de chargement des pages, taux de rebond, taux de clic, temps passé sur le site, pogosticking,…

 

  • éviter les pages remplies de pubs et encore plus si la majorité de celles-ci se trouvent au-dessus de la ligne de flottaison. De manière générale ne mettez pas de publicité dans vos articles. Préférez les zones non éditoriales comme les espaces à gauche et à droite ou encore le header.

 

Le filtre étant maintenant mis à jour en continu, sortir de la sanction Panda se fait beaucoup plus rapidement. Dans le mois suivant les actions correctives, vous pouvez espérer dire « bye bye » au mammifère !

Conclusion 

Si vous voulez être ami avec Panda et passer entre les « coups de bambou »  faites des sites de qualité et respectez les guidelines Google.

Enfin, pour ne plus vivre à la merci des changements d’algorithmes, n’oubliez pas de diversifier vos sources de trafic : rien de plus dangereux que d’être « Google dépendant ».

 

 Article similaire