Pages dupliquées sur Google pour cause de Php – La Solution

Qui n’ a pas eu la mauvaise surprise de trouver dans les pages référencées par Google pour son site des pages dupliquées de type:

  • http://www.exemple.com/index.php?id=nimportequoi
  • http://www.exemple.com/index.php/nimportequoi.php
  • http://www.esemple.com/?spam

Le résultat en est un duplicate content ( contenu dupliqué ), chose que Google n’aime pas du tout et sanctionne souvent fortement.

Ces pages ont beau ne pas exister sur votre site, mais quand vous cliquez sur ces liens, vous voyez bien s’ afficher le contenu de http://www.exemple.com/index.php .

Le problème est le même pour les différents affichages possible d’ une même page :

  • http://www.exemple.com/index.php
  • http://www.exemple.com/
  • http://exemple.com/index.php
  • http://exemple.com/

Une solution pour résoudre ce problème consiste à avoir un compte Sitemap chez Google qui vous permet de suivre votre référencement et de gérer la façon dont vous voulez que Google référence votre site.

Dans ce cas vous pouvez demander à Google de référencer plutôt les pages avec le www mais cela ne suffit pas.

Vous pouvez également dans Sitemap obtenir la suppression des pages que vous ne voulez pas voir figurer dans son index, si vous ne l’avez pas fait grâce à un fichier robot.txt .

Le problème peut rapidement devenir pénible si votre site a de nombreuses pages et que le phénomène se reproduit.

Pas de doute, on en veut à votre pagerank et aux bonnes positions que vous avez sur la première page de Google pour votre mot clé favori.

Comment se rendre compte de la duplication

Allez sur le site de Google et tapez la requète suivante:

  • site:www.exemple.com

Nuturellement vous changez exemple.com par votre nom de domaine !

Origine des duplications

Si votre problème est lié au www ou au fichier index.php, ce n’ est du qu’au serveur httpd .
Tout le monde a le même problème et les solutions données ci-dessus peuvent faire l’ affaire.

Dans le cas d’ajout derrière le “.php” ou le “/” , il peut s’agir de malveillance ou de d’erreur dans les liens dirigeant vers votre site.

La fonction de Google permettant de connaitre les liens vers votre site n’ est pas efficace car elle n’est pas exhaustive :
link:www.exemple.com/index.php?spam

Le même requête sur yahoo est un peu plus prolixe.

Si l’origine est malveillante, il est probable que la page ayant contenu votre lien n’ existe plus,

Nos hébergements disposent d’ un référencement automatique et gratuit auprès des principaux moteurs de recherche. Ce référencement est basé sur les logs http de votre site.
Si un utilisateur tape l’ Url dans un navigateur quelconque, il est fort probable que la page se fasse référencer.

Solution pour les pages dupliquées

Notre solution repose sur l’utilisation du fichier .htaccess et du module mod_rewrite du serveur apache

Code à insérer dans votre fichier .htaccess à la racine de votre site :

  1. Options +FollowSymLinks
  2. RewriteEngine on
  3. RewriteCond %{HTTP_HOST} ^exemple.com
  4. RewriteRule ^(.*)$ http://www.exemple.com/$1 [R=permanent,L]
  5. RewriteRule ^(.*).php/.* http://www.exemple.com/$1.php [R=permanent,L]
  6. RewriteCond %{QUERY_STRING} .
  7. RewriteRule (.*) http://www.exemple.com/$1? [R=permanent,L]
  8. RewriteRule (.*)index.php http://www.exemple.com/$1? [R=permanent,L]

Les deux premières lignes initialisent la fonction pour votre site.
Les lignes 3 et 4 ajoutent automatiquement www à votre page si votre site est appelé sans.
La ligne 5 vous permet de supprimer toute page de type index.php/spam
La ligne 6 et 7 supprime toute requète de type index.php?id=spam. A noter le point à la fin de la ligne 6.
La ligne 8 transforme tout requète “index.php” en requète “/”.

Un fois ce fichier en place, vous pourrez enfin vous consacrer à ce que vous préférez, vous placer en première position.

Un lien bien documenté pour en savoir plus sur le module mod_rewrite .

:icon_rolleyes:

Leave a Reply

Your email address will not be published. Required fields are marked *