Generer des sitemap XML
January 15, 2008 – 2:30 pm
La plupart des moteurs de recherche (Google, Yahoo, Live Search, Ask.com, Exalead, …) utilisent le protocole sitemap pour accélerer le référencement d’un site. Au lieu d’attendre que le robot du moteur vienne indexer les pages du site, il est possible de mettre à disposition des moteurs de recherche une liste des urls des pages du site dans un fichier au format XML. En ouvrant un compte Google, on peut indiquer à Google l’url de ce fichier; Google vient ensuite télécharger le fichier et il indexe dans la foulée les pages du site. Bien plus rapidement que par le biais de son robot d’indexation. Le protocole sitemap permet aussi de filtrer les pages qui seront indéxées. On peut ainsi eviter que ne soit indéxés les fichiers pdf, ce qui est parfois utile pour éviter d’avoir du contenu en doublons.
Malheureusement, il n’est pas toujours simple de produire ce fichier xml des url des pages du site. C’est par exemple le cas, lorsque l’on utilise certains CMS ou que l’hébergement soit sur des serveurs IIS ce qui ne facilite pas de faire tourner le générateur de sitemap mis à disposition par Google et qui nécessite python.
Dans ce cas, il suffit simplement d’utiliser le site http://www.xml-sitemaps.com
Pour un site de moins de 500 pages, il donne le fichier sitemap.xml gratuitement.
Pour plus d’information sur le protocol sitemap, voir le site http://www.sitemaps.org/
Consultant, Project Manager in Paris, I design web application and assist companies with their internet issues.
I also blog on 

