Il y a quelques jours de cela, certains webmasters pouvaient se heurter à une erreur jusqu’alors inconnue dans Google Webmaster Tools. Cette nouvelle mise en garde ajoutée par Google concerne le sitemap associé à votre site, désormais un message vous indique quand celui-ci contient des URL dupliquées. Une nouvelle fonctionnalité qui en aidera plus d’un lorsqu’il s’agissait de vérifier « à la main » plusieurs milliers de lignes à la recherche des éventuels bugs qui auraient ajoutés plusieurs fois la même page.

L’erreur complète apparait comme ceci (si vous avez un compte en anglais) :

« This URL is a duplicate of another URL in the sitemap. Please remove it and resubmit. »

Google vous propose donc de retirer l’URL fautive et de resoumettre votre sitemap. Mais il se peut que dans certains cas il se trompe : la page exemple.com/page/ peut-être vraisemblablement différente de exemple.com/page/index.html Google les considèrera comme identiques.

JohnMu de Google nous en dis plus sur ce nouvel ajout :

« This is a new warning message we added to inform you of this issue. This does not mean that we treat your Sitemap file in any way differently, it’s just for your information (and this information wasn’t shown to users before). In general, it makes little sense to submit duplicate URLs in a Sitemap file, which is why this message was added.

There is one item which may lead to confusion here though – Google’s Sitemaps processing generally simplifies URLs in ways that make sense on a whole. This includes removing « /index.html » from the URL if that’s the last part. In general, that makes sense, since you want to show users the relevant part of the URL (and since most servers will automatically check « index.html » when the root page is requested).

However, there are some cases where « /index.html » is a relevant part of the URL and can’t be removed. In these cases, we’ll generally discover those URLs through our normal web-crawl. At the moment, it’s possible that our Sitemaps processing will show these warnings in those cases – but since this does not signal any change in the processing of your Sitemaps files, you can safely ignore these warnings.

In short: these warnings are new, but the processing of your Sitemaps files has not changed. »

Il ajoute pour résumer que le traitement des sitemaps n’a pas changé avec ce nouvel ajout donc libre à vous d’en tenir compte ou pas.