Navigation à facettes et bonnes pratiques SEO

Home / Blog / SEO / Navigation à facettes et bonnes pratiques SEO

Pour la grande majorité des sites, un crawl efficace est capital pour de bonnes performances SEO. Une architecture bien optimisée, couplée à une stratégie de liens internes intelligents, permet aux utilisateurs de naviguer vers l’information recherchée en peu de clics. Cela permet aussi d’éviter aux robots de crawler des contenus non pertinents et dupliqués.

Cela peut être un énorme challenge pour les sites e-commerce qui possèdent des centaines voire des milliers de pages proposant des produits / catégories similaires. Avec la multitude de combinaisons possibles avec les attributs (couleurs, tailles, matière, etc.) pour chaque catégorie, le budget crawl peut être sévèrement impacté. Le risque principal étant que Google Bot rate des pages importantes pour la visibilité du site.

Lorsqu’une navigation à facette est correctement implémentée au sein de votre site, cela garanti aux utilisateurs de trouver le produit désiré, tout en maîtrisant le crawl budget des différents robots d’indexation des moteurs de recherche.

Navigation à facette et filtres de recherche, quelles différences ?

Habituellement on retrouve souvent la navigation à facette dans la sidebar d’un site ecommerce. Cela permet aux utilisateurs d’affiner et trier leur recherche en sélectionnant différents attributs. Dans la partie centrale de la page, la liste des produits se met ainsi à jour pour mieux correspondre à la recherche de l’utilisateur.

Exemple de navigation à facette
Exemple – Navigation à facette

Les filtres de recherche sont utilisés pour trier et affiner des produits au sein d’une page : du plus cher au moins cher, disponibilité du produit, popularité via un système d’avis… Ils ne vont pas changer le contenu de la page, mais peuvent parfois générer de nouvelles URL. Qui dit contenus similaires avec des URL différentes, dit duplication de contenu.

Exemple de filtres de recherche
Exemple – Filtres de recherche

Quels sont les potentiels problèmes générés ?

La navigation à facette peut provoquer un certain nombre de problèmes en référencement naturel :

Navigation à facette ouverte aux robots

Laisser tous les filtres crawlables et indexables (même lorsque le contenu de la page ne change page) peut amener des problèmes de duplication de contenu et gaspillage du budget crawl. Plus le nombre de paramètres se multiplie, plus le nombre de pages au contenu proche augmente de manière exponentielle. Concrètement cela peut impacter le positionnement de la page sur Google :

Exemple :

  • https://www.monsitemarchand.com/outillage/tronconneuse-thermique/
  • https://www.monsitemarchand.com/outillage/tronconneuse-thermique/?price=moinsde10euros
  • https://www.monsitemarchand.com/outillage/tronconneuse-thermique/?price=moinsde10euros&puissance=3000wetplus

En crawlant ces différentes pages au contenu proche, le robot d’indexation peut être dérouté et ne pas savoir quelle page indexer en priorité. Cela occasionne souvent un mouvement important dans les pages de résultats : plus ou moins bonne position, l’URL positionnée qui change…

Afin d’éviter que les robots d’indexation ne gaspillent de temps sur des pages sans valeur ajouté, certaines règles devront être créées afin de limiter le crawl et l’index des URL filtrées.

Navigation à facette fermée aux robots

La manière opposée est de bloquer le crawl et l’indexation de tous les filtres de la page. En faisant comme cela, on peut passer à côté d’un large panel mots clés intéressants pour le SEO !

Exemple : On recherche des baskets pour homme et on arrive sur la page /basket-homme d’un site marchand. On décide alors de cocher la marque « Adidas » dans le menu select « Marque » proposé. On arrive ainsi sur la nouvelle page /basket-homme/adidas.

Si un nofollow est configuré sur l’attribut « Adidas » et que la page /basket-homme/adidas est bloqué par un noindex, on se prive d’une potentielle visibilité sur l’expression « basket homme adidas ».

Solutions pour une navigation à facette « SEO friendly »

Réfléchir à une navigation à facettes performante c’est augmenter l’indexation des pages utiles (pages recherchées par l’internaute, qui proposent un contenu pertinent, bien optimisées…) tout en diminuant le nombre des pages inutiles (pages triées du plus cher au moins cher, produits coûtant tel ou tel prix…).

Lorsque vous devez mettre en place une navigation à facettes sur votre site, vous décidez des contenus à indexer ou non.

Noindex, follow

Une solution efficace pour ne pas indexer vos pages. Par contre, cela n’empêche aucunement les robots à crawler vos contenus. On gaspille ainsi du temps de crawl, ainsi que le transfert de jus vers la page que l’on souhaite désindexer… Dommage non ?

Canonicalisation

La balise « link rel=canonical » est utilisée par de nombreux sites sur la toile. En clair, cela permet d’indiquer à Google la version de page que vous souhaitez indexer, parmi toutes les autres versions. Cette solution permet en théorie de diminuer le contenu dupliqué. Attention toutefois, cette balise n’est pas une directive mais une indication pour Google. Ainsi, on peut se retrouver avec des URL indexées dans l’index Google, malgré la configuration d’une canonique.

Point positif, l’autorité transmise par vos liens vers la canonique est consolidée. Par contre, cela n’empêche pas le crawl de vos pages.

Exemple :

/tronconneuse-thermique?moins-de-150-euros/ devrait être configurée avec cette canonique : /tronconneuse-thermique/. Dans cet exemple, l’autorité du lien (jus de lien ou « link equity » pour Moz) ira vers la canonique. De plus la page « moins de 150 € » ne sera pas considérée comme de la duplication par Google.

Disallow dans le robots.txt

Mettre en disallow une partie des URL générées dynamiquement ( ?couleur, ?prix, ?taille…) peut être une bonne solution. C’est rapide et facilement modifiable. Deux inconvénients toutefois : le jus transmis par les liens est coupé vers vos autres pages et Google va malgré tout indexer ces pages.

Exemple – Page indexée, configurée en disallow dans le robots.txt

Exemple :

On décide de passer notre page /tronconneuse-thermique?moins-de-150-euros/ en disallow dans le robots.txt. Cela indique à Google de ne pas visiter les pages proposant ce paramètre. Par contre, si des liens (en « follow ») pointent vers ce type d’URL, Google peut les indexer.

Nofollow sur les facettes non désirées

Il est possible de mettre l’attribut rel=nofollow sur les liens des facettes non désirées. Malheureusement cet attribut n’est pas toujours efficace, des contenus dupliqués peuvent s’indexer et le « link equity » est piégé.

Génération dynamique de résultats (Ajax)

Si vous êtes en train de concevoir un nouveau site ou bien refondre un site existant, je vous recommande de penser votre navigation à facettes de manière à limiter la génération de nouvelles URL (affichage dynamique en Ajax).

Si vous êtes en train de concevoir un nouveau site ou bien refondre un site existant, je vous recommande de penser votre navigation à facettes de manière à limiter la génération de nouvelles URL (affichage dynamique en Ajax). Cette technique facilite la navigation et le filtrage des produits, tout en ne générant qu’une seule URL. Si jamais des URL sont malgré tout générées, il vous suffira de configurer une « meta robots=noindex » sur chaque d’entre elles.

Cependant, il faut s’assurer que l’on possède des landing pages pour les combinaisons de facettes importantes pour le SEO (« chaussure adidas femme », « robe noire »…).

Quelle est la meilleure configuration ?

A savoir que la Solution idéale n’existe pas. En effet, pour tendre vers la bonne configuration, vous devrez surement combiner les différentes options présentées au-dessus.

Il faut se poser la bonne question : « Est-ce que je dois plus faire attention au temps de crawl alloué ou au jus de mes liens ? ». En répondant à cette question, vous êtes proches de la solution idéale.

Prenons l’exemple d’un site qui autorise l’indexation de toute sa navigation à facette. Certes le jus de lien circule bien, mais Google va passer énormément de temps à indexer des millions de pages inutiles. Dans ce scénario, c’est donc le « crawl budget » qui nous intéresse.

Voici les recommandations adaptées à ce cas de figure :

1) Les catégories de niveaux 1, 2, 3 doivent rester accessibles et indexables pour les robots. (ex : /outillage/, /outillage/electroportatif/, /outillage/electroportatif/tronconneuse/)

2) Pour chaque catégorie, n’autoriser à l’indexation que les pages générées avec une facette sélectionnée.

a) Sur les pages qui ont une ou plusieurs facettes de sélectionnés : tous les liens deviennent « nofollow » (ex : /outillage/electroportatif/tronconneuse?puissance=400w)

b) Sur les pages qui ont deux ou plusieurs facettes de sélectionnés : la balise robots « noindex » est ajoutée dans le head des pages concernées (ex : /outillage/electroportatif/tronconneuse?puissance=400w&longeur-guide=35cm/)

3) Lister ensuite quelles sont les facettes qui ont un bénéfice pour le SEO (par exemple la couleur, la marque…).

4) Vérifier la configuration de vos balises canoniques et de la configuration des attributs rel=prev/next dans le head de vos pages.

Avec cette solution, les pages inutiles vont progressivement se désindexer de Google. L’utilisation du « nofollow » et des balises canoniques permet donc d’allouer plus de temps de crawl aux pages importantes du site.

Autres points à considérer

Le fil d’Ariane

Si vous n’avez pas de fil d’Ariane, il est urgent d’en mettre un en place surtout sur une boutique en ligne avec plusieurs milliers de pages. Cela permet d’indiquer à Google comment crawler vos pages. On n’oubliera pas bien entendu de le baliser en micro données.

Forcer l’ordre d’affichage des facettes

  • /outillage/electroportatif/tronconneuse?puissance=400w&longeur-guide=35cm/
  • /outillage/electroportatif/tronconneuse?longeur-guide=35cm&puissance=400w/

Selon l’ordre dans lequel l’internaute va cliquer sur les attributs, l’ordre des paramètres dans l’URL va changer. Le contenu affiché est identique. Cela va donc démultiplier le nombre d’URL et donc gaspiller encore plus sévèrement le temps de crawl. Afin d’éviter cela, il faudra alors forcer l’ordre des paramètres dans vos URL.

Conclusion

Voici donc quelques éléments qui pourront vous permettre de mieux organiser et contrôler la navigation à facettes de votre site. N’hésitez pas à m’indiquer en commentaires ce qui a marché pour vous, ou bien impacté négativement votre site.

Source :
Inspiré de cet article paru sur le blog Moz.com

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *