Le format de documents PDF est très fréquemment utilisé par bon nombre d’entreprises pour partager des informations ou des données via le web. C’est le cas des brochures commerciales, des guides d’utilisation ou modes d’emplois, des catalogues produits, des livres blancs. Si le référencement naturel des fichiers PDF n’est pas forcément entré dans les mœurs, autant se servir de cette manne pour accroître la visibilité de votre site sur internet. Comment faire pour améliorer l’indexation et le positionnement des documents PDF en ligne ? Voyons ensemble les points importants à respecter pour y arriver sans encombre.
Soigner le contenu textuel pour optimiser le référencement naturel d’un PDF
Le tout premier point pour permettre l’indexation d’un document PDF par Google et autres moteurs de recherche : qu’il soit basé sur du texte. Tout PDF généré via un logiciel image est voué à passer à la trappe.
Le contenu textuel de vos fichiers PDF doit ensuite suivre les mêmes règles de référencement SEO que le contenu textuel d’une page HTML. L’optimisation du texte est essentielle pour construire un référencement qualitatif autour de mots clefs ciblés. Votre contenu se doit d’être informatif, de qualité et unique.
Bien entendu, évitez toute sur-optimisation, qui vous conduirait à un référencement de mauvaise qualité.
Le contenu doit aussi être clairement structuré par l’utilisation de titre et sous-titres comportant les mots-clefs. Pour la première page, le titre doit être suivi d’un chapô, soit un paragraphe introductif expliquant ce titre et annonçant intelligiblement le contenu du document.
Autres conseils :
- utilisez des listes à puces,
- précisez le texte alternatif si vous illustrez le texte avec des images,
- évitez de disposer le texte sur deux ou trois colonnes en première page car il n’est pas certain que le robot d’indexation interprète correctement ce formatage.
Renseigner les métadonnées du document PDF
Les métadonnées d’un fichier PDF sont comparables aux balises métadonnées d’une page web. Via le logiciel de création du document (Fichier > Propriétés), ou un logiciel tiers d’édition, il est possible de renseigner ou modifier ces propriétés pour améliorer le référencement naturel des fichiers PDF :
- le titre du document : similaire à la balise Title d’une page internet, placez-y le mot-clé principal ; si cette propriété reste vide, un titre sera automatiquement généré en piochant aléatoirement dans le texte du document : il y a donc de fortes chances que celui-ci soit loin d’être au top ;
- le champ de mots clés est lu par le robot de Bing alors que le robot d’indexation de Google n’en tient pas compte : alimentez-le (car il se pourrait que ça change) avec votre mot-clé principal et vos mots-clés secondaires mais sans sur-optimiser ;
- le champ «Auteur » et «Sujet » ne sont à priori pas utilisés par les moteurs : cependant, les renseigner consciencieusement pourraient être un jour profitable (peut-être que le sujet deviendra l’équivalent de la meta-description).
Enfin, bien entendu, le nom du fichier PDF doit comporter le mot-clé principal car il sera lu par les moteurs de recherche.
Optimiser la taille et le poids des documents PDF
Saviez-vous que l’indexation des fichiers PDF de très grande taille peut être abandonnée en cours de route par le robot Google ? De plus, le délai important de téléchargement peut être un frein ou une source d’ennui pour les utilisateurs.
Ce sont des excellentes raisons pour mettre en œuvre une politique de découpe de vos documents qui servira le référencement naturel des fichiers PDF de votre site :
- réduire la taille d’un fichier en le découpant permet d’intégrer des mots-clés plus spécifiques dans le nom de fichier et le titre du document ; par exemple, un catalogue produits peut être scindé en sous-catalogue par gamme ;
- réduire le poids du fichier permet d’accroître la satisfaction client en passant simplement par un outil de compression de document en ligne.
Soigner les liens pour optimiser le SEO des PDF
Prenez bien soin d’optimiser les liens hypertextes :
- qui dirigent vos visiteurs vers vos fichiers PDF dans vos pages web,
- présents dans les fichiers PDF et qui dirigent le lecteur vers votre site ; les PDF pouvant être échangés par mail ou autre biais, c’est très utile pour augmenter le trafic organique.
Comme usuellement, insérez des mots clés pertinents dans l’ancre de tous ces liens.
Comme pour une page web classique que vous souhaitez propulser, vous avez tout loisir de faire du netlinking en obtenant des liens entrants ou backlinks de qualité pour un document PDF important. Cherchez principalement des liens de sites faisant autorité dans le domaine.
Gérer le risque d’être classé en contenu dupliqué
Si vous reprenez dans un document PDF un contenu identique ou très proche de celui d’une page publiée sur votre site internet, le risque que les moteurs de recherche le classe comme contenu dupliqué (duplicate content) est réel. Voilà qui serait dommage car il ne serait pas indexé !
La solution est simple. Il suffit de leur préciser quelle est la version originale, dite version canonique, du texte. Cela se fait soit :
- dans le fichier sitemap.xml de votre site : toute URL trouvée ici est considérée comme canonique ;
- renseigner la balise <link rel= »canonical » … /> dans la section <head></head> de la page web où se trouve le texte original, en faisant référence à elle-même ;
exemple : <link rel= »canonical » href= »https://www.monsiteinternet.fr/mapage/ » />
Astuce : veillez bien à utiliser des URL absolues et non relatives.
Vous avez maintenant en mains plusieurs clés pour optimiser le référencement naturel d’un PDF. Pour un référencement encore plus poussé de vos fichiers PDF, vous pouvez faire appel à un professionnel du SEO. La concurrence sur le net est féroce : ne négligez aucune piste pour améliorer votre positionnement sur Google !