Comment supporter le multilinguisme sur un blog Jekyll avec Polyglot (1) - Application du plugin Polyglot & implémentation des balises hreflang alt, du sitemap et du bouton de sélection de langue
Présentation du processus d'implémentation du support multilingue en appliquant le plugin Polyglot à un blog Jekyll basé sur 'jekyll-theme-chirpy'. Ce post est le premier article de la série, couvrant l'application du plugin Polyglot et la modification de l'en-tête html et du sitemap.
Aperçu
Il y a environ 4 mois, début juillet 2024, j’ai ajouté le support multilingue à ce blog hébergé via Github Pages basé sur Jekyll en appliquant le plugin Polyglot. Cette série partage les bugs rencontrés lors de l’application du plugin Polyglot au thème Chirpy, leur processus de résolution, ainsi que la méthode pour écrire l’en-tête html et le sitemap.xml en tenant compte du SEO. La série se compose de deux articles, et celui que vous lisez est le premier de la série.
- Partie 1 : Application du plugin Polyglot & implémentation des balises hreflang alt, du sitemap et du bouton de sélection de langue (cet article)
- Partie 2 : Dépannage de l’échec de construction du thème Chirpy et des erreurs de fonction de recherche
Exigences
- Le résultat de la construction (page web) doit pouvoir être fourni en distinguant les chemins par langue (ex.
/posts/ko/
,/posts/ja/
). - Afin de minimiser le temps et l’effort supplémentaires nécessaires pour le support multilingue, la langue doit pouvoir être automatiquement reconnue lors de la construction en fonction du chemin local où se trouve le fichier original markdown (ex.
/_posts/ko/
,/_posts/ja/
), sans avoir à spécifier manuellement les balises ‘lang’ et ‘permalink’ dans le YAML front matter du fichier markdown original. - La partie en-tête de chaque page du site doit inclure des balises méta Content-Language appropriées et des balises alternatives hreflang pour répondre aux directives SEO de Google pour la recherche multilingue.
- Le
sitemap.xml
doit pouvoir fournir tous les liens de pages supportant chaque langue sur le site sans omission, et lesitemap.xml
lui-même ne doit exister qu’une seule fois dans le chemin racine sans duplication. - Toutes les fonctionnalités fournies par le thème Chirpy doivent fonctionner normalement sur chaque page de langue, et si ce n’est pas le cas, elles doivent être modifiées pour fonctionner correctement.
- Fonctionnement normal des fonctions ‘Recently Updated’, ‘Trending Tags’
- Pas d’erreur lors du processus de construction utilisant GitHub Actions
- Fonctionnement normal de la fonction de recherche de posts en haut à droite du blog
Application du plugin Polyglot
Comme Jekyll ne prend pas en charge nativement les blogs multilingues, un plugin externe doit être utilisé pour implémenter un blog multilingue répondant aux exigences ci-dessus. Après recherche, j’ai constaté que Polyglot est largement utilisé pour l’implémentation de sites web multilingues et peut satisfaire la plupart des exigences ci-dessus, j’ai donc adopté ce plugin.
Installation du plugin
Comme j’utilise Bundler, j’ai ajouté le contenu suivant à Gemfile
.
1
2
3
group :jekyll_plugins do
gem "jekyll-polyglot"
end
Ensuite, exécuter bundle update
dans le terminal terminera automatiquement l’installation.
Si vous n’utilisez pas Bundler, vous pouvez installer directement la gem avec la commande gem install jekyll-polyglot
dans le terminal, puis ajouter le plugin à _config.yml
comme suit :
1
2
plugins:
- jekyll-polyglot
Configuration
Ensuite, ouvrez le fichier _config.yml
et ajoutez le contenu suivant :
1
2
3
4
5
6
# Polyglot Settings
languages: ["en", "ko", "es", "pt-BR", "ja", "fr", "de"]
default_lang: "en"
exclude_from_localization: ["javascript", "images", "css", "public", "assets", "sitemap"]
parallel_localization: false
lang_from_path: true
- languages : Liste des langues à prendre en charge
- default_lang : Langue de repli par défaut
- exclude_from_localization : Spécifie les expressions régulières des chemins de fichiers/dossiers racine à exclure de la localisation
- parallel_localization : Valeur booléenne indiquant s’il faut paralléliser le traitement multilingue lors de la construction
- lang_from_path : Valeur booléenne, si définie sur ‘true’, reconnaît et utilise automatiquement le code de langue inclus dans la chaîne de chemin du fichier markdown, même si l’attribut ‘lang’ n’est pas spécifié explicitement dans le YAML front matter du fichier markdown
La documentation officielle du protocole Sitemap stipule ce qui suit :
“L’emplacement d’un fichier Sitemap détermine l’ensemble des URL qui peuvent être incluses dans ce Sitemap. Un fichier Sitemap situé à http://example.com/catalog/sitemap.xml peut inclure toutes les URL commençant par http://example.com/catalog/ mais ne peut pas inclure les URL commençant par http://example.com/images/.”
“Il est fortement recommandé de placer votre Sitemap dans le répertoire racine de votre serveur web.”
Pour se conformer à cela, il faut ajouter ‘sitemap.xml’ à la liste ‘exclude_from_localization’ pour s’assurer qu’un seul fichier
sitemap.xml
existe dans le répertoire racine, et non des fichierssitemap.xml
avec le même contenu créés pour chaque langue, comme dans le mauvais exemple ci-dessous.Mauvais exemple (le contenu de chaque fichier n’est pas différent par langue, tous sont identiques) :
/sitemap.xml
/ko/sitemap.xml
/es/sitemap.xml
/pt-BR/sitemap.xml
/ja/sitemap.xml
/fr/sitemap.xml
/de/sitemap.xml
Définir ‘parallel_localization’ sur ‘true’ présente l’avantage de réduire considérablement le temps de construction, mais en juillet 2024, lorsque cette fonctionnalité était activée pour ce blog, il y avait un bug où les titres des liens ‘Recently Updated’ et ‘Trending Tags’ dans la barre latérale droite de la page n’étaient pas traités correctement et étaient mélangés avec d’autres langues. Cela semble encore instable, donc il est nécessaire de tester préalablement son bon fonctionnement avant de l’appliquer au site. De plus, cette fonctionnalité n’est pas prise en charge sous Windows et doit être désactivée.
De plus, dans Jekyll 4.0, il faut désactiver la génération de sourcemaps CSS comme suit.
1
2
sass:
sourcemap: never # Dans Jekyll 4.0, les sourcemaps SCSS seront générées incorrectement en raison du fonctionnement de Polyglot
Points à noter lors de la rédaction de posts
Voici les points à noter lors de la rédaction de posts multilingues :
- Spécification du code de langue approprié : Il faut spécifier le code de langue ISO approprié en utilisant soit le chemin du fichier (ex.
/_posts/ko/example-post.md
) soit l’attribut ‘lang’ dans le YAML front matter (ex.lang: ko
). Référez-vous aux exemples de la documentation pour développeurs Chrome.
Cependant, bien que la documentation pour développeurs Chrome utilise un format comme ‘pt_BR’ pour les codes régionaux, il faut en réalité utiliser ‘pt-BR’ avec un tiret (-) au lieu d’un underscore (_) pour que cela fonctionne correctement lors de l’ajout ultérieur de balises alternatives hreflang dans l’en-tête html.
- Les chemins et noms de fichiers doivent être cohérents.
Pour plus de détails, veuillez consulter le README du dépôt GitHub untra/polyglot.
Modification de l’en-tête html et du sitemap
Maintenant, il faut insérer les balises méta Content-Language et les balises alternatives hreflang dans l’en-tête html de chaque page du blog pour le SEO.
En-tête html
Dans la version 1.8.1, la plus récente en novembre 2024, Polyglot dispose d’une fonctionnalité qui effectue automatiquement cette tâche lorsque la balise Liquid {% I18n_Headers %}
est appelée dans la partie en-tête de la page. Cependant, cela suppose que l’attribut ‘permalink’ a été spécifié explicitement pour cette page, et ne fonctionne pas correctement si ce n’est pas le cas.
J’ai donc récupéré le head.html du thème Chirpy et y ai directement ajouté le contenu suivant. J’ai travaillé en me référant à la page SEO Recipes du blog officiel de Polyglot, mais j’ai modifié pour utiliser l’attribut page.url
à la place si page.permalink
n’existe pas. De plus, en me référant à la documentation officielle de Google Search Central, j’ai spécifié x-default
au lieu de site.default_lang
comme valeur d’attribut hreflang pour la page de langue par défaut du site, afin que le lien de cette page soit reconnu comme fallback si la langue préférée du visiteur n’est pas dans la liste des langues prises en charge par le site ou si la langue préférée du visiteur ne peut pas être reconnue.
1
2
3
4
5
6
<meta http-equiv="Content-Language" content="{{site.active_lang}}">
{% if site.default_lang %}<link rel="alternate" hreflang="x-default" href="{{site.url}}{{page.url}}" />{% endif %}
{% for lang in site.languages %}{% if lang == site.default_lang %}{% continue %}{% endif %}
<link rel="alternate" hreflang="{{lang}}" href="{{site.url}}/{{lang}}{{page.url}}" />
{% endfor %}
Sitemap
Comme le sitemap généré automatiquement par Jekyll lors de la construction ne prend pas correctement en charge les pages multilingues, créez un fichier sitemap.xml
dans le répertoire racine et entrez le contenu suivant :
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
---
layout: content
---
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9" xmlns:xhtml="http://www.w3.org/1999/xhtml">
{% for lang in site.languages %}
{% for node in site.pages %}
{% comment %}<!-- vérification très paresseuse pour voir si la page est dans la liste d'exclusion - cela signifie que les pages exclues ne seront pas du tout dans le sitemap, écrivez des exceptions si nécessaire -->{% endcomment %}
{% unless site.exclude_from_localization contains node.path %}
{% comment %}<!-- en supposant que s'il n'y a pas de mise en page attribuée, alors n'incluez pas la page dans le sitemap, vous voudrez peut-être changer cela -->{% endcomment %}
{% if node.layout %}
<url>
<loc>{% if lang == site.default_lang %}{{ node.url | absolute_url }}{% else %}{{ node.url | prepend: lang | prepend: '/' | absolute_url }}{% endif %}</loc>
{% if node.last_modified_at and node.last_modified_at != node.date %}<lastmod>{{ node.last_modified_at | date: '%Y-%m-%dT%H:%M:%S%:z' }}</lastmod>{% elsif node.date %}<lastmod>{{ node.date | date: '%Y-%m-%dT%H:%M:%S%:z' }}</lastmod>{% endif %}
</url>
{% endif %}
{% endunless %}
{% endfor %}
{% comment %}<!-- Ceci parcourt toutes les collections du site, y compris les posts -->{% endcomment %}
{% for collection in site.collections %}
{% for node in site[collection.label] %}
<url>
<loc>{% if lang == site.default_lang %}{{ node.url | absolute_url }}{% else %}{{ node.url | prepend: lang | prepend: '/' | absolute_url }}{% endif %}</loc>
{% if node.last_modified_at and node.last_modified_at != node.date %}<lastmod>{{ node.last_modified_at | date: '%Y-%m-%dT%H:%M:%S%:z' }}</lastmod>{% elsif node.date %}<lastmod>{{ node.date | date: '%Y-%m-%dT%H:%M:%S%:z' }}</lastmod>{% endif %}
</url>
{% endfor %}
{% endfor %}
{% endfor %}
</urlset>
Ajout d’un bouton de sélection de langue dans la barre latérale
J’ai créé un fichier _includes/lang-selector.html
et y ai entré le contenu suivant :
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
<p>
{%- for lang in site.languages -%}
{%- if lang == site.default_lang -%}
<a ferh="{{ page.url }}" style="display:inline-block; white-space:nowrap;">
{%- if lang == site.active_lang -%}
<b>{{ lang }}</b>
{%- else -%}
{{ lang }}
{%- endif -%}
</a>
{%- else -%}
<a href="/{{ lang }}{{ page.url }}" style="display:inline-block; white-space:nowrap;">
{%- if lang == site.active_lang -%}
<b>{{ lang }}</b>
{%- else -%}
{{ lang }}
{%- endif -%}
</a>
{%- endif -%}
{%- endfor -%}
</p>
Ensuite, j’ai ajouté les trois lignes suivantes à la partie de classe “sidebar-bottom” du _includes/sidebar.html
du thème Chirpy pour que Jekyll charge le contenu de _includes/lang-selector.html
lors de la construction de la page :
1
2
3
<div class="lang-selector">
{%- include lang-selector.html -%}
</div>
Pour aller plus loin
Suite dans la Partie 2