Format llms.txt — référence complète
Référence complète du format llms.txt : les 4 règles fondamentales, exemples annotés, syntaxe des liens, section Optional, checklist et erreurs courantes.
Dernière mise à jour:
Aperçu du format
llms.txt est un fichier texte brut en CommonMark Markdown placé à la racine d’un domaine (https://example.com/llms.txt). Il sert de carte curée pour les modèles de langage IA — analogue au robots.txt
pour les crawlers, mais centré sur ce qu’il faut lire, pas sur ce qu’il
faut éviter.
Les assistants IA, pipelines RAG et agents de recherche utilisent ce fichier pour comprendre
rapidement ce qu’un site propose et quelles URL contiennent la documentation de référence.
Un llms.txt bien structuré est bien plus utile que de laisser un modèle crawler des pages
arbitraires.
Les 4 règles fondamentales
- Un seul H1 en tête — la première ligne doit être un H1 (
# Nom du site). Un seul H1, en tout premier, avant tout autre contenu. - Un blockquote immédiatement après — juste après le H1, un résumé factuel en une
ou deux phrases (
> description). Pas de marketing, pas de mots-clés — une description utile pour un LLM. - Sections en H2 — les rubriques suivantes sont des H2 (
##: Produit, Docs, Intégrations…). Pas de H1 supplémentaire. - Liens en liste avec note — chaque lien suit le format :
- [Titre](https://url-absolue): courte note.Les URL doivent être absolues (https://).
# Nom de votre projet
> Une phrase décrivant ce que fait votre projet et à qui il s'adresse.
## Documentation
- [Démarrage rapide](https://example.com/docs/demarrage): Installation et premiers pas.
- [Référence API](https://example.com/api): Catalogue complet des endpoints.
## Optional
- [Changelog](https://example.com/changelog): Historique des versions.
Exemple annoté complet
Un SaaS ou une plateforme développeur veut généralement une structure plus complète avec
plusieurs sections et une section Optional dédiée :
# Acme SaaS
> Acme SaaS aide les équipes à automatiser leurs workflows de facturation grâce
> à un tableau de bord sans code et une API REST compatible avec 40+ prestataires.
## Produit
- [Présentation](https://acme.com/product): Capacités clés et cas d'usage.
- [Tarifs](https://acme.com/pricing): Plans, limites et options entreprise.
- [Statut](https://status.acme.com/): Disponibilité et historique des incidents.
## Documentation
- [Démarrage rapide](https://acme.com/docs/quickstart): Configuration en moins de 5 minutes.
- [Référence API](https://acme.com/docs/api): Endpoints REST, auth, rate limits.
- [SDK](https://acme.com/docs/sdks): Clients Node, Python, Ruby, Go.
- [Webhooks](https://acme.com/docs/webhooks): Payloads d'événements et politique de retry.
## Exemples
- [Intégration Node.js](https://acme.com/examples/node): Flux de paiement complet.
- [Intégration Python](https://acme.com/examples/python): Gestion des abonnements.
## Optional
- [Changelog](https://acme.com/changelog): Historique des versions.
- [Blog](https://acme.com/blog): Mises à jour produit et tutoriels.
- [GitHub](https://github.com/acme/acme-oss): Composants open source.
Sections optionnelles
Les sections sont des H2 (##) suivis de listes non ordonnées de liens Markdown.
Noms de sections courants :
- Documentation — docs principales, guides, références.
- Produit — pages marketing, tarifs, statut.
- Exemples — extraits de code, tutoriels, démos.
- Intégrations — partenaires et SDK, une ligne chacun.
- API — section dédiée à la référence API.
- Optional — changelog, blog, GitHub — priorité basse pour l’IA.
Syntaxe des liens
Chaque lien suit la syntaxe Markdown : - [Titre](URL): description courte.
-
Utilisez des URL absolues avec le schéma (
https://). - La description après les deux-points est du texte brut — gardez-la sous ~120 caractères et rendez-la informative pour un LLM, pas bourrée de mots-clés.
- Un lien par item de liste — pas de puces imbriquées.
- Préférez les URL canoniques (avec slash final si c’est votre convention).
La section ##Optional
La section nommée Optional a une signification particulière dans la spec : les systèmes IA peuvent ignorer les liens qu’elle contient quand le contexte est contraint. Utilisez-la pour les liens utiles mais non essentiels : changelog, blog, assets de marque, communiqués de presse.
Ne mettez pas votre documentation principale dans Optional — elle risque d’être
ignorée par les parseurs IA les plus conservateurs.
Checklist
- Fichier servi à
/llms.txt(chemin racine, pas un sous-répertoire) Content-Type: text/plain; charset=utf-8- Commence par exactement un H1
- Blockquote résumé sur la ligne immédiatement après le H1
- Toutes les URL sont absolues (
https://) - Chaque lien a une description concise après les deux-points
- Fichier sous 20 Ko
- Aucune balise HTML, aucune liste imbriquée
- Validé avec le validateur llms.txt
Erreurs courantes
- URL relatives —
- [Docs](/docs)ne se résoudra pas correctement quand le fichier est récupéré par un crawler IA. Utilisez toujours des URL absolues. - Blockquote manquant — sauter le
> résumérend le fichier plus difficile à parser et non conforme à la spec. - Content-Type incorrect — servir avec
text/htmlou sans content-type fait rejeter le fichier par certains parseurs. - Bourrage de mots-clés dans les descriptions — les LLM lisent ces descriptions littéralement. Le bourrage de mots-clés dégrade la qualité du signal.
- Lister toutes les pages — curez vos 10 à 30 liens les plus importants. Le sitemap
exhaustif va dans
llms-full.txt, pas dans l’index.
Guides associés
- Comment créer llms.txt — pas à pas pour chaque stack.
- Format reference (EN) — version anglaise de cette page.
- Validateur — vérifiez la conformité de votre fichier.
- Générateur — créez un fichier depuis un formulaire.
- Bonnes pratiques — ce qu’il faut inclure et éviter.