llms.txt – ein Standard für KI-lesbare Websites
Was der llms.txt-Standard ist, warum er existiert und wie du ihn nutzt, damit Sprachmodelle deine Inhalte zuverlässig verstehen.
- llms.txt
- KI
- Web-Standards
Große Sprachmodelle (LLMs) konsumieren Websites zunehmend direkt – beim Training, in Retrieval-Pipelines und über agentische Browser. Klassisches HTML ist dafür suboptimal: Navigation, Werbung und Skripte verwässern den eigentlichen Inhalt. Der llms.txt-Standard löst dieses Problem.
Was ist llms.txt?
llms.txt ist eine Markdown-Datei im Wurzelverzeichnis einer Website. Sie
gibt Sprachmodellen eine kuratierte, hierarchische Übersicht der wichtigsten
Inhalte – vergleichbar mit robots.txt für Crawler oder sitemap.xml für
Suchmaschinen, aber ausdrücklich für die maschinelle Lektüre durch LLMs
gedacht.
Eine minimale llms.txt besteht aus:
- Einem H1 mit dem Namen des Projekts.
- Einem kurzen Blockquote als Zusammenfassung.
- Optionalen Abschnitten mit Links zu Markdown-Versionen der Inhalte.
Warum nicht einfach HTML ausliefern?
Modelle verbrauchen Tokens. Jedes Navigationselement, jedes Tracking-Skript und jede CSS-Klasse kostet Kontextfenster und Rechenleistung. Markdown ist dichter, eindeutiger und enthält bereits die semantische Struktur, die ein Modell zur Gliederung braucht.
Faustregel: Wenn ein Mensch den Inhalt in einem Reader-Modus angenehm liest, liest ihn auch ein LLM gut.
Praktische Umsetzung
Dieser Blog stellt drei Dinge bereit:
/llms.txt– die kuratierte Übersicht aller Beiträge./llms-full.txt– der vollständige Volltext aller Beiträge in einer Datei./blog/<slug>.md– die rohe Markdown-Quelle jedes einzelnen Beitrags.
So kann ein Agent mit einem einzigen Request entweder einen Überblick oder den kompletten Korpus abrufen.