llms.txt – ein Standard für KI-lesbare Websites

Was der llms.txt-Standard ist, warum er existiert und wie du ihn nutzt, damit Sprachmodelle deine Inhalte zuverlässig verstehen.

Von Brian Beckmann 12. Mai 2026 aktualisiert 20. Mai 2026 1 Min. Lesezeit

llms.txt
KI
Web-Standards

Als Markdown anzeigen

Große Sprachmodelle (LLMs) konsumieren Websites zunehmend direkt – beim Training, in Retrieval-Pipelines und über agentische Browser. Klassisches HTML ist dafür suboptimal: Navigation, Werbung und Skripte verwässern den eigentlichen Inhalt. Der llms.txt-Standard löst dieses Problem.

Was ist llms.txt?

llms.txt ist eine Markdown-Datei im Wurzelverzeichnis einer Website. Sie gibt Sprachmodellen eine kuratierte, hierarchische Übersicht der wichtigsten Inhalte – vergleichbar mit robots.txt für Crawler oder sitemap.xml für Suchmaschinen, aber ausdrücklich für die maschinelle Lektüre durch LLMs gedacht.

Eine minimale llms.txt besteht aus:

Einem H1 mit dem Namen des Projekts.
Einem kurzen Blockquote als Zusammenfassung.
Optionalen Abschnitten mit Links zu Markdown-Versionen der Inhalte.

Warum nicht einfach HTML ausliefern?

Modelle verbrauchen Tokens. Jedes Navigationselement, jedes Tracking-Skript und jede CSS-Klasse kostet Kontextfenster und Rechenleistung. Markdown ist dichter, eindeutiger und enthält bereits die semantische Struktur, die ein Modell zur Gliederung braucht.

Faustregel: Wenn ein Mensch den Inhalt in einem Reader-Modus angenehm liest, liest ihn auch ein LLM gut.

Praktische Umsetzung

Dieser Blog stellt drei Dinge bereit:

/llms.txt – die kuratierte Übersicht aller Beiträge.
/llms-full.txt – der vollständige Volltext aller Beiträge in einer Datei.
/blog/<slug>.md – die rohe Markdown-Quelle jedes einzelnen Beitrags.

So kann ein Agent mit einem einzigen Request entweder einen Überblick oder den kompletten Korpus abrufen.