Beckmann AI

llms.txt – ein Standard für KI-lesbare Websites

Was der llms.txt-Standard ist, warum er existiert und wie du ihn nutzt, damit Sprachmodelle deine Inhalte zuverlässig verstehen.

Von Brian Beckmann aktualisiert 1 Min. Lesezeit
  • llms.txt
  • KI
  • Web-Standards

Große Sprachmodelle (LLMs) konsumieren Websites zunehmend direkt – beim Training, in Retrieval-Pipelines und über agentische Browser. Klassisches HTML ist dafür suboptimal: Navigation, Werbung und Skripte verwässern den eigentlichen Inhalt. Der llms.txt-Standard löst dieses Problem.

Was ist llms.txt?

llms.txt ist eine Markdown-Datei im Wurzelverzeichnis einer Website. Sie gibt Sprachmodellen eine kuratierte, hierarchische Übersicht der wichtigsten Inhalte – vergleichbar mit robots.txt für Crawler oder sitemap.xml für Suchmaschinen, aber ausdrücklich für die maschinelle Lektüre durch LLMs gedacht.

Eine minimale llms.txt besteht aus:

  1. Einem H1 mit dem Namen des Projekts.
  2. Einem kurzen Blockquote als Zusammenfassung.
  3. Optionalen Abschnitten mit Links zu Markdown-Versionen der Inhalte.

Warum nicht einfach HTML ausliefern?

Modelle verbrauchen Tokens. Jedes Navigationselement, jedes Tracking-Skript und jede CSS-Klasse kostet Kontextfenster und Rechenleistung. Markdown ist dichter, eindeutiger und enthält bereits die semantische Struktur, die ein Modell zur Gliederung braucht.

Faustregel: Wenn ein Mensch den Inhalt in einem Reader-Modus angenehm liest, liest ihn auch ein LLM gut.

Praktische Umsetzung

Dieser Blog stellt drei Dinge bereit:

So kann ein Agent mit einem einzigen Request entweder einen Überblick oder den kompletten Korpus abrufen.