HTML gegen Markdown für KI-Agenten, und wo Google OKF hineinpasst (2026) | WPPoland

Mariusz Szatkowski

DE

Inhalte für KI-Agenten ausliefern: HTML gegen Markdown, und wo OKF tatsächlich hineinpasst

Zuletzt überprüft: 1. Juli 2026

12 Min. Lesezeit

Meinung

PageSpeed 100/100

Wichtige Fakten : Inhalte für KI-Agenten ausliefern (HTML gegen Markdown gegen OKF)

1Im Juni 2026 vermischt die Praktikerdebatte über die Auslieferung von Inhalten an KI-Agenten drei verschiedene Schichten, Markdown als Agenten-Ausgabe, Markdown-for-Agents als Seitenauslieferung und das Open Knowledge Format als Wissensschicht.
2Der Anthropic-Ingenieur Thariq Shihipar gab Markdown öffentlich zugunsten von HTML für die Agenten-Ausgabe auf, weil HTML eine reichere Struktur für die menschenseitige Darstellung trägt.
3Googles John Mueller nannte das Umwandeln von Seiten in Markdown für Crawler "a stupid idea", und Bings Fabrice Canel sagte, Bing werde das HTML ohnehin crawlen, um die Ähnlichkeit zu prüfen.
4Cloudflares Markdown-for-Agents wandelt HTML zur Laufzeit über den Header Accept text/markdown in Markdown um, meldet rund 80 Prozent Token-Reduktion und ist über Content-Signal standardmäßig opt-in aktiviert.
5Google Cloud veröffentlichte das Open Knowledge Format am 12. Juni 2026, Markdown-Dateien mit YAML-Frontmatter, ein Konzept pro Datei, nur das Feld type ist erforderlich.
6Sauberes, serverseitig gerendertes, semantisches HTML plus Schema.org ist das einzige Auslieferungssignal, das sowohl Google als auch Bing als konsumiert dokumentieren.
7Die zukunftsgerichtete Wette ist die Agenten-Aktionsschicht, WebMCP, A2A und MCP, bei der ein Agent eine Funktion aufruft, statt eine Seite zu scrapen.

Zuletzt aktualisiert: 2026-06-21

#Einleitung

Im Juni 2026 kehrt dieselbe Frage in Engineering-Timelines und SEO-Kanälen immer wieder zurück: Wie sollten Sie Ihre Inhalte an KI-Agenten ausliefern? Reines Markdown, weil Modelle das offenbar mögen? Ein separater Maschinen-Endpunkt? Ein neues Wissensformat? Die Diskussion ist laut, sie ist meinungsstark, und das meiste daran redet aneinander vorbei.

Hier die Praktikerposition vorab, denn wir haben in dieser Sache etwas zu verlieren. Wir liefern bereits sauberes, semantisches, serverseitig gerendertes HTML plus Schema.org aus einem Astro-Frontend auf Cloudflare aus. Diese Debatte bestätigt diese Wahl. Sie bedroht sie nicht. Fast jedes “Sie müssen für Agenten auf Markdown umsteigen”-Argument bricht in dem Moment zusammen, in dem Sie drei Schichten trennen, die ständig zu einer zusammengeknetet werden.

Das ist kein Kommentar von der Seitenlinie. Im deutschsprachigen Raum, wo Datenschutz und sauberer Betrieb für viele Kunden zuerst kommen, betreiben wir genau die Infrastruktur, um die es in der Debatte geht, und wir betreiben bereits die Agentenschicht, auf die die Debatte als die eigentliche Zukunft verweist. Das ist also ein Bericht von innen, kein Nacherzählen von den billigen Plätzen.

#Die wichtigsten Erkenntnisse auf einen Blick

Das Argument vermischt drei Schichten, die nicht dasselbe Problem sind: Markdown als Agenten-Ausgabe, Markdown als Weg zur Seitenauslieferung und OKF als Wissensschicht.
Markdown als Agenten-Ausgabe ist eine Maschine-zu-Mensch-Darstellungsentscheidung, und einer der Menschen, die es am stärksten vorantrieben, hat es gerade zugunsten von HTML aufgegeben.
Bots an derselben URL Markdown auszuliefern, an der Menschen HTML bekommen, ist bestenfalls redundant und schlimmstenfalls Cloaking. Google und Bing sagten beide genau das, unverblümt.
OKF ist ein kuratiertes Wissensformat für Agenten-Pipelines, kein Website-Auslieferungsformat. Es ist eine andere Schicht als SEO.
Das einzige Auslieferungssignal, das sowohl Google als auch Bing als tatsächlich konsumiert dokumentieren, ist sauberes semantisches HTML plus Schema.
Beobachten Sie die neuen Auslieferungsformate, aber stürzen Sie sich nicht auf die Implementierung. Die echte Zukunftswette ist die Agenten-Aktionsschicht, und genau diesen Teil haben wir bereits gebaut.

#Drei Schichten, die alle vermischen

Der meiste Streit in dieser Debatte entsteht, weil drei getrennte Fragen als eine behandelt werden. Trennen Sie sie auf, und die Widersprüche lösen sich auf.

#Schicht 1: Markdown als Agenten-Ausgabe

Hier geht es darum, was ein Modell an einen Menschen zurückschreibt, nicht darum, wie eine Website ausgeliefert wird. Wenn ein Agent einen Bericht, eine Chat-Antwort oder ein Dokument erzeugt, in welchem Format sollte er es ausgeben?

Lange Zeit war die Standardantwort Markdown. Es ist sauber, es ist token-günstig, es rendert hübsch in einer Chat-Blase. Dann ruderte Thariq Shihipar, der bei Anthropic an Claude Code arbeitet, öffentlich zurück. Nachdem er parallele Beispiele zum Vergleich von HTML- und Markdown-Effektivität gebaut hatte, lautete seine Schlussfolgerung, dass HTML für die Agenten-Ausgabe gewinnt, weil HTML die Struktur, Semantik und Interaktivität trägt, die eine reichere menschenseitige Oberfläche braucht. Markdown nivelliert zu viel weg.

Lesen Sie das genau, denn es wird routinemäßig falsch zitiert. Die Person, die der Agenten-Ausgabe am nächsten steht, bewegt sich auf HTML zu, nicht davon weg. Und entscheidend ist, dass diese Schicht nichts darüber sagt, wie Sie Ihre Marketing-Website an einen Crawler ausliefern sollten. Es ist Maschine-zu-Mensch-Kommunikation. Wer Thariq als Grund anführt, Ihre Seite in Markdown umzuwandeln, hat sein eigenes Argument umgekehrt.

#Schicht 2: Markdown-for-Agents als Seitenauslieferung

Das ist die Schicht, die uns tatsächlich betrifft, weil wir auf Cloudflare laufen. Cloudflares Markdown-for-Agents wandelt Ihr HTML zur Laufzeit in Markdown um, wenn ein Client Accept: text/markdown sendet, bewirbt eine Token-Zahl über x-markdown-tokens und meldet rund 80 Prozent Token-Reduktion gegenüber rohem HTML. Es ist in der Beta auf bezahlten Plänen, und Clients wie Claude Code und OpenCode senden den Header bereits. Es wird durch Content-Signal gesteuert, das auf Cloudflare standardmäßig opt-in ist, sodass dies ohne bewusste Entscheidung für Ihre Domain aktiv sein kann. Genau dieses Standard-aktiv-Detail sollte jeder Cloudflare-Kunde tatsächlich prüfen.

Die Token-Ersparnis ist real. Der Sichtbarkeitsanspruch ist es nicht. Es gibt keinen dokumentierten Beleg dafür, dass das Ausliefern einer Markdown-Darstellung ändert, ob ein KI-System Sie zitiert. Und in dem Moment, in dem Sie Bots eine andere Darstellung derselben URL ausliefern als Menschen erhalten, stehen Sie direkt an der Cloaking-Linie.

Googles John Mueller formulierte es ganz ohne Diplomatie:

“Converting pages to markdown is such a stupid idea. Did you know LLMs can read images? WHY NOT TURN YOUR WHOLE SITE INTO AN IMAGE?”

Das ist Sarkasmus mit einem Kern darin. Wenn das Modell Ihr HTML ohnehin schon lesen kann, ist ein paralleler Markdown-Kanal kein neues Signal, sondern eine zweite Sache, die man pflegen und synchron halten muss. Bings Fabrice Canel war trockener und für alle, die Crawl-Budget sparen wollen, wohl noch vernichtender:

“Really want to double crawl load? We’ll crawl anyway to check similarity.”

Mit anderen Worten: Die Suchmaschine holt das HTML ohnehin, um zu prüfen, dass Ihr Markdown mit dem übereinstimmt, was Menschen sehen. Sie reduzieren die Last nicht, Sie fügen eine Oberfläche hinzu, die mit der kanonischen übereinstimmen muss, sonst werden Sie markiert. Zwei der größten Crawl-Betreiber des Planeten haben Ihnen öffentlich gesagt, dass das nicht tut, was seine Befürworter erhoffen.

#Schicht 3: OKF als Wissensschicht

Am 12. Juni 2026 veröffentlichte Google Cloud das Open Knowledge Format, OKF, mit einem öffentlichen Referenz-Repository. Es ist bewusst bescheiden: Markdown-Dateien mit YAML-Frontmatter, ein Konzept pro Datei, nur das Feld type erforderlich, Produzent und Konsument bleiben unabhängig. Der Rahmen lautet “ein Format, keine Plattform”, und es schuldet offensichtlich Andrej Karpathys LLM-Wiki-Gist etwas, der Idee einer menschlich kuratierten Wissensbasis, die für Maschinen geschrieben ist.

Hier ist, was zählt und was die Zusammenfassungen übersehen: OKF ist kein Weg, Ihre Website auszuliefern. Es ist ein Weg, kuratiertes Wissen so zu paketieren, dass eine Agenten-Pipeline es konsumieren kann. Es lebt vor dem Retrieval, in der Kontext- und Grounding-Schicht, nicht an der URL, an der ein Crawler auf Ihre Seite trifft. Wie Adam Rogala in einem LinkedIn-Kommentar zur Ankündigung treffend bemerkte, ergibt OKF durchaus Sinn, aber auf einer anderen Schicht als SEO. “Google hat ein Markdown-Wissensformat veröffentlicht” mit “Google will, dass Sie Ihre Seite als Markdown ausliefern” gleichzusetzen, ist der mit Abstand häufigste Fehler im aktuellen Zyklus, und beides ist nicht einmal annähernd dasselbe.

Es gibt eine vernünftige Variante von Markdown in einem Publishing-Stack, und sie ist es wert, benannt zu werden, damit niemand das als markdownfeindlich versteht. Markdown in Ihrem Quellcode, zur Build-Zeit in HTML gerendert, ist genau die Art, wie dieser Artikel geschrieben ist. Das ist der richtige Ort dafür. Rohes Markdown an einen Browser oder an einen Crawler auszuliefern, der HTML erwartet, ist der Teil, der keinen Sinn ergibt. Wie Bartosz Łaszczewski in derselben Diskussion betonte, ist der Konsument am anderen Ende um HTML herum gebaut, und rohes Markdown an einen Browser zu schicken läuft dem zuwider.

#Warum diese Debatte unseren Stack bestätigt

Trennen Sie die drei Schichten auf, und die Schlussfolgerung ist fast langweilig, und das ist der Punkt. Das, was bereits funktioniert, funktioniert weiter.

Wir liefern serverseitig gerendertes, semantisches HTML aus. Überschriften sind Überschriften, Listen sind Listen, article, nav und time bedeuten, was sie sagen, und die strukturierten Daten sind echtes Schema.org statt Dekoration. Das ist die Darstellung, die Google indexiert, die Darstellung, die Bing crawlt, und die Darstellung, die ein LLM aufnimmt, wenn es die Seite abruft. Es ist außerdem, nicht zufällig, die Darstellung, die für Menschen schnell rendert. Es gibt keine Abzweigung, die synchron gehalten werden muss, keinen zweiten Kanal, der abdriften kann, kein Cloaking-Risiko.

Alles, worüber die Debatte sich sorgt, bekommen wir gratis, indem wir es nicht jagen. Wenn Mueller sagt, Markdown-Konvertierung sei sinnlos, weil das Modell Ihr HTML liest, ist das eine Beschreibung unseres Setups, das wie beabsichtigt arbeitet. Wenn Canel sagt, Bing crawle das HTML ohnehin, ist das in Ordnung, denn das HTML ist das kanonische Artefakt, und es gibt nichts anderes abzugleichen. Wir mussten auf keine der beiden Aussagen reagieren. Die Architektur hatte sie bereits beantwortet.

#Das eine dokumentierte Signal

Wenn Sie eine Regel wollen, die die nächste Formatankündigung überlebt, hier ist sie. Sauberes, serverseitig gerendertes, semantisches HTML mit gültigem Schema.org ist der einzige Auslieferungsansatz, den sowohl Google als auch Bing als etwas dokumentieren, das sie tatsächlich konsumieren. Alles andere in diesem Bereich ist entweder ein Vorschlag ohne gemessenen Konsum oder eine Optimierung der Kosten statt der Sichtbarkeit.

Bing liest über Copilot strukturierte Daten. Google liest strukturierte Daten für seine eigenen Oberflächen. Die großen Sprachmodelle nehmen das gerenderte HTML auf. Keines der neuen Auslieferungsformate, llms.txt, Markdown-for-Agents, ai.txt, hat eine dokumentierte Wirkung darauf, ob Sie zitiert werden. Die ehrliche Engineering-Haltung lautet also: Halten Sie das HTML sauber, halten Sie das Schema gültig, und behandeln Sie neue Auslieferungsformate als etwas zum Beobachten statt zum Implementieren. Dieselbe Disziplin gilt für einen Headless-WooCommerce-Build auf Astro: Die Commerce-Daten sind echtes semantisches Markup, kein Nebenkanal nur für Bots.

#Die ehrliche Einschätzung zu llms.txt

Wir veröffentlichen /llms.txt und /llms-full.txt, das ist also Selbstkritik, kein billiger Seitenhieb auf andere. Die Skeptiker haben starke Argumente. Mueller hat gesagt, das Format werde im Grunde ignoriert, und eine unabhängige Server-Log-Studie fand über mehrere Monate hinweg über Hunderte von Domains null Anfragen von KI-Crawlern nach llms.txt. Als alleinstehende Datei, die in der Hoffnung auf eine Seite gelegt wird, dass irgendetwas sie liest, bewirkt sie sehr wenig.

Unser eigenes Playbook zur KI-Sichtbarkeit sagt genau das, schriftlich: Kein großer LLM-Anbieter verpflichtet sich formell dazu, diese Dateien zu lesen, aber sie tauchen in unseren Logs oft genug auf, um sie zu rechtfertigen. Wir halten beide Gedanken gleichzeitig. Eine generische, verwaiste llms.txt ist fast totes Gewicht. Dieselbe Datei als ein Knoten eines integrierten Agenten-Discovery-Setups, verdrahtet mit einer echten Aktionsschicht, ist ein anderes Objekt mit einem anderen Kosten-Nutzen-Profil. Der Fehler besteht darin, die “niemand liest llms.txt”-Studien so zu zitieren, als hätten sie die Frage für jede Implementierung geklärt. Sie haben sie für den Fall der verwaisten Datei geklärt.

#Die echte Zukunftswette: die Agenten-Aktionsschicht

Hier brechen wir vollständig mit der “Liefer einfach Markdown aus”-Fraktion, und hier liegt die wirklich interessante Zukunft. Der nächste Schritt ist kein besseres Dokument, das ein Agent lesen soll. Es geht darum, den Agenten handeln zu lassen, ohne überhaupt ein Dokument zu lesen.

Das ist die Agenten-Aktionsschicht: WebMCP, Agent2Agent (A2A) und das Model Context Protocol. Statt eine Services-Seite zu scrapen und zu raten, ruft ein Agent eine Funktion auf, request_quote, browse_services, search_site, und erhält eine typisierte Antwort. WebMCP, eine Zusammenarbeit von Google und Microsoft, ist seit Februar 2026 in der Chrome-Developer-Preview und zielt direkt auf dieses Modell: Die Seite stellt Fähigkeiten bereit, der Agent ruft sie auf.

Wir haben das bereits gebaut. Unter public/.well-known/ veröffentlichen wir eine A2A-AgentCard, eine MCP-Server-Card nach SEP-1649, einen ACP-Deskriptor und Markdown-Content-Negotiation über ein .md-URL-Suffix und Accept: text/markdown-Handling in der Middleware, wobei das Ganze über Link-Header und Robots-Regeln beworben wird. Die fetch_markdown-Fähigkeit auf unserer AgentCard verweist auf /llms-full.txt, was genau der Grund ist, warum die llms-Dateien hier nicht verwaist sind, sie sind in die Aktionsschicht eingebunden, statt allein dazustehen.

Über all dem liegt eine Auffindbarkeitslücke. OKF (Open Knowledge Format) verpackt eine Wissensbasis, hilft aber bewusst niemandem, sie zu finden; Joost de Valk kombiniert es mit ARD, Agentic Resource Discovery, einer Datei /.well-known/ai-catalog.json, die auflistet, was eine Domain anbietet, und direkt auf ein OKF-Bundle verweisen kann. Wir veröffentlichen nun eine solche. Unsere ai-catalog.json indexiert den llms-full-Korpus, das Services-JSON sowie die A2A-, MCP- und UCP-Deskriptoren, jeweils mit type und mediaType für spezifikationsübergreifende Kompatibilität, dazu repräsentative Abfragen. Wir behandeln sie genauso wie die anderen Auslieferungsformate, beobachten und testen sie an uns selbst, ohne jegliche Sichtbarkeitsbehauptung und ausdrücklich im Entwurfsstadium: ARD und OKF liegen beide in Version v0.9 vor und die Felder können sich noch ändern. Wir liefern sie trotzdem aus, denn sie kostet eine einzige statische Datei und stellt die Ressourcen, die wir ohnehin pflegen, hinter einen einzigen Index, den ein Agent zuerst lesen kann.

Beachten Sie die Asymmetrie. Markdown-for-Agents und Content-Negotiation, die Auslieferungsformate, behandeln wir als beobachten-nicht-implementieren, vorhanden, weil die Infrastruktur sie anbietet, nicht, weil wir einen Nutzen gemessen haben. Die Aktionsschicht behandeln wir als bewusste Zukunftsinvestition, denn das ist die Richtung, in die Thariqs HTML-Argument, WebMCP und die ganze Welle der Agenten-Werkzeuge alle zeigen. Lesen ist die Gegenwart. Handeln ist die Wette.

#Was wir tatsächlich tun

Um die Haltung konkret zu machen, hier die Aufteilung.

Auslieferung: sauberes semantisches HTML plus Schema.org, serverseitig gerendert, schnell. Das ist die tragende Entscheidung, und sie ändert sich nicht.
Markdown-for-Agents und Content-Signal: auf Cloudflare vorhanden, dort aktiviert gelassen, wo es harmlos ist, aber geprüft, denn der Opt-in-Standard bedeutet, dass es ohne Entscheidung aktiv sein kann. Kein Sichtbarkeitsanspruch daran geknüpft.
llms.txt und llms-full.txt: veröffentlicht, aber als eingebundene Knoten des Agenten-Discovery-Systems, nicht als alleinstehende Wette, und in unserem eigenen Playbook ehrlich beschrieben.
OKF: unter Wissensschicht abgelegt. Relevant, wenn und falls wir kuratiertes Wissen in eine Agenten-Pipeline einspeisen. Keine Änderung an der Website-Auslieferung.
Agenten-Aktionsschicht, A2A, MCP, WebMCP-nah: bewusste Investition, bereits unter /.well-known/ ausgeliefert, und der Teil dieser ganzen Debatte, bei dem wir uns am sichersten sind.

#Fazit

Die Debatte “HTML gegen Markdown für Agenten” von 2026 sieht aus wie eine Weggabelung. Sie ist es nicht. Sobald Sie Agenten-Ausgabe von Seitenauslieferung von der Wissensschicht trennen, hören die drei Argumente auf, sich zu widersprechen, und sie weisen alle in dieselbe Richtung. Liefern Sie sauberes semantisches HTML und gültiges Schema aus, denn es ist das eine Signal, dessen Konsum beide großen Crawler dokumentieren. Beobachten Sie die neuen Auslieferungsformate, statt ihnen hinterherzujagen, denn keines hat eine gemessene Wirkung auf Zitierungen. Und stecken Sie Ihre Zukunftsenergie in die Agenten-Aktionsschicht, denn dort wird aus Lesen Handeln.

Wir sind nicht hierhergekommen, indem wir die Debatte vorhersagten. Wir sind hierhergekommen, indem wir auf dem langweiligen, dokumentierten Signal aufbauten und alles Neuere als etwas behandelten, das zuerst zu messen ist. Das ist die ganze Methode. Der laute Teil des Internets streitet über das Format. Die leise, dokumentierte Antwort hat sich nicht geändert.

Wenn Sie das breitere Sichtbarkeitsbild wollen, sammelt unser Playbook für KI- und LLM-Sichtbarkeit die übrigen Hebel in Prioritätsreihenfolge.

Zuletzt aktualisiert: 15. Juni 2026.

Inhalte für KI-Agenten ausliefern: HTML gegen Markdown, und wo OKF tatsächlich hineinpasst

#Einleitung

#Die wichtigsten Erkenntnisse auf einen Blick

#Drei Schichten, die alle vermischen

#Schicht 1: Markdown als Agenten-Ausgabe

#Schicht 2: Markdown-for-Agents als Seitenauslieferung

#Schicht 3: OKF als Wissensschicht

#Warum diese Debatte unseren Stack bestätigt

#Das eine dokumentierte Signal

#Die ehrliche Einschätzung zu llms.txt

#Die echte Zukunftswette: die Agenten-Aktionsschicht

#Was wir tatsächlich tun

#Fazit

Machen Sie aus dem Artikel eine echte Umsetzung

Die sinnvollsten nächsten Schritte

Soll das Thema auf Ihrer Website umgesetzt werden?

Weitere WordPress-Dienste und Wissensbasis entdecken

Verwandte Kategorien

Unterstützende Artikel

Häufig gestellte Fragen

Ähnliche Artikel

Rendert KI JavaScript?

Warum Perplexity Ihre Marke zitiert und ChatGPT nicht

KI-Zitations-Monitoring: was Sie verfolgen sollten und wie oft

Mariusz Szatkowski