Ich habe meine Website für KI lesbar gemacht. So geht's.

Ich habe meine Website für KI lesbar gemacht. So geht's.

Eine Website, die für Menschen gebaut ist, ist nicht dasselbe wie eine, die für KI lesbar ist. Suchmaschinen crawlen Struktur und Keywords. KI-Systeme verlassen sich mehr auf strukturierte Metadaten, um zu verstehen, wer du bist, worum es bei deinen Inhalten geht und wie sie dich korrekt zitieren.

Wenn du einen KI-Assistenten zu einer persönlichen Seite fragst und die Antwort kommt vage oder daneben zurück, liegt es meistens an dieser Lücke. Das HTML ist in Ordnung. Die Signale, nach denen KI sucht, sind einfach nicht da.

Dieser Beitrag ist eine Arbeitsliste dessen, was ich auf den Seiten, die ich betreibe, geändert habe, um diese Lücke zu schließen. Jeder Abschnitt behandelt ein Element (ein Meta-Tag, einen Schema-Block, eine robots.txt-Regel), warum es für KI-Sichtbarkeit zählt, und den dazugehörigen Code.

Was ist LLM SEO?

LLM SEO, auch Generative Engine Optimization (GEO) genannt, ist die Praxis, eine Website so zu strukturieren, dass KI-Systeme wie ChatGPT, Claude, Perplexity und Google AI Overviews sie korrekt lesen, verstehen und zitieren können. Es überschneidet sich mit klassischem SEO, legt aber den Schwerpunkt auf strukturierte Metadaten, zitierfähige Passagen und klare Entity-Signale statt auf reines Keyword-Targeting.

Das Ziel ist nicht mehr “auf Seite eins ranken”. Das Ziel ist “in der Antwort zitiert werden”.

Warum gerade jetzt?

Ein paar Zahlen aus Ende 2025 und Anfang 2026, die mich dazu gebracht haben, das ernst zu nehmen:

Google AI Overviews Reichweite
1,5 Milliarden Nutzer pro Monat, in 200+ Ländern
Quelle · Google
AI Overviews Abdeckung
50%+ aller Suchanfragen
Quelle · Branchendaten
ChatGPT wöchentlich aktive Nutzer
800 Millionen (Oktober 2025)
Quelle · OpenAI
Perplexity monatliche Anfragen
780 Millionen (Mai 2025)
Quelle · Perplexity (Bloomberg Tech Summit)
Wachstum KI-getriebener Sitzungen
+527% (Januar bis Mai 2025)
Quelle · Previsible
Brand Mentions vs. Backlinks bei KI-Zitaten
Mentions korrelieren rund 3x stärker mit KI-Zitaten als Backlinks
Quelle · Ahrefs, Dezember 2025, Studie zu 75.000 Marken

Der letzte Punkt ist der, den die meisten übersehen. Backlinks zählen weiterhin für klassische Suche. Für KI-Zitate zählt es mehr, auf YouTube, Reddit, Wikipedia und LinkedIn erwähnt zu werden, als ein hoher Domain Rating Score. KI-Systeme wählen Quellen nach Entity-Vertrauen aus, nicht nach Linkprofil.

Kurzfassung: die sechs Hebel mit dem größten Effekt

Wenn du nur einen Nachmittag dafür hast, mach diese sechs Dinge in dieser Reihenfolge:

  1. Füge jedem Beitrag JSON-LD BlogPosting-Schema hinzu, mit author, datePublished und sameAs-Links zu GitHub und LinkedIn.
  2. Füge Open Graph und Twitter Card Meta-Tags mit expliziten Titeln, Beschreibungen und einem Bild auf jeder Seite hinzu.
  3. Erlaube GPTBot, OAI-SearchBot, ClaudeBot, Claude-SearchBot, PerplexityBot und Google-Extended in der robots.txt.
  4. Verwende fragebasierte H2- und H3-Überschriften (“Wie füge ich strukturierte Daten hinzu?” statt “Strukturierte Daten”).
  5. Schreibe in sich geschlossene Antwortblöcke von 40 bis 75 Wörtern, jeder beginnt mit der Antwort im ersten Satz oder den ersten zwei Sätzen.
  6. Verwende deinen vollen Namen und konsistente biografische Angaben auf jeder Seite, damit KI dich als eine einzige Entity erkennt.

Alles unterhalb dieses Abschnitts ist Detail dazu, warum jeder Schritt zählt und wie ich ihn umgesetzt habe.

Was ich hinzugefügt habe

Open Graph und Twitter Cards

Diese Tags erstellen Rich Previews, wenn man einen Link teilt. Sie sind auch eines der klarsten Signale, die man einer KI geben kann, was eine Seite enthält. Sowohl Open Graph als auch Twitter Cards werden von KI-Systemen beim Crawlen von Seiten gelesen.

<meta property="og:title" content="Ich habe meine Website für KI lesbar gemacht. So geht's.">
<meta property="og:description" content="Wie ich mein Portfolio für KI-Systeme lesbar gemacht habe.">
<meta property="og:type" content="article">
<meta property="og:url" content="https://milos.oroz.space/de/blog/llm-crawling-optimization-de/">
<meta property="og:image" content="https://milos.oroz.space/images/blog/home-page.png">

<meta name="twitter:card" content="summary_large_image">
<meta name="twitter:title" content="Ich habe meine Website für KI lesbar gemacht. So geht's.">
<meta name="twitter:description" content="Wie ich mein Portfolio für KI-Systeme lesbar gemacht habe.">

Statt die KI aus dem Seiteninhalt raten zu lassen, gibt das ihr eine eindeutige Beschreibung direkt am Anfang.

JSON-LD Strukturierte Daten

Das ist die wirkungsvollste Änderung. JSON-LD erlaubt es, einer Maschine genau zu sagen, um welchen Inhaltstyp es sich handelt, wer es geschrieben hat und wann. Strukturierte Daten verbessern messbar, wie genau KI-Systeme eine Website beschreiben.

Das sameAs-Feld wird von den meisten Leuten übersprungen. Es verknüpft den eigenen Namen mit verifizierbaren Profilen auf GitHub, LinkedIn und anderen Plattformen. Durch diese Querverweise baut KI Vertrauen darüber auf, wer man tatsächlich ist.

{
  "@context": "https://schema.org",
  "@type": "BlogPosting",
  "headline": "Ich habe meine Website für KI lesbar gemacht. So geht's.",
  "datePublished": "2026-01-15",
  "dateModified": "2026-01-15",
  "url": "https://milos.oroz.space/de/blog/llm-crawling-optimization-de/",
  "image": "https://milos.oroz.space/images/blog/home-page.png",
  "keywords": ["LLM-Optimierung", "KI SEO", "GEO", "strukturierte Daten", "JSON-LD"],
  "author": {
    "@type": "Person",
    "name": "Milos Oroz",
    "url": "https://milos.oroz.space",
    "sameAs": [
      "https://github.com/hz47",
      "https://www.linkedin.com/in/milosoroz/"
    ]
  },
  "publisher": {
    "@type": "Person",
    "name": "Milos Oroz",
    "url": "https://milos.oroz.space"
  }
}

Das füge ich jedem Blog-Beitrag hinzu. Auf Startseiten packe ich eine Person in eine ProfilePage und verwende auf jeder Seite dieselbe @id (https://milos.oroz.space/#milos-oroz), damit KI-Systeme alle Erwähnungen als eine einzige Entität behandeln, nicht als mehrere Doppelgänger. Diese @id-Wiederverwendung ist das kleine Detail, das den größten Unterschied macht.

Welche KI-Crawler sollte ich in der robots.txt erlauben?

KI-Unternehmen betreiben eigene Crawler mit spezifischen User-Agent-Namen. Die meisten Standard-robots.txt-Dateien sagen nichts über diese Bots, was normalerweise bedeutet, dass sie trotzdem crawlen. Besser explizit sein.

Die wichtigsten Crawler, gruppiert nach Betreiber, Stand Anfang 2026:

OpenAI
GPTBot · ChatGPT Training und Web Search
OAI-SearchBot · OpenAI Suchfunktionen
ChatGPT-User · ChatGPT Browsing auf Nutzeranfrage
Anthropic
ClaudeBot · Claude Web-Funktionen
Claude-SearchBot · Claude Search
Perplexity
PerplexityBot · Perplexity AI Search
Google
Google-Extended · Gemini Training, KI-Funktionen
Meta
Meta-ExternalAgent · Meta AI
Common Crawl
CCBot · Trainingsdaten (oft blockiert)
ByteDance
Bytespider · TikTok / Douyin KI
# Explizite Allow-Liste für KI-Trainings- und KI-Such-Crawler
User-agent: GPTBot
User-agent: OAI-SearchBot
User-agent: ChatGPT-User
User-agent: ClaudeBot
User-agent: Claude-SearchBot
User-agent: PerplexityBot
User-agent: Google-Extended
User-agent: Meta-ExternalAgent
Allow: /
Disallow: /private/

# Alle anderen (Googlebot, Bingbot und der lange Rest)
User-agent: *
Allow: /
Disallow: /private/

Ein Detail, das man kennen sollte. Sobald ein Bot seinen eigenen User-agent-Block hat, liest er nur diesen Block. Den *-Block liest er nicht zusätzlich. Jede Disallow-Regel, die auch für KI-Crawler gelten soll, muss also innerhalb ihres Blocks wiederholt werden. Leicht zu übersehen und genau die Art Fehler, die still und leise private Pfade preisgibt.

Wer möchte, dass die eigenen Inhalte von KI-Systemen gefunden werden, sollte sie erlauben. Wer das nicht will, Disallow: /. robots.txt ist ein Signal, keine harte Sperre. Konforme Crawler wie GPTBot und ClaudeBot respektieren sie, andere wurden dabei dokumentiert, IP-Adressen zu rotieren, um Sperren zu umgehen.

Sitemap

Eine Sitemap teilt Crawlern genau mit, welche Seiten existieren. Ohne eine müssen sie Links folgen und hoffen, dass sie alles finden. Ich nutze @astrojs/sitemap, um sie automatisch beim Build zu generieren, mit einem kleinen Post-Processing-Skript, das <lastmod> aus dem Frontmatter-Datum jedes Beitrags hinzufügt.

Hreflang für zweisprachige Inhalte

Einige meiner Seiten sind zweisprachig (Englisch und Deutsch). Ohne hreflang-Tags könnte KI die beiden Sprachversionen als doppelten Inhalt behandeln statt als Übersetzungen.

<link rel="alternate" hreflang="en" href="https://milos.oroz.space/en/blog/">
<link rel="alternate" hreflang="de" href="https://milos.oroz.space/de/blog/">
<link rel="alternate" hreflang="x-default" href="https://milos.oroz.space/en/blog/">

Canonical URLs

Diese sagen Crawlern, welche Version einer Seite die autoritative ist. Für Blog-Beiträge füge ich auch Zeitstempel hinzu.

<link rel="canonical" href="https://milos.oroz.space/de/blog/llm-crawling-optimization-de/">
<meta property="article:published_time" content="2026-01-15T00:00:00.000Z">
<meta property="article:author" content="Milos Oroz">

llms.txt

Ich lege auf jeder Seite eine llms.txt-Datei im Root-Verzeichnis ab. Es ist eine einfache Textdatei, die erklärt, worum es auf der Seite geht und wer ich bin. Die Idee ist gut: KI-Crawlern schnellen Kontext geben, ohne das gesamte HTML parsen zu müssen. Aber in der Praxis, Stand Anfang 2026, fordert kein einziger großer KI-Crawler sie tatsächlich an. Die Verbreitung ist minimal und Google hat explizit erklärt, keine Pläne zu haben, sie zu unterstützen. Ich habe meine trotzdem behalten, da es nichts kostet, aber ich würde es nicht priorisieren.

Wie schreibe ich, damit KI mich tatsächlich zitiert?

Die Metadaten helfen der KI, die Struktur der Website zu verstehen. Der Inhalt zählt am meisten, und wie man schreibt beeinflusst, wie oft KI einen zitiert.

Ein paar Muster, die funktionieren:

  • Schreibe in sich geschlossene Passagen von 40 bis 75 Wörtern. Eine Studie aus 2025 mit 10.000 KI-Zitaten hat gezeigt, dass diese Länge etwa 3x häufiger in KI-Zusammenfassungen landet als längere Passagen. Jede Passage sollte eine Frage vollständig beantworten, ohne sich auf den vorherigen Absatz zu verlassen.
  • Verwende fragebasierte Überschriften. “Wie füge ich strukturierte Daten hinzu?” funktioniert besser als nur “Strukturierte Daten”, weil reale Nutzeranfragen als Fragen formuliert sind. Überschriften, die wie Suchanfragen aussehen, werden gematcht und in KI-Antworten gezogen.
  • Beginne jeden Abschnitt mit der Antwort. Direkte Aussagen in den ersten 40 bis 60 Wörtern eines Abschnitts werden häufiger zitiert. Geschichten und Setup können danach kommen.
  • Verwende deinen vollen Namen konsistent auf jeder Seite. “Milos Oroz” überall, nicht “ich” oder “der Autor” oder eine abgekürzte Version. KI-Systeme bauen Entity-Graphen auf, und konsistente Namensgebung hilft ihnen, eine Person über Seiten und Websites hinweg zu erkennen.
  • Sage Dinge direkt. “Ich baue Cloud-Infrastruktur und Automatisierungslösungen” ist klarer als “Ich arbeite in der IT.” Konkrete Aussagen sind einfacher zu verarbeiten und werden mit höherer Wahrscheinlichkeit korrekt zitiert.
  • Verlinke auf deine eigene Arbeit. Ein Blog-Beitrag, der auf ein Live-Projekt, ein GitHub-Repository oder ein veröffentlichtes Tool verweist, gibt der KI etwas Verifizierbares, woran sie deine Aussagen festmachen kann. Es zeigt auch, dass du eine echte Person bist, die echte Dinge baut.
  • Nutze Tabellen für vergleichende Daten. KI-Systeme ziehen tabellarische Daten leichter in Antworten als die gleichen Informationen in Prosa. Eine fünfzeilige Vergleichstabelle wird wörtlich zitiert, wo fünf Absätze es nicht werden.

Was unterscheidet LLM SEO von klassischem SEO?

Klassisches SEO optimiert für Platzierungen auf einer Ergebnisseite. LLM SEO optimiert dafür, innerhalb einer KI-generierten Antwort zitiert zu werden. Beide überschneiden sich, aber die Taktiken laufen auseinander:

Erfolgsmetrik
Klassisches SEO · Top-10-Platzierung
LLM SEO / GEO · Zitat in der Antwort
Wichtigste Signale
Klassisches SEO · Backlinks, Keywords, On-Page
LLM SEO / GEO · Brand Mentions, Entity-Klarheit, Struktur
Beste Content-Form
Klassisches SEO · Umfassende Langform
LLM SEO / GEO · In sich geschlossene Passagen von 40 bis 75 Wörtern
Überschriften-Stil
Klassisches SEO · Keyword-getrieben
LLM SEO / GEO · Fragebasiert
Wichtige Metadaten
Klassisches SEO · Title Tag, Meta Description
LLM SEO / GEO · JSON-LD, sameAs, llms.txt
Wo der Leser dich sieht
Klassisches SEO · Suchergebnisseite
LLM SEO / GEO · In der KI-Antwort selbst

Es gibt auch einen strukturellen Unterschied. Google AI Mode (gestartet Mai 2025) zeigt in seinem Konversations-Tab null blaue Links. Wenn die KI dich nicht zitiert, existierst du auf dieser Oberfläche nicht. Das verändert den Einsatz.

Häufige Fragen

Führen KI-Crawler JavaScript aus?

Die meisten nicht. GPTBot, ClaudeBot und PerplexityBot lesen statisches HTML. Wenn dein wichtiger Inhalt erst gerendert wird, nachdem ein JavaScript-Bundle hydratisiert ist, sieht ein KI-Crawler ihn möglicherweise gar nicht. Server-Side Rendering oder statische Generierung (was Astro standardmäßig macht) vermeidet das Problem.

Bringt llms.txt überhaupt etwas?

Bisher kaum. Stand Anfang 2026 fordern große KI-Crawler die Datei nicht an. Google hat erklärt, sie nicht unterstützen zu wollen. Ich behalte meine, weil sie nichts kostet und später relevant werden könnte. Ich würde aber keine Strategie darauf aufbauen.

Weniger, als du denkst. Die Ahrefs-Studie vom Dezember 2025 zu 75.000 Marken zeigt, dass Brand Mentions etwa dreimal stärker mit KI-Zitaten korrelieren als Backlinks. Zeit, die in Erwähnungen auf YouTube, Reddit und Wikipedia fließt, schlägt oft Zeit, die in Linkbuilding fließt.

Funktioniert der gleiche Inhalt für ChatGPT und Google AI Overviews?

Nur rund 11 % der Domains werden plattformübergreifend (ChatGPT, Perplexity, Google AI Overviews) für dieselbe Anfrage zitiert. Die Plattformen wählen Quellen unterschiedlich aus. ChatGPT stützt sich stark auf Wikipedia (rund 48 % der Zitate) und Reddit (rund 11 %). Google AI Overviews zitierten früher überwiegend Top-10-Seiten (76 % Mitte 2025), aber diese Überschneidung fällt rapide — bis Anfang 2026 auf rund 38 %, weil Gemini 3 aus breiteren Quellen schöpft. Wer auf mehrere Plattformen setzt, sollte separat optimieren.

Wie lang sollte ein Blog-Beitrag für LLM SEO sein?

Die Länge ist nicht der Hebel. Entscheidend ist, dass der Beitrag mehrere in sich geschlossene Antwortblöcke von 40 bis 75 Wörtern enthält, jeder zu einer eigenen Frage. Ein Beitrag mit 1500 Wörtern und fünf sauberen Antwortblöcken schlägt meist einen 4000-Wörter-Essay ohne sie.

Lohnt sich FAQ Schema noch?

Für KI-Plattformen wie ChatGPT und Perplexity ja. Sie nutzen FAQPage weiterhin als Hinweis, dass eine Passage eine eigenständige Frage und Antwort ist. Für Google Rich Results nein. Google hat FAQPage im August 2023 auf Behörden- und Gesundheitsseiten beschränkt, für alle anderen bringt es in der klassischen Suche nichts mehr. Das Schema ist günstig zu ergänzen und hat keinen Nachteil, also lohnt es sich, wenn du echte FAQ-Inhalte hast.

Was ich beobachte

Die Änderungen sind gemacht. Jetzt beobachte ich, ob KI-Assistenten meine Seiten genauer zusammenfassen, die richtigen Expertisebereiche erfassen und mit übersetzten Inhalten weniger durcheinanderkommen.

Das LLM-Verhalten ändert sich ständig, das ist ein fortlaufendes Experiment. Aber die Grundlagen hier sind solide, egal wie sich KI entwickelt. Strukturierte Metadaten haben immer eine Rolle gespielt. Sie spielen jetzt vermutlich eine noch größere.

Quellen