Forschung & Quellen
Von Hans-J. Nolte ·GEOhybrid ist ein KI-Sichtbarkeits-Tool, das auf empirisch validierter Forschung von fünf Universitäten und über zehn aktuellen Industrie-Untersuchungen aus 2026 aufbaut.
Diese Seite listet alle Quellen offen auf, damit Sie selbst nachprüfen können, worauf jede einzelne Empfehlung basiert. Die Übersicht ist in drei Blöcke gegliedert: akademische Studien, aktuelle Industrie-Untersuchungen und deutschsprachige Praktiker-Texte.
- Akademische Quellen
- 5 Universitäten (Toronto, Carnegie Mellon, UC Berkeley, USTC, Princeton)
- Industrie-Forschung 2026
- 10+ aktuelle Reports (Convertmate, Frase, ALM Corp, Onely, Ahrefs u.a.)
- Mess-Module im Tool
- 30 Prüfpunkte in 4 Ebenen (Kern · KI-Crawler · Erweitert · Bonus)
- Letztes Update
- Mai 2026 (Hinzunahme Convertmate-Benchmark + 7 weitere Quellen)
- Status
- Aktiv gepflegt
- Geprüft
- 2026-05-26
- Stand
- 2026-05-26
Abgrenzung — was GEOhybrid nicht ist
Damit keine Verwechslung entsteht — GEOhybrid grenzt sich bewusst ab:
- Kein klassisches SEO-Tool wie Ahrefs, Semrush oder Sistrix. Wir messen nicht Google-Ranking-Faktoren, sondern KI-Antwort-Sichtbarkeit (ChatGPT, Claude, Gemini, Grok). Im Vergleich zu klassischem SEO geht es um andere Kriterien.
- Kein Hosting oder CMS. Wir analysieren bestehende Webseiten, hosten aber keine.
- Kein Linkbuilding-Service. Wir sagen Ihnen WO Trust-Signale fehlen, generieren sie aber nicht.
- Keine generische „AI-Optimierung" mit Bauchgefühl. Jede Empfehlung hat eine konkrete Studien-Quelle (siehe unten).
Einschränkungen
Wo die Forschungslage offen ist — wir sind transparent über die Grenzen der vorliegenden Quellen:
- KI-Suchsysteme verändern sich monatlich. Eine Studie aus dem Frühjahr 2025 trifft heute nur noch eingeschränkt zu. Wir prüfen alle Quellen halbjährlich und markieren überholte Erkenntnisse.
- Stichproben-Größen sind oft klein. Akademische GEO-Studien arbeiten meist mit 1.000–10.000 Seiten. Das ist allerdings deutlich besser als reine Bauchgefühl-Empfehlungen, aber nicht statistisch repräsentativ für das ganze Web.
- Nicht alle KI-Modelle sind in den Studien vertreten. Die Mehrzahl der Studien konzentriert sich auf ChatGPT, Claude und Gemini. Grok, Perplexity und kleinere Modelle sind unterrepräsentiert.
- Quantitative Studien können qualitative Schreib-Qualität nicht erfassen. Ein Modul wie „neutraler Ton" ist heuristisch — eine echte tonale Bewertung ist (noch) nicht automatisierbar.
Direkte Studien-Zitate
Damit Sie ein Gefühl für den Stil der Quellen bekommen — drei direkte Auszüge:
„Metadata & Freshness" ist der stärkste Einzel-Prädiktor für die Citation-Wahrscheinlichkeit (Korrelation r = 0,68; relativer Citation-Impact +47 Prozent gegenüber Seiten ohne Aktualitätshinweise. UC Berkeley 2025, GEO-16 Framework (arXiv:2509.10762)
Three rules apply across all three engines (ChatGPT, Gemini, Claude): State the key conclusion at the beginning of the document; maintain a neutral, objective tone; present multiple perspectives where appropriate. Carnegie Mellon University 2025, AutoGEO (arXiv:2510.11438)
Pages exceeding 20.000 characters average 10,18 citations versus 2,39 for pages under 500 characters — a 4,3-fold multiplier. Content depth represents the most critical optimization lever. Convertmate GEO-Benchmark 2026
Akademische Studien
University of Toronto (Kanada), 2025
Earned-Media-Dominanz in KI-Antworten + 5-Pillar-GEO-Strategie
Chen et al. werteten zehntausende ChatGPT- und Claude-Antworten aus. Kernbefund: 93 bis 95 Prozent der von ChatGPT zitierten Informationen stammen aus „Earned Media" — also Drittquellen, die über die Marke schreiben, nicht von der Marke selbst. Plus: Nischen-Marken brauchen klare Disambiguierung, sonst werden sie mit größeren Wettbewerbern verwechselt.
Wir haben daraus gemacht: Module disambiguation, trust_signals, lifecycle_coverage und der Earned-Media-Hinweis-Block im Premium-Report.
Carnegie Mellon University (USA), 2025
AutoGEO: 14 explizit extrahierte Content-Regeln pro KI-Engine
Wu et al. haben einen automatisierten Prozess entwickelt, der herausfindet, welche Inhaltsregeln ChatGPT, Gemini und Claude bevorzugen. Mit der Anwendung dieser Regeln erreichten sie eine 36-prozentige Steigerung der Citation-Rate. Drei „Shared Rules" gelten für ALLE Engines: Conclusion First (Antwort ganz oben), Neutral Tone (sachlich statt werblich), Balanced Perspective (mehrere Sichtweisen).
Wir haben daraus gemacht: Module lead_definition (Answer-First-Heuristik), tone_neutrality, balanced_view, causal_reasoning, paragraph_focus und mehrere weitere.
UC Berkeley (USA), 2025
GEO-16-Framework mit empirisch korrelierten Citation-Faktoren
Kumar und Palkhouski haben 1100 Webseiten analysiert und 16 Inhalts- bzw. Technik-Signale gegen die Citation-Rate korreliert. Stärkster Einzelfaktor: „Metadata & Freshness" mit Korrelation r = 0,68 und +47 Prozent Citation-Impact. Weiter wichtig: Semantic HTML (r = 0,65 / +42 %), Structured Data (r = 0,63 / +39 %), Authority & Trust (r = 0,59 / +35 %).
Wir haben daraus gemacht: Gewichts-Verteilung der Kern-Module (h1, jsonld, freshness, trust_signals), Modul freshness mit 30/90/180/365-Tage-Bändern.
University of Science and Technology of China, 2025
RAID-GEO: 4W-Intent-Framework + Enrichment-Effektgrößen
Chen et al. haben gemessen, welche Anreicherungen den größten Effekt auf KI-Antworten haben. Effektgrößen (PAWC = Position-Aware Word Count): Terminology +5,96, Statistics +4,35, Quotation +3,76. Heißt im Klartext: Konkrete Fachbegriffe, harte Zahlen und Zitate aus Drittquellen erhöhen die Wahrscheinlichkeit, dass eine Seite von KI-Systemen zitiert wird, deutlich.
Wir haben daraus gemacht: Modul fact_grid (15 % Gewicht — höchstes Einzel-Modul), quotation_density, plus die Empfehlungen zu konkreten Zahlenangaben in der Lead-Definition.
Princeton University & Allen Institute for AI, 2023
Das Original-GEO-Paper, das den Begriff geprägt hat
Aggarwal et al. haben den Begriff „Generative Engine Optimization" erstmals akademisch eingeführt und systematische Tests verschiedener Optimierungs-Techniken vorgestellt. Top-Befund: „Statistics Addition" und „Cite Sources" steigern die Visibility in generativen Antworten um bis zu 40 Prozent.
Industrie-Forschung 2026
Convertmate GEO-Benchmark 2026
Detaillierte Auswertung welche On-Page-Signale tatsächlich zu KI-Citations führen. Konkrete Zahlen: Pages über 20.000 Zeichen erhalten 4,3× mehr Citations als Pages unter 500 Zeichen. Texte aus den letzten 30 Tagen: 3,2× mehr Citations als ältere. 44 Prozent aller Citations stammen aus dem ersten Drittel der Seite.
Wir haben daraus gemacht: Schärfung des freshness-Moduls mit 30-Tage-Sweet-Spot, Reaktivierung von word_count mit 5 Bändern bis 3000+ Wörter.
→ convertmate.io/research/geo-benchmark-2026
Frase 2026 — AI-Citations-Playbook
Untersucht über 12.000 KI-Citations und identifiziert: 100 Prozent der zitierten Pages haben sichtbare Author-Credentials. Anonyme „Content Team"-Bylines sind eine harte Penalty. Wir haben daraus das Modul author_authority (4 % Gewicht) gebaut, das genau diese Signale prüft.
→ frase.io/blog/how-to-get-cited-by-ai-search-engines
ALM Corp 2026 — Entity Authority für AI-Citations
Erklärt wie strukturierte Daten + verlinkte Author-Profile (LinkedIn, Wikipedia, ORCID) die KI-Wahrnehmung der Entity verbessern. Wir prüfen die genannten sameAs-Verlinkungen in unserem jsonld- und author_authority-Modul.
→ almcorp.com/blog/entity-authority-ai-citations-structured-data
Onely 2026 — LLM-Friendly Content
Strukturelle Empfehlungen für KI-zitierfähige Texte. Bestätigt: Heading-Hierarchie, Listen, Tabellen und klare Abschnitts-Struktur sind essentiell. Speist unsere AEO-Module.
→ onely.com/blog/llm-friendly-content
Quoleady 2026 — G2/Capterra-Reviews & ChatGPT-Rankings
Empirische Daten dazu, wie Drittanbieter-Bewertungs-Plattformen die KI-Sichtbarkeit beeinflussen. Hauptbefund: Domains mit Profilen auf G2, Capterra, Trustpilot oder Sitejabber haben 3× höhere Citation-Wahrscheinlichkeit. Multi-Plattform-Präsenz: 4,6 bis 6,3 Citations vs. 1,8 bei Einzel-Plattform.
Hall.ai 2026 — Review-Plattform Citation-Analyse
Detaillierte Crawler-Zugriffs-Analyse: Yelp und Trustpilot blockieren KI-Crawler komplett, G2 und Capterra erlauben selektiven Zugriff, Clutch und SourceForge sind voll offen. Wirkt direkt auf unsere Empfehlungen zu Off-Page-Reputation.
→ usehall.com/guides/review-platform-ai-citation-analysis
Ahrefs 2026 — Query Fan-Out
Erklärt das Verhalten moderner KI-Suchsysteme: jede User-Query wird intern in 8–12 Sub-Queries zerlegt, parallel gesucht und zu einer Antwort zusammengeführt. Sites, die mehrere Sub-Queries beantworten können, werden 161 Prozent häufiger zitiert. Beeinflusst unsere Empfehlung zur Themen-Tiefe.
→ ahrefs.com/blog/query-fan-out
News Source Citing Patterns in AI Search Systems, 2026
Akademische Pre-Print-Untersuchung von 366.000 Citations aus 12 KI-Suchmodellen. Bestätigt die Konzentration auf wenige hochautoritäre Quellen.
AEO.press 2026 — State of llms.txt
Reality-Check zur viel-diskutierten llms.txt-Datei: SE-Ranking-Auswertung von 300.000 Domains zeigt nur 10 % Adoption. ALLMO-Analyse von 94.000 zitierten URLs: kein messbarer Citation-Lift. Hat dazu geführt, dass wir das llms_txt-Modul defensiv niedrig gewichten.
→ aeo.press/ai/the-state-of-llms-txt-in-2026 und allmo.ai/articles/llms-txt
Leapd 2026 — Wie ChatGPT, Google AI Overviews und Perplexity Quellen finden
Strukturelle Übersicht über die Indexierungs- und Citation-Mechanismen der drei großen KI-Suchsysteme. Speist unsere Empfehlungen zu Crawler-Zugängen und IndexNow.
Praktiker-Texte (intern)
Zwei deutschsprachige Praxis-Texte ergänzen die akademische und englischsprachige Literatur um den deutschen TYPO3- und CMS-Alltag:
- TYPO3-GEO Best Practices (2026) — Konkrete Implementierungs-Hinweise für Robots.txt-Whitelisting der KI-Crawler, Schema.org-Patterns, IndexNow-Anbindung. Hat zur Entwicklung des
crawler_access-Moduls geführt. - Nutzen von llms.txt (2026) — Argumente für die llms.txt-Datei aus Praktiker-Sicht. Wurde vom AEO.press-Reality-Check 2026 relativiert, bleibt aber als „defensive Empfehlung" in unserem Toolset.
Beide Texte wurden uns von Branchen-Praktikern zur Verfügung gestellt und sind nicht öffentlich verfügbar.
Häufige Fragen zur Forschungsbasis
Warum so viele unterschiedliche Quellen?
Weil keine einzelne Studie das gesamte Feld abdeckt. Akademische Arbeiten liefern statistische Korrelationen, Industrie-Reports liefern aktuelle Praxis-Daten — daher ergänzen sich beide. Folglich kombinieren wir akademische Belastbarkeit mit Praxis-Aktualität.
Wie aktuell sind die Quellen?
Über 80 Prozent der hier zitierten Industrie-Reports stammen aus 2026, die akademischen Studien aus 2025. Daher reflektieren die Empfehlungen den aktuellen Stand der KI-Suchsysteme. Allerdings prüfen wir die Quellenlage halbjährlich, weil sich KI-Modelle schnell verändern.
Kann ich die Original-Studien selbst lesen?
Ja, alle akademischen Quellen sind frei verfügbar (arXiv-Pre-Prints), Industrie-Reports überwiegend ebenfalls. Direkte Links finden Sie bei jeder Quelle. Somit können Sie die Belege selbst prüfen, wenn Sie tiefer einsteigen wollen.
Werden widersprüchliche Studien erwähnt?
Ja, weil das wissenschaftlich seriös ist. Beispiel: Die llms.txt-Datei wird von einigen Praktikern als Pflicht beschrieben, der AEO.press-Reality-Check 2026 zeigt jedoch keinen messbaren Citation-Lift. Daher gewichten wir das Modul defensiv niedrig — und legen den Konflikt offen.
Wie wir die Quellen verarbeiten
Für jede Quelle wurde geprüft:
- Empirische Belastbarkeit — gibt es konkrete Zahlen, oder nur Bauchgefühl? Wir bevorzugen Studien mit gemessenen Effekten.
- Aktualität — KI-Suchsysteme verändern sich monatlich. Quellen älter als 18 Monate werden kritisch geprüft, ob sie noch zutreffen.
- Reproduzierbarkeit — kann ein anderer Analyst die gleiche Empfehlung aus den Daten ableiten?
- Konflikt mit anderen Quellen — wenn zwei Studien sich widersprechen, gewichten wir nach Methodik-Qualität und Stichproben-Größe.
Die Gewichtung der Module in unserem Score (Summe immer 100 Prozent) spiegelt diese Bewertung wider: stärker belegte Faktoren bekommen mehr Gewicht, schwächere weniger oder gar keins (informativ ohne Score-Auswirkung).
Stand und Pflege
Diese Übersicht wird laufend aktualisiert. Wenn neue belastbare Forschung erscheint, fließt sie in die Module ein und wird hier nachgetragen. Letzte größere Überarbeitung: Mai 2026 (Hinzunahme von 8 Industrie-Quellen 2026, Schärfung der Module freshness und word_count nach Convertmate-Benchmark).
Wenn Sie eine relevante Studie kennen, die hier fehlt: info@geohybrid.de.