Was wir messen

AI100 misst, wie natürlich eine Marke in den neutralen KI-Antworten innerhalb ihrer Kategorie und Region erscheint. Die Methodik trennt die Hauptbewertungsschicht (neutrale Szenarien) von der diagnostischen Schicht (Abfragen mit Markennamen) und verwendet eine nichtlineare Skala von 0 bis 100.

Messeinheit: eine Modellantwort auf ein standardisiertes Fragenszenario.

Wie ein Durchlauf funktioniert

1. Vorbereitung des Forschungsrahmens

Zuerst lesen wir die Website, identifizieren die Kategorie und klären, mit welchem Marktumfeld die Marke sinnvoll verglichen werden kann. Der Nutzer wählt eine Sichtbarkeitssprache (Visibility Language) — die Sprache, in der dem Modell die Fragen gestellt werden. Dies ist ein wichtiger Parameter: dieselbe Marke kann je nach Sprache der Prompts ein unterschiedliches Wettbewerbsumfeld vorfinden. Das Modell bildet für jede Sprache ein eigenes assoziatives Feld: Marken, die in einer Sprache dominieren, können in einer anderen ihre Position an andere Wettbewerber abgeben. Für internationale Marken wird eine separate Studie für jede Zielmarktsprache empfohlen.

2. Aufbau des Fragenkorpus

Dann wird das Set von Szenarien zusammengestellt: einige prüfen das natürliche Erscheinen der Marke, andere helfen, die Reputation und den Charakter der Modellantwort zu verstehen.

3. Berechnung des Hauptscores

Der Hauptscore basiert ausschließlich auf neutralen Szenarien, in denen die Marke ihren Platz durch die Modellantwort selbst verdienen muss. Separat werden der diagnostische Score (nach direkten Nennungen), die Web-Verstärkung (Differenz zwischen Gedächtnis- und Suchantwort) und das Konfidenzintervall berechnet.

4. Erklärung und Bericht

Abschließend übersetzen wir das Gesamtset der Antworten in einen lesbaren Bericht: den Endscore, seine Stabilität, die Stärken der Marke und die Wachstumszonen.

Wie der Score berechnet und gelesen wird

Der Sprung von schwacher Sichtbarkeit zu einer glaubwürdigen Mittelschicht wirkt dramatisch: Die Marke existiert für das Modell kaum oder erscheint bereits in einem Teil der Antworten. Der Sprung von starker Sichtbarkeit zu nahezu vollständiger Dominanz ist schwieriger. Deshalb verwenden wir eine logarithmische Transformation.

S = 100 ×  ln(1 + r / 12) ln(1 + 100 / 12)
S — Endscore (0–100) r — Rohsignal der Sichtbarkeit (0–100) 12 — Glättungsparameter (Kalibrierung)
0 25 50 75 100 0 25% 50% 75% 100% Rohsignal der Sichtbarkeit (r) Score linear 25% → 50 Punkte
Was raw bedeutet. Das ist das Rohsignal der Sichtbarkeit: wie häufig die Marke erscheint, wie hoch sie in der Antwort bleibt und wie überzeugend sie im Gesamtset der neutralen Szenarien wirkt.
Warum ein Logarithmus. Der Logarithmus macht den unteren und mittleren Bereich der Skala empfindlicher. So wandeln sich einige glückliche Antworten nicht zu schnell in einen hohen Endwert um.
Wie das Ergebnis zu lesen ist. Ein Anstieg von 20 auf 40 spiegelt eine echte Stärkung der Präsenz wider. Ein Anstieg von 80 auf 90 zählt ebenfalls, ist aber wesentlich schwieriger zu erreichen — und genau diesen Effekt soll die nichtlineare Skala bewahren.
Konfidenzintervall. Jedes Ergebnis wird von einem Konfidenzintervall begleitet — dem Bereich, in dem der Score wahrscheinlich liegen würde, wenn derselbe Fragenkorpus erneut ausgeführt würde. Ein schmales Intervall deutet auf stabile Sichtbarkeit hin; ein breites darauf, dass die Markenpräsenz je nach Szenario schwankt.
Web-Verstärkung. Die Studie wird in zwei Modi ausgeführt: nur mit Modellwissen und Modell + Webquellen. Die Differenz zwischen beiden Scores wird als Web-Verstärkung berichtet. Ein positiver Wert bedeutet, dass Webquellen die Marke stärken; ein negativer bedeutet, dass sie sie schwächen.

Korpus und Bewertung

Hauptschicht

Familie Was sie prüft
ExpertiseErkennt das Modell Autoritätssignale im Bereich der Marke?
ComparisonBesteht die Marke in vergleichenden Fragen ohne Namensnennung?
First appearanceNennt das Modell die Marke, wenn der Nutzer gerade erst mit der Suche beginnt?
RankingWie hoch platziert das Modell die Marke in einem expliziten Kategorieranking?
ShortlistSchafft es die Marke in die engere Auswahl, wenn der Nutzer bereit ist zu vergleichen?
TrustAssoziiert das Modell die Marke mit Zuverlässigkeit und guter Wahl?

Gewichtungen des Hauptscores

Metrik Was sie zeigt Gewicht
Mention RateWie häufig die Marke in Antworten erscheint24.0%
Top-3 RateWie häufig die Marke im oberen Teil der Antwort steht14.0%
Top-1 RateWie häufig die Marke als Erste genannt wird10.0%
Avg PositionDurchschnittliche Position der Marke in den Antworten15.0%
Prompt CoverageIn welchem Anteil der Szenarien die Marke erscheint14.0%
Response ShareWie häufig die Marke im Antworttext erwähnt wird10.0%
Text ShareWelcher Anteil des Antworttextes der Marke gewidmet ist5.0%
Domain CitationWie häufig das Modell die Domain der Marke zitiert8.0%

Diagnostische Schicht

Diese Schicht ersetzt nicht den Hauptscore. Sie erklärt, was passiert, wenn die Marke bereits genannt, direkt verglichen oder im Hinblick auf ihre Reputation diskutiert wird.

Familie Was sie prüft
AlternativeWird die Marke als Alternative zu einer bereits genannten Lösung erinnert?
ReputationWie beschreibt das Modell die Marke, wenn der Name bereits gegeben ist?
Direct comparisonWas passiert bei einem direkten Vergleich mit einem Wettbewerber?

Gewichtungen des diagnostischen Scores

Metrik Was sie zeigt Gewicht
Recommendation RateAnteil der Antworten mit expliziter Markenempfehlung30.0%
Recommendation StrengthWie überzeugend das Modell die Empfehlung formuliert25.0%
CentralityOb die Marke das Hauptthema der Antwort ist20.0%
Positive ToneAnteil der Antworten mit explizit positivem Ton15.0%
Argument QualityOb das Modell die Empfehlung mit Argumenten stützt10.0%

Umfang und Einschränkungen

AI100 verwendet OpenAI-Modelle (GPT-5.4) in zwei Modi: auf Basis des internen Modellwissens und mit Unterstützung durch Webquellen. Der Korpus wird für jede Sprache und Region erstellt.

Was AI100 misst

  • Wie natürlich die Marke in neutralen KI-Antworten innerhalb ihrer Kategorie erscheint.
  • Die Position der Marke in der Antwort und ob Webquellen sie verstärken.
  • In welchen Fragenfamilien die Marke verschwindet und wo sie stärker als die Wettbewerber erscheint.

Was AI100 nicht misst

  • Umsatz, Konversion, Stärke des Marketingteams oder Produktqualität an sich.
  • Alle Modelle und alle Internetmodi gleichzeitig. Derzeit konzentriert sich die Methode auf die nützlichste angewandte Schicht und ist für Erweiterung ausgelegt.
  • Eine absolute Wahrheit über den Markt. Jede Messung hängt von Datum, Sprache, Kategorie und Fragenkatalog ab.

Möchten Sie sehen, wie das für eine echte Marke aussieht?

Beispielbericht ansehen