Wie AI100 die Markensichtbarkeit in KI misst
Was wir messen
AI100 misst, wie natürlich eine Marke in den neutralen KI-Antworten innerhalb ihrer Kategorie und Region erscheint. Die Methodik trennt die Hauptbewertungsschicht (neutrale Szenarien) von der diagnostischen Schicht (Abfragen mit Markennamen) und verwendet eine nichtlineare Skala von 0 bis 100.
Messeinheit: eine Modellantwort auf ein standardisiertes Fragenszenario.
Wie ein Durchlauf funktioniert
1. Vorbereitung des Forschungsrahmens
Zuerst lesen wir die Website, identifizieren die Kategorie und klären, mit welchem Marktumfeld die Marke sinnvoll verglichen werden kann. Der Nutzer wählt eine Sichtbarkeitssprache (Visibility Language) — die Sprache, in der dem Modell die Fragen gestellt werden. Dies ist ein wichtiger Parameter: dieselbe Marke kann je nach Sprache der Prompts ein unterschiedliches Wettbewerbsumfeld vorfinden. Das Modell bildet für jede Sprache ein eigenes assoziatives Feld: Marken, die in einer Sprache dominieren, können in einer anderen ihre Position an andere Wettbewerber abgeben. Für internationale Marken wird eine separate Studie für jede Zielmarktsprache empfohlen.
2. Aufbau des Fragenkorpus
Dann wird das Set von Szenarien zusammengestellt: einige prüfen das natürliche Erscheinen der Marke, andere helfen, die Reputation und den Charakter der Modellantwort zu verstehen.
3. Berechnung des Hauptscores
Der Hauptscore basiert ausschließlich auf neutralen Szenarien, in denen die Marke ihren Platz durch die Modellantwort selbst verdienen muss. Separat werden der diagnostische Score (nach direkten Nennungen), die Web-Verstärkung (Differenz zwischen Gedächtnis- und Suchantwort) und das Konfidenzintervall berechnet.
4. Erklärung und Bericht
Abschließend übersetzen wir das Gesamtset der Antworten in einen lesbaren Bericht: den Endscore, seine Stabilität, die Stärken der Marke und die Wachstumszonen.
Wie der Score berechnet und gelesen wird
Der Sprung von schwacher Sichtbarkeit zu einer glaubwürdigen Mittelschicht wirkt dramatisch: Die Marke existiert für das Modell kaum oder erscheint bereits in einem Teil der Antworten. Der Sprung von starker Sichtbarkeit zu nahezu vollständiger Dominanz ist schwieriger. Deshalb verwenden wir eine logarithmische Transformation.
Korpus und Bewertung
Hauptschicht
| Familie | Was sie prüft |
|---|---|
| Expertise | Erkennt das Modell Autoritätssignale im Bereich der Marke? |
| Comparison | Besteht die Marke in vergleichenden Fragen ohne Namensnennung? |
| First appearance | Nennt das Modell die Marke, wenn der Nutzer gerade erst mit der Suche beginnt? |
| Ranking | Wie hoch platziert das Modell die Marke in einem expliziten Kategorieranking? |
| Shortlist | Schafft es die Marke in die engere Auswahl, wenn der Nutzer bereit ist zu vergleichen? |
| Trust | Assoziiert das Modell die Marke mit Zuverlässigkeit und guter Wahl? |
Gewichtungen des Hauptscores
| Metrik | Was sie zeigt | Gewicht |
|---|---|---|
| Mention Rate | Wie häufig die Marke in Antworten erscheint | 24.0% |
| Top-3 Rate | Wie häufig die Marke im oberen Teil der Antwort steht | 14.0% |
| Top-1 Rate | Wie häufig die Marke als Erste genannt wird | 10.0% |
| Avg Position | Durchschnittliche Position der Marke in den Antworten | 15.0% |
| Prompt Coverage | In welchem Anteil der Szenarien die Marke erscheint | 14.0% |
| Response Share | Wie häufig die Marke im Antworttext erwähnt wird | 10.0% |
| Text Share | Welcher Anteil des Antworttextes der Marke gewidmet ist | 5.0% |
| Domain Citation | Wie häufig das Modell die Domain der Marke zitiert | 8.0% |
Diagnostische Schicht
Diese Schicht ersetzt nicht den Hauptscore. Sie erklärt, was passiert, wenn die Marke bereits genannt, direkt verglichen oder im Hinblick auf ihre Reputation diskutiert wird.
| Familie | Was sie prüft |
|---|---|
| Alternative | Wird die Marke als Alternative zu einer bereits genannten Lösung erinnert? |
| Reputation | Wie beschreibt das Modell die Marke, wenn der Name bereits gegeben ist? |
| Direct comparison | Was passiert bei einem direkten Vergleich mit einem Wettbewerber? |
Gewichtungen des diagnostischen Scores
| Metrik | Was sie zeigt | Gewicht |
|---|---|---|
| Recommendation Rate | Anteil der Antworten mit expliziter Markenempfehlung | 30.0% |
| Recommendation Strength | Wie überzeugend das Modell die Empfehlung formuliert | 25.0% |
| Centrality | Ob die Marke das Hauptthema der Antwort ist | 20.0% |
| Positive Tone | Anteil der Antworten mit explizit positivem Ton | 15.0% |
| Argument Quality | Ob das Modell die Empfehlung mit Argumenten stützt | 10.0% |
Umfang und Einschränkungen
AI100 verwendet OpenAI-Modelle (GPT-5.4) in zwei Modi: auf Basis des internen Modellwissens und mit Unterstützung durch Webquellen. Der Korpus wird für jede Sprache und Region erstellt.
Was AI100 misst
- Wie natürlich die Marke in neutralen KI-Antworten innerhalb ihrer Kategorie erscheint.
- Die Position der Marke in der Antwort und ob Webquellen sie verstärken.
- In welchen Fragenfamilien die Marke verschwindet und wo sie stärker als die Wettbewerber erscheint.
Was AI100 nicht misst
- Umsatz, Konversion, Stärke des Marketingteams oder Produktqualität an sich.
- Alle Modelle und alle Internetmodi gleichzeitig. Derzeit konzentriert sich die Methode auf die nützlichste angewandte Schicht und ist für Erweiterung ausgelegt.
- Eine absolute Wahrheit über den Markt. Jede Messung hängt von Datum, Sprache, Kategorie und Fragenkatalog ab.
Möchten Sie sehen, wie das für eine echte Marke aussieht?
Beispielbericht ansehen