Что ИИ на самом деле «знает» о компании: внутреннее представление бренда

Исследовательский вопрос

Что именно ИИ-система «знает» о компании, если у нее нет никакой буквальной карточки бренда внутри модели.

Тип доказательств

Работы по интерпретируемости преобразовательных моделей, исследования по извлечению фактов и обзоры о механике знания в больших языковых моделях.

Актуальность фактуры

Теоретическая часть статьи опирается на устойчивые академические результаты 2021–2025 годов; прикладные замечания синхронизированы с состоянием платформ на март 2026 года.

Почему метафора карточки вводит в заблуждение

Попробуйте спросить ChatGPT: «Какую платформу аналитики выбрать для среднего e-commerce?» — и обратите внимание на то, как устроен ответ. Модель не откроет Gartner, не перейдёт на сайт каждого вендора и не сверит тарифы. Она соберёт ответ из того, что у неё уже есть: обрывков документации, следов обзорных статей, остатков чьих-то сравнений на Reddit, фрагментов пресс-релизов двухлетней давности. Один бренд окажется описан точно — с правильной категорией, свежими характеристиками и верным ценовым диапазоном. Другой будет назван, но перепутан с материнской компанией. Третий — пропущен вовсе, хотя по выручке он крупнее первых двух. Откуда берётся эта неравномерность? Дело в том, что внутри модели нет никакой карточки бренда с аккуратными полями «название — категория — цена — преимущества». Есть нечто совсем иное: распределённая сеть вероятностных связей — следы в параметрах, активируемые шаблоны, скрытые состояния вычислений и, в поисковых режимах, свежие документы, подмешанные в момент ответа.

Пока компания воображает себе аккуратную ячейку в машинной памяти, она ищет простые рецепты: «добавить упоминаний», «обновить заголовки», «опубликовать ещё одну страницу о нас». Но если понимать, что бренд внутри модели — это скорее рельеф из вероятностей, чем запись в базе данных, задача выглядит иначе. Тогда вопрос не в количестве сигналов, а в том, как они друг с другом согласованы: устойчиво ли имя привязано к категории, различаются ли продукты между собой, подтверждаются ли ключевые свойства из разных источников, легко ли модель отделяет вашу сущность от соседних. Почему вообще сильный бренд оказывается машинно невидимым — четыре структурных причины — разобрано в предыдущем материале; здесь мы спускаемся на уровень глубже, к тому, как знание о компании устроено внутри модели.

Вероятностный рельеф, векторы и устойчивые связи

Эта устойчивость хорошо видна на примере векторных представлений (embeddings), то есть числовых образов текста, в которые переводятся слова, фразы и фрагменты контекста. Близость двух таких представлений часто измеряют косинусной мерой сходства:

cos(theta) = (x · y) / (||x|| ||y||)

Здесь x и y — два вектора. Один может соответствовать набору упоминаний бренда, другой — признаку вроде «корпоративная аналитика» или «дешевый потребительский сервис». Если косинус близок к единице, направления векторов похожи и система склонна рассматривать эти объекты как тесно связанные. Если значение невелико или меняется от контекста к контексту, связь оказывается слабой или нестабильной. У компании нет прямого доступа к таким векторам внутри закрытых коммерческих моделей. Но сама логика полезна: бренд выигрывает тогда, когда важные связи в его машинном образе оказываются не случайными, а повторяемыми.

Отсюда становится понятной и природа типичных искажений. Если название бренда двусмысленно, модель может слишком тесно притянуть его к общей категории и потерять индивидуальность. Если у компании несколько продуктовых линий с разными языками описания, внутри модели они могут не сложиться в единое семейство. Если внешняя среда лучше знает старую версию бренда, чем новую, модель будет «помнить прошлое» настойчивее, чем хотелось бы маркетингу. Если конкуренты обладают более четким и лучше подтвержденным семантическим контуром, запрос о классе решений приведет не к вашей компании, а к ним. И наоборот: если бренд систематически присутствует в языке рынка, в независимых источниках и в собственных ясных описаниях, модель с большей вероятностью соберет именно вас, даже если компания не самая крупная.

Три слоя внутреннего представления и новая диагностика

Внутреннее представление бренда удобно разделить на три слоя. Первый слой — параметрическая память. Это то, что модель усвоила во время обучения и последующей настройки: общие факты, типовые ассоциации, привычные связи между названием и свойствами. Второй слой — контекстная сборка. Это то, как бренд реконструируется прямо в момент ответа из скрытых состояний текущего диалога: какие слова пользователя активировали те или иные части машинного знания. Третий слой — внешнее подкрепление. В ответных и поисковых режимах сюда добавляются свежие веб-страницы, документы и базы знаний, которые влияют на окончательный вывод [4][6][7]. На практике именно взаимодействие трех слоев и определяет, как будет выглядеть бренд в ответе.

Такое устройство объясняет, почему многие компании ошибаются в диагностике. Когда бренд не называют в ответе, принято думать, что «модель нас не знает». Иногда это правда, но не всегда. Модель может знать компанию по названию и все равно не считать ее лучшим ответом на вопрос. Она может помнить продукт, но не связывать его с правильным сценарием использования. Может правильно цитировать сайт, но неверно ранжировать значимость признаков. Может опираться на актуальные веб-источники и тем самым переопределять старое внутреннее знание. Иначе говоря, проблема может быть не в наличии знания, а в его конфигурации.

Это особенно важно для брендов, которые привыкли опираться на силу собственной коммуникации. Внутри ИИ-системы выигрывает не только тот, кто громко говорит о себе, но и тот, о ком можно построить непротиворечивое представление. А непротиворечивое представление требует дисциплины. Название должно быть устойчивым. Категория — ясной. Продуктовая структура — различимой. Свойства — сформулированными прямо, а не только намеками. Внешние подтверждения — разнообразными и надежными. Тогда модель получает шанс не просто узнать бренд, а удержать его в памяти как устойчивую сущность.

Здесь появляется еще один важный вывод. Работа с внутренним представлением бренда не сводится к «оптимизации текста». По сути, это работа с эпистемической формой компании, то есть с тем, в каком виде компания существует как знание. Когда бренд плохо собран как знание, ИИ-система будет вынуждена достраивать пробелы вероятностно. Когда бренд хорошо собран, вероятность искажения снижается. В этом смысле современная борьба за видимость — это не только борьба за трафик, но и борьба за качество машинного понимания.

Такой взгляд полезен и потому, что возвращает разговор в зрелую плоскость. Не стоит спрашивать, «помнит ли нас ИИ». Стоит спрашивать, какие именно свойства нашего бренда устойчиво извлекаются, какие связи теряются, какие атрибуты переоцениваются, а какие вовсе не попадают в ответ. За этими вопросами уже начинаются и стратегия, и диагностика, и содержательная работа. Именно они отличают серьезное управление машинной видимостью от поверхностной гонки за случайными упоминаниями.

Что установлено надёжно

Уверенно можно говорить о том, что знание в современных языковых моделях распределено и извлекается контекстно. Из этого следует, что устойчивость бренда в ответах нельзя сводить к простому наличию названия в обучающем материале.

Где остаётся неопределённость

Менее надежно установлена точная геометрия этого знания в коммерческих закрытых системах. Мы видим общие механизмы по академическим работам, но не имеем прямого доступа к внутренним векторам и правилам сборки у каждой платформы.

Что это меняет на практике

Для компании это означает переход от языка «оптимизации текста» к языку эпистемической формы: нужно следить, какие свойства бренда извлекаются стабильно, а какие распадаются или искажаются.

Источники

[1] Geva M., Schuster R., Berant J., Levy O. Transformer Feed-Forward Layers Are Key-Value Memories. EMNLP, 2021

[2] Meng K., Bau D., Andonian A., Belinkov Y. Locating and Editing Factual Associations in GPT. NeurIPS, 2022

[3] Sakata M., Yokoi S., Heinzerling B., Ito T., Inui K. On Entity Identification in Language Models. Findings of ACL, 2025

[4] Wang M. et al. Knowledge Mechanisms in Large Language Models: A Survey and Perspective. EMNLP Findings, 2024

[5] Wang Y. et al. Factuality of Large Language Models: A Survey. EMNLP, 2024

[6] Yadav I., et al. External Knowledge Integration in Large Language Models: Survey, Methods, Challenges, and Future Directions. Semantic Web Journal, 2025

[7] Google Search Central. AI Features and Your Website. 2026

← Экономика невидимости: как компания теряет спрос еще до первого клика 6 / 24 Из каких источников ИИ собирает мнение о бренде — и почему сайт не главный герой →

Связанные материалы

Базовый текст 7 мин

Почему сильный бренд может быть невидим для ИИ-систем

Объясняет главный парадокс: бренд может быть хорошо известен людям и одновременно плохо различим для ИИ в момент реального выбора.

Открыть материал →

Базовый текст 7 мин

Из каких источников ИИ собирает мнение о бренде — и почему сайт не главный герой

Из каких слоёв ИИ собирает мнение о бренде: собственный сайт, поисковый контекст, независимые обзоры, пользовательские площадки — и почему сайт уже не единственный арбитр.

Открыть материал →

Следующий шаг

Что покажет диагностический слой отчёта

Если бренд устроен внутри модели как вероятностная сеть, то и диагностика должна быть послойной. В отчёте AI100 отдельный диагностический корпус вопросов показывает, как модель описывает бренд, когда его имя уже названо.

Посмотреть диагностические сценарии →