664просмотров
71.2%от подписчиков
4 марта 2026 г.
Score: 730
Google обучат понимать пользовательский интент на основе не только текста, но и визуального взаимодействия с интерфейсом. Вот основные аспекты работы, описанные языком поисковой оптимизации и анализа пользовательского пути: ➡️1. Интент как последовательность действий (User Journey) В SEO мы привыкли работать с интентом поискового запроса. Авторы исследования идут глубже и формализуют задачу извлечения интента (Intent Extraction) из целой «траектории» действий пользователя.
Траектория — это последовательность скриншотов и конкретных кликов/свайпов.
Цель — сгенерировать описание того, что пользователь на самом деле пытался достичь (например, «купить билет в Лувр»).
Для SEO это важно, так как подчеркивает: интент — это не статичное слово, а динамический процесс, который Google учится восстанавливать даже по обрывочным действиям. ➡️2. Двухэтапная архитектура: от микро-действий к макро-цели Исследователи предложили метод декомпозиции, который позволяет даже малым моделям (small models), работающим на устройствах, превосходить по качеству понимания гигантские LLM (такие как Gemini 1.5 Pro). Этап 1: Структурированное суммаризирование взаимодействия. Модель анализирует каждый отдельный шаг (скриншот + действие) и выделяет только важные детали экрана и суть клика. Этап 2: Извлечение итогового интента. На основе агрегированных мини-отчетов со всех шагов формируется финальное описание цели.
SEO-инсайт: Точность понимания повышается, когда алгоритм сначала «сканирует» отдельные блоки/этапы страницы (структуру), а затем синтезирует их в общее понимание ценности страницы для пользователя. ➡️3. Критерии «качественного» интента В работе четко определены три параметра, по которым оценивается, насколько правильно модель поняла пользователя. Эти критерии можно переложить на оценку качества контента: ☑️Faithfulness (Достоверность): описание должно соответствовать только тем действиям, которые реально произошли.
☑️Comprehensiveness (Полнота): наличие всей информации, необходимой для воспроизведения действий.
☑️Relevance (Релевантность): отсутствие лишнего «шума», не относящегося к достижению цели. ➡️4. Борьба с «галлюцинациями» и шумом в данных Авторы столкнулись с проблемой: при обучении модели часто «додумывают» детали, которых не было на экране (галлюцинируют). Чтобы решить это, они использовали Label Refinement — очистку обучающих данных от любой информации, которую нельзя напрямую вывести из скриншотов.
Это напоминает работу с поисковыми сниппетами: если в описании (description) указано то, чего нет на странице, это снижает доверие и качество опыта. Google стремится к тому, чтобы описание интента было максимально очищено от субъективности. ➡️5. Метрики понимания: BiFact vs BLEU Интересен подход к оценке. Традиционные SEO-метрики (вроде текстового совпадения ключей) здесь сравниваются с лексическими метриками (BLEU/ROUGE), которые работают плохо, так как оценивают только совпадение слов. Вместо них Google использует семантические метрики, такие как BiFact, которые разбивают интент на атомарные факты и проверяют их точность и полноту. Это подтверждает тренд на Entity-based SEO и переход от анализа «ключевиков» к анализу «смысловых сущностей». Почему это важно для будущего SEO? Поиск становится агентским: Google активно развивает модели, которые смогут не просто выдавать ссылки, но и выполнять действия за пользователя (UI Automation). Понимание интента — фундамент для этого. Визуальный контекст решает: Модели теперь «видят» структуру сайта (DOM, иерархию, кнопки) почти как человек. Оптимизация интерфейса (UI/UX) становится прямой частью поисковой оптимизации. Локальные модели: Акцент на малых моделях, работающих on-device (прямо в браузере или телефоне), означает, что понимание пользователя будет происходить мгновенно и приватно, без обращения к облачным серверам, что ускоряет персонализацию выдачи.