В результате недавнего взлома базы данных Google стали известны новые детали о факторах ранжирования в их поисковой системе. В этой статье мы кратко рассмотрим эти факторы. В конце мая в сеть попали документы, раскрывающие работу алгоритмов поиска Google.
Эта утечка является самой крупной за последние 10-15 лет и связана с алгоритмами ранжирования поиска Google. Документы включают 2596 модулей с 14 014 атрибутами. Модули охватывают такие компоненты, как YouTube, Assistant, Books, поиск видео, ссылки, веб-документы, инфраструктура сканирования, система внутреннего календаря и People API.
30 мая представитель компании Дэвис Томпсон подтвердил подлинность документов, но предупредил о возможных ошибочных выводах, основанных на «вырванной из контекста, устаревшей или неполной информации». Несмотря на то, что эти данные часто называют «алгоритмом Google», это не совсем так. Документы содержат важные сведения о данных, которые Google использует для улучшения поисковой выдачи, и которые помогут в SEO оптимизации сайта.
Утечка показала, что Google часто вводит в заблуждение, описывая факторы, влияющие на успешное ранжирование сайта в поисковой системе, особенно в отношении полезного контента. Известное утверждение «контент - король» теперь вызывает сомнения. Также выяснилось, что некоторые сигналы, которые представители компании отрицали как влияющие на ранжирование, на самом деле присутствуют в документации.
Важно отметить: в документах не указано, какой вес имеют различные факторы ранжирования – они просто перечислены.
На основе содержания документов мы выделили несколько групп факторов, которые действительно влияют на ранжирование сайтов в Google.
Первый фактор – возраст сайта, или авторитет домена. Несмотря на многократные заявления представителей поисковой системы об отсутствии так называемой «песочницы» для новых ресурсов, похоже, она всё-таки существует. Google отдает приоритет сайтам с историей.
Второй фактор – доменное имя и названия субдоменов. Ранее в Google утверждали, что не имеет значения, используете ли вы в структуре сайта поддомены или подпапки – эти варианты эквивалентны. Однако это важно учитывать сайтам с региональными поддоменами.
Третий фактор – сила бренда. Поисковая система оценивает популярность бренда по количеству его упоминаний в интернете, и эти упоминания не обязательно должны сопровождаться ссылками на сайт. В результате большинству небольших бизнесов и сайтов пробиться в топ почти нереально – придется развивать бренд и работать над репутацией, формируя лояльную аудиторию.
Поведенческие факторы
Хотя влияние поведенческих факторов традиционно связывают с Яндексом, утечка данных подтвердила, что пользовательское поведение на странице также влияет на ранжирование в Google. Несмотря на публичные заявления и интервью, где представители Google подчеркивали важность релевантности, качества и пользовательского опыта, они отрицали использование конкретных показателей, таких как рейтинг кликов или показатель отказов, в качестве факторов ранжирования.
Еще одним неожиданным открытием стало то, что данные о кликах, переходах и поведении посетителей берутся не только из Google Analytics, но и напрямую из браузера Chrome. Это подтверждает модуль ChromeInTotal в слитых данных. Представители Google неоднократно отрицали использование данных браузера в алгоритмах ранжирования.
Проще говоря, Chrome передает кликстрим – все страницы, которые вы посещаете через этот браузер, передаются в Google, и эти данные учитываются при ранжировании.
Передачу данных обеспечивает система NavBoost, которая анализирует количество поисковых запросов по ключевому слову, определяет тенденции поискового спроса, количество кликов по результатам поиска, CTR и классифицирует клики на «плохие» (badClicks), «хорошие» (GoodClicks), «долгие» (LastLongestClicks) и другие.
Еще одно интересное открытие – Google может использовать данные из системы EWOK, аналогичной Толоке от Яндекса, для оценки поисковой выдачи. Это означает, что в ранжировании участвуют не только автоматические алгоритмы, но и пользователи, которые определяют, какой сайт лучше по определенному запросу.
Ссылочные факторы
Разнообразный и релевантный ссылочный профиль положительно влияет на ранжирование сайта. Google анализирует анкорный текст, количество трафика на странице, на которую ведет ссылка, и наличие ссылочного спама.
PageRank, который долгое время был ключевым компонентом алгоритма Google, остается важным фактором, особенно для главной страницы сайта. Новые документы временно получают значение PageRank домашней страницы, пока не приобретут собственный показатель. Также очевидно, что ссылки с более популярных сайтов вносят больший вклад в PageRank.
Google классифицирует ссылки по трем уровням: низкое, среднее и высокое качество. Уровень определяется количеством кликов по ссылке. Если по ссылке переходят, она передает сигналы ранжирования; если нет – она считается низкокачественной. Некачественные ссылки не вредят рейтингу сайта, Google их просто игнорирует.
Свежесть, актуальность и безопасность контента
Содержимое тега title по-прежнему имеет значение. У Google есть функция titlematchScore, которая измеряет, насколько заголовок страницы соответствует запросу.
Факторы EEAT (экспертность, авторитетность, надежность) также влияют на ранжирование, хотя конкретное влияние каждого элемента не ясно. Известно, что Google хранит информацию об авторах контента и оценивает их авторитетность.
Документы из группы YMYL (Your Money Your Life), включающие темы медицины, финансов и новостей, ранжируются на основе оригинальности контента. У Google есть классификаторы, которые генерируют отдельные оценки для YMYL Health и YMYL News.
Свежесть и актуальность информации также играют роль. Google оценивает даты в подписях, URL-адресах и содержимом страницы.
Важная информация из документов
В Google существует функционал под названием «Twiddlers», представляющий собой опции переранжирования, которые изменяют рейтинг документов в поисковой выдаче. Причины снижения рейтинга могут включать:
- Несоответствие ссылки и контента страницы, на которую она ведет.
- Негативные сигналы от пользователей.
- Низкое качество обзора продукта.
- Релевантность местоположения – Google старается выводить на первые места сайты, соответствующие геолокации пользователя.
- Полное совпадение доменного имени с поисковым запросом (например, top-sneakers-ever.com).
- Неприемлемый контент (например, порнография).
- Google может применять различные факторы ранжирования или алгоритмы для определенных категорий поиска, таких как новости, локальный поиск, путешествия или ecommerce.
Например:
Для локальных сайтов важны упоминания в региональных агрегаторах и обзорах, картографических сервисах, каталогах.Для сайтов о путешествиях важна информация о бронировании и ценах.
Новости требуют своевременного, правдивого и актуального контента.
В поисковой системе Google существуют белые списки сайтов для определенных «чувствительных» тем, таких как COVID и выборы в США. Подозревается, что такие списки составляются на основе данных официальных источников.
Документы показывают, что Google хранит копию каждой версии каждой страницы, которую он когда-либо индексировал. Это означает, что поисковик может отслеживать все изменения, внесенные на страницу. Однако при анализе ссылок Google учитывает только последние 20 изменений URL-адреса.
Для борьбы со спамом, связанным с ручными и автоматическими кликами, Google использует историю файлов cookie, данные входа в систему Chrome и обнаружение шаблонов в поведении пользователя.
Полный список сигналов можно найти по ссылке. Подробный анализ утекших документов представлен в материалах Рэнда Фишкина и Майка Кинга. Все источники на английском языке вы можете найти в открытой сети.
Как попасть в топ Google: советы вебмастерам и владельцам сайтов
-
Оптимизация для удобства пользователей:
- Создайте понятную структуру сайта и продуманную навигацию.
- Внедрите перелинковку.
- Добавьте конверсионные элементы и блоки, удерживающие внимание, такие как видео, фото, калькуляторы и конструкторы. Это улучшит поведенческие факторы ранжирования.
-
Развитие бренда:
- Поддерживайте активность в соцсетях.
- Ведите блоги на тематических площадках.
- Формируйте лояльную аудиторию, включая офлайн, которая будет искать вас в поиске по названию сайта или компании.
- Работайте над репутацией в сети.
- Инвестируйте в традиционный PR и рекламу в СМИ. В конкурентных нишах обогнать крупные бренды сложно, поэтому важно развивать свой бренд.
-
Создание качественного ссылочного профиля:
- Используйте технологию PromoPult Max для создания разнообразного и релевантного ссылочного профиля.
-
Оптимизация заголовков страниц (title):
- Убедитесь, что заголовки отвечают на ключевые запросы пользователей и соответствуют содержанию страницы.
- Привлекательные заголовки увеличивают CTR в поисковой выдаче и дают Google положительные сигналы.
-
Использование авторитетных авторов контента:
- Особенно важно для сайтов YMYL (Your Money Your Life).
- Правильно размечайте данные на страницах авторов, чтобы передать их в Google.
-
Регулярное обновление контента:
- Поддерживайте актуальность вашего контента.
-
Использование отраслевых сигналов ранжирования:
- Региональные сайты должны работать над продвижением в локальном поиске.
- Новостные сайты должны регулярно публиковать свежий контент.
- Агрегаторы для путешественников должны размещать обзоры на туры, информацию о ценах и бронировании.
Совет пользователям
Если вы не хотите, чтобы данные о вашем поведении на сайтах отправлялись в Google, используйте альтернативные браузеры, такие как Opera или Firefox, вместо Chrome.