Как-то с Андреем Джилавдаровым общались на тему важности окружения ключа и сервиса, который хоть как-то это демонстрирует.
Мне это показалось интересным в том числе для проверки авторов (а заодно и проверки гипотезы). Т.е. не вписал ли автор наш ключ в предложение в стиле «Закажите у нас пожалуйста SEO под ключ!». Предложение же бесполезное, это факт. Ключ же вставлен, но он объективно притянут за уши сюда и предложение создавалось ровно для того, чтобы выполнить требования из технического задания для копирайтеров.
Я с того момента решил для себя собирать базу терминов и их популярности (чтобы иметь хотя бы какой-то IDF). Сейчас в базе данные из 100 000 урлов разных тематик (брал ключи просто скопом из базы Keyso).
А еще на Python написал небольшой скрипт, который проверяет долю бесполезных слов (с низким IDF). Порог «бесполезности слов» подбирал опытным путем, т.е. ставил и смотрел какие слова вылетают, минимум 80% должно было быть явного мусора.
Средний порог бесполезных слов
Я сделал лишь небольшую выборку (долго парсить) из страниц инфо или услуги (руками выкидывал каталоги, т.к. библиотека Tratilatura может криво доставать контент из них). Всего взял в исследование 150 запросов (опять же — старался брать максимально разные из Keyso, самые частотные из 2-3 слов).
Но картинка очень сглаживается, получаем что в среднем все сайты в ТОП-50 укладываются в порог от 25 до 30% бесполезных слов в предложении с ключевым запросом.
Проверка своей страницы из ТОПа
Я когда всё собрал, думал среднее одинаковое — окей. Пробил свою страницу, которая стоит в ТОП-3 Яндекса по всем запросам:
Да, действительно, у меня есть много предложений, где мой ключ просто окружен водой, т.е. бесполезными словами. Решил собрать по этому же ключу ТОП и посмотреть результаты по нему (пропущенные значения — это не смог получить данные):
Но помимо этого у меня неплохо подогнана страница по текстовому анализу (на примере нейрона):
И можно спокойно пихать ключи в мусорные предложения, если так получилось и не париться?
А как выглядят другие ТОПы?
Поделюсь скриншотами нескольких примеров + нанес линию тренда на них:
Как видим, что сказать однозначно, что «делай так — будешь в ТОПе» нельзя, ровно как и о других факторах ранжирования. Но эти средние 30% говорят о том, что у сайтов большинство ключей вписано в какие-то более длинные предложения с тяжелыми по IDF словами. И даже если у вас есть недочеты — это не значит, что шансов на ранжирование у вас нет.