Скрипт формирует список ключевых слов по содержимому сайта


Содержание

Автоматический подбор ключевых слов для текста на php

При добавлении нового контента на сайт возникает вопрос создания списка ключевых слов для meta тэга. Для этого нужно из текста который вставляется на сайт составить список всех слов из текста и отсортировать их по частоте употребления. Дальше нужно откинуть все слова, которые меньше пяти символов и все вспомогательные слова. Несколько примеров

При добавлении нового контента на сайт возникает вопрос создания списка ключевых слов для meta тэга.

Для этого нужно из текста который вставляется на сайт составить список всех слов из текста и отсортировать их по частоте употребления. Дальше нужно откинуть все слова, которые меньше пяти символов и все вспомогательные слова.

Дополнительно можно создать базу с словами, которые не должны использоваться для ключевых слов и отфильтровать массив слов по этой базе.

Вот еще одна функция Получения ключевых слов

не плохо ни правда ли?!

Дальше, можно поступить следующим образом: просеять все эти слова по базе заведомо подготовленных ключевиков. И оставить только нужные. У меня такая база создавалась несколько лет вручную. Это база тегов, которыми подкрепляется каждая статья.

Простой скрипт для ключевых слов

Так как я начала заниматься программированием совсем недавно, прошу помощи.
Задача: написать простой скрипт для генерации ключевых слов по следующей схеме —

Или с постфиксом

Или одновременно с префиксом и постфиксом

Ключевых слов более 10 000.

Буду очень признателен тому, кто помимо реализации на php также поделится вариантом на C#.

05.10.2014, 19:54

простой скрипт
помогите пожалуйста) нужно написать скрипт, который бы проверял правильность ввода ФИО сделала.

Простой скрипт
Здравствуйте, нужна помощь с написанием простого скрипта: Вводишь число, нажимаешь кнопку, должно.

Простой скрипт авторизации
Нашел такой скрипт, понимаю что он устарел и не безопасный но с чего то надо начинать. Почему у.

Не работает простой скрипт
Добрый всем день! Помогите разобраться..вот скрипт: 12 05.10.2014, 20:08 2

Данный код будет к каждому ключевому слову добавлять префикс и постфикс следуя строгому порядку, то есть количество значений префиксов, постфиксов, и ключевых слов должны быть равны.

Добавлено через 1 минуту
Думаю реализация на C# будет такой же, поменяется только синтаксис.

05.10.2014, 20:23 [ТС] 3

Данный код будет к каждому ключевому слову добавлять префикс и постфикс следуя строгому порядку, то есть количество значений префиксов, постфиксов, и ключевых слов должны быть равны.

Добавлено через 1 минуту
Думаю реализация на C# будет такой же, поменяется только синтаксис.

5 скриптов AdWords, которые облегчат вам жизнь

В этой статье вы найдете 5 бесплатных скриптов AdWords для отслеживания показателя качества, обнаружения битых ссылок, группировки и конфликта «ключевиков».

Скрипт отслеживания показателя качества (Quality Score Tracker)

В AdWords есть показатель качества, который влияет на все – от позиции рекламного объявления до стоимости клика.

Этот инструмент сохраняет данные о показателях качества аккаунта, кампании и группы «ключевиков» для первых 50 000 фраз в формате CSV.

Добавление новых и удаление старых страниц приводит к появлению нерабочих ссылок. Ошибка 404 – головная боль, так как сокращает целевой трафик и съедает бюджет.

Важно, чтобы landing page содержала валидные URL. Включите скрипт проверки ссылок – и выявляйте ошибки адресов вовремя. Этот инструмент уточняет наличие целевых страниц для всех объявлений и ключевых слов аккаунта. При обнаружении косяков вы получаете email-уведомления. Дополнительно поддерживается подписка на ежедневные сводки.

Для работы с этим скриптом используется панель управления в виде электронной таблицы:

Каждый URL проверяется не чаще одного раза в день. Ежедневная квота – 20 000 адресов страниц.

Скрипт обнаружения конфликта ключевых слов (Keyword Conflict Detection)

Негативные слова – по сути это «минус-слова», которые создаются, чтобы защитить кампанию от нерелевантных поисковых запросов. Но негативные «ключевики» могут ошибочно блокировать и релевантные запросы, что снижает эффективность рекламной кампании.

Распространенная причина – негативное слово создавалось с типом соответствия больше допустимого.

Допустим, мы рекламируем свадебное агентство. У нас есть две группы объявлений.

Первая группа включает «свадебный фотограф Москва», «фотограф на свадьбу», «фотографировать свадьбу».

Вторая группа – «тамада на свадьбу», «ведущий на свадьбу», «свадебный тамада». В этой группе мы отметили минус-слова «фото», «фотография», «фотографировать». Все верно, но в результате минус-слова этой группы блокируют показ объявления по запросу «свадебный фотограф Москва». В этом и состоит конфликт «ключевиков».

Скрипт находит такие конфликты, сохраняет в таблицу и рассылает email-уведомления. Для устранения удалите негативные слова, которые вызвали конфликт.

Скрипт группировки ключевых слов (Keyword Labeler)

Этот скрипт группирует ключевые слова по заданному вами признаку. Например, он может отфильтровать все фразы, содержащие названия брендов, или нацеленные на конкурентов. Либо вы задаете несколько признаков одновременно.

Скрипт обнаружения аномалий в аккаунте (Performance Anomalies)

Этот скрипт выполняет более сложную функцию, но также простой в применении. Он проверяет, есть ли отклонения среди «ключевиков». При наличии – им присваиваются ярлыки.

Аномалии – это ключевые слова или группы ключевых фраз, которые работают иначе, чем остальные. Допустим, группа состоит из 15 ключевиков, и 2 из них набирают больше кликов. Или одна из групп съедает больше бюджета и вы хотите ее контролировать.


Обратите внимание:

  • Если для управляющего аккаунта вам нужны такие же функции скрипта, как в простом аккаунте, нужно его модифицировать.
  • Если аккаунт превышает допустимые объемы обработки данных, запускайте скрипт несколько раз до того, как он завершит свою работу.
  • Протокол API в AdWords периодически меняется, поэтому следите за актуальностью скриптов во избежание ошибок.

Надеемся, что эти 5 скриптов помогут в ваших рекламных кампаниях AdWords.

Написание скрипта, определяющего спрос запросов по поисковым системам

На сегодняшний день складывается ситуация, при которой компании, занимающиеся продвижением сайтов в поисковых системах, особое внимание уделяют продвижению по определенным ключевым словам и/или словосочетаниям.

Выбор ключевых слов – задача нелегкая и достаточно кропотливая, от выполнения которой зависит исход продвижения информационного ресурса.

Зачастую специалист по продвижению сайтов получает список ключевых слов и/или словосочетаний, по запросу на которые заказчик желает видеть свой интернет-ресурс на определенных позициях в поисковых системах.

При этом считается, что заказчик очень хорошо знаком со сферой своей деятельности и точно знает, что предложенный им список ключевых слов и/или словосочетаний является оптимальным. Однако в большинстве случаев список целевых запросов можно расширить, а бесполезные запросы – исключить.

Точный и полный выбор целевых запросов наиболее значим для сфер предпринимательской деятельности, предлагающих услуги и/или товары, потребность в которых сравнительно невелика. Здесь лишь можно посоветовать по возможности расширить список ключевых слов и/или словосочетаний.

Для достаточно популярных в сети Интернет областей бизнеса особенно важен поиск новых целевых запросов, позволяющих получить превосходство над конкурентами.

Случается, что слова подобраны правильно, но переходов на сайт с поисковых систем нет. Но стоит поменять местами слова в словосочетании, добавить союз, и ситуация может поменяться.

Для выбора ключевых слов и/или словосочетаний можно воспользоваться специальными сервисами, которые предлагают поисковые системы, например: «Подбор ключевых слов» Яндекса или «Статистика по поисковым запросам» Рамблера. Они могут дать ответ на вопрос, что именно и как часто ищут пользователи Интернета и т.д.

2. С чего начать выбор ключевых слов

При выборе ключевых слов и/или словосочетаний необходимо иметь представление о том, что хочет найти пользователь в настоящее время, в какой стадии готовности купить что-либо он находится. Идеальный вариант – поставить себя на место потенциального клиента и представить, что он мог бы ввести в строку поиска.

Обычно составляется первичный список ключевых слов и/или словосочетаний – основа, от которой следует отталкиваться в дальнейшем. В список могут входить не только название выпускаемого товара (предоставляемой услуги), но также ряд задач, для решения которых они предназначены.

После того как первичный список ключевых слов и/или словосочетаний составлен, можно перейти к его анализу. Для начала в поле поиска интересующей Вас поисковой системы начинайте вводить слова и словосочетания списка. При этом внимательно изучайте выдачу поисковой системы на введенный Вами запрос.

Просматривайте каждую страницу из выдачи (например, первую десятку), смотрите, какие товары и услуги предлагают сайты. Проанализируйте, насколько совпадает перечень товаров и услуг, предлагаемых этими сайтами, с тем, что продаёте вы; или, несмотря на общие ключевые слова, речь на этих сайтах идёт о других продуктах. При этом не забывайте добавлять в Ваш список новые или отбрасывать ненужные ключевые слова и/или словосочетания.

Итак, после проведенной достаточно кропотливой работы по выбору целевых запросов, отнявшей у Вас не один час (а то и дней), Вы станете обладателем полезной информации:

  • будет составлен список ключевых слов и/или словосочетаний, наиболее полно отражающий характер Вашей профессиональной деятельности;
  • будет очерчен круг Ваших основных конкурентов в представленном секторе рынка.

3. Анализ поискового спроса

Теперь список составлен, однако он содержит более сотни ключевых слов и/или словосочетаний. Для успешного же продвижения Вашего сайта по выбранным целевым запросам требуется провести анализ поискового спроса, чтобы понять, каков реальный объём спроса на выпускаемые товары и предоставляемые услуги, которые предлагает Ваш сайт.

Например, для определения спроса по целевым запросам можно воспользоваться специальным сервисом Яндекс.Директ «Подбор ключевых слов» . Введя в поле «Ключевые слова и словосочетания» слова из Вашего списка, можно узнать реальный спрос (в месяц) по заданным целевым запросам (существует также возможность показать спрос только для интересующего Вас региона).

Заметим, что характер пользовательского спроса в сети интернет (в частности, в Рунете) для различных поисковых систем отличается незначительно. А так как известно, что общая доля Яндекса в поисковом спросе Рунета составляет порядка 50-60%, то для получения реального спроса по заданным ключевым слова и/или словосочетаниям во всем Рунете необходимо учитывать результаты, полученные с помощью сервиса Яндекса, умножив их, при этом, на коэффициент, равный 1,7-2,0.

4. Скрипт для определения спроса запросов по поисковым системам

Теперь давайте попробуем самостоятельно написать скрипт для определения спроса по выбранным ключевым словам и/или словосочетаниям на основании статистики Яндекса.

Подобный сервис (при некоторых доработках) может быть полезен при анализе большого числа целевых запросов, результаты которого могут быть напрямую сохранены в текстовый файл и использованы в дальнейшем по Вашему усмотрению.

* <
font-family: Arial, Helvetica, sans-serif;
font-size: 12px;
>

Ключевые слова или словосочетания:

(.*)

s+

(d<1,>)

/i», $str, $res);

// Выводим каждую пару «Слова» — «Показов в месяц»
for ($i = 0; $i
:

Примечание: алгоритм работы Яндекса постоянно меняется, поэтому при выборке «Слова» – «Показов в месяц» с помощью регулярного выражения следует следить за исходным кодом отдаваемой при запросе к Яндексу страницы. Например, в недавнем прошлом использовалось такое регулярное выражение:

«/

(.*s+.*)

s+

(d<1,>)

/i»

сегодня же используется это (см. скрипт):

«/

(.*)

s+

(d<1,>)

/i»

5. После анализа поискового спроса

После того как основная работа по анализу поискового спроса будет завершена, следует провести заключительный этап, в ходе которого:

  1. необходимо исключить самые бесполезные для продвижения целевые запросы;
  2. необходимо отобрать наиболее весомые ключевые слова и/или словосочетания, точно отражающие характер Вашей деятельности;
  3. необходимо выделить несколько средних запросов, соответствующие смыслу предлагаемого Вами товара и/или услуги.

Если все было сделано правильно, в Вашем списке должно остаться не более 30 ключевых слов и/или словосочетаний (при желании их можно сгруппировать в близкие по смыслу пары или тройки слов), пригодных для продвижения.

Получив список целевых запросов на продвижение и проанализировав спрос по данным ключевым словам и/или словосочетаниям на основании статистики, можно с достаточно высокой вероятностью спрогнозировать количество потенциальных клиентов сайта.

Также заметим, что результаты, полученные в ходе анализа спроса, стоит сопоставить с реальной посещаемостью сайта; если же в условиях жесточайшей конкуренции реальная посещаемость значительно ниже 5-10 % общего спроса, то профессионально выполненная поисковая оптимизация может принести значительный прирост аудитории сайта.

Как правильно и с помощью каких сервисов подобрать ключевые слова, чтобы получить больше трафика

Привет, дорогие читатели!

Сайт будет приносить денежку тогда, когда о нем узнают и начнут его посещать. Здесь ваш главный помощник – поисковая система. Но она не обратит на вас внимание, если вы не обозначите контент ключами.

Сегодня я научу вас делать подбор ключевых слов в программах и сервисах так, чтобы вы продвинулись в результатах поиска и получили много трафика.

Что означает


Подобрать ключевые слова (keywords) – это значит выбрать поисковые фразы, которые помогут занять первые места в поисковой выдаче. Проще говоря, чтобы люди могли с легкостью найти вас. Походу дела мы отсеиваем конкурентные, нерелевантные запросы.

3 стратегии продвижения

  1. Точечная. Продвигаетесь по нескольким высокочастотным запросам с минимальной конкуренцией.
  2. Обширная. Оптимизация по списку, где больше среднечастотных и низкочастотных ключей.
  3. Смешанная. Семантическое ядро состоит из 12 % высокочастотных, 30 % среднечастотных и 58 % низкочастотных запросов.

Точечной стратегии получается следовать не всегда. Иногда все высокочастотные запросы заняты конкурентами.

Сбор ключей

Создание семантического ядра начинаем с анализа темы сайта, выбора фраз, по которым целевая аудитория будет искать вас.

Создаем список

Нам нужно составить список в таблице всех слов и фраз для поиска. Сейчас мы будем брать их из головы и у конкурентов.

Начните с мозгового штурма. Ответьте на вопросы:

  • Что вы предлагаете посетителю и зачем?
  • Какими запросами будут пользоваться люди, чтобы найти ваш контент?

Спросите коллег, знакомых и семью, с помощью каких слов они искали бы ваш сайт. Если у вас интернет-магазин, сделайте опрос среди покупателей. Можете предложить взамен плюшечку – скидку 10 % или бесплатную доставку.

Наташе хотелось больше трафика. В погоне за цифрами она стала использовать коммерческие ключи на информационном сайте. В статье про выращивание цветов добавила “купить семена эхинацея”. К ней заходили купить, а не почитать. Не находили то, что нужно и уходили с сайта. Сайт понизили в поисковой выдаче из-за поведенческих факторов, и репутация ухудшилась.

Илон Маск рекомендует:  Что такое код pdf_show_boxed

Создайте план сайта или опирайтесь на уже имеющийся.

Пример страниц интернет-магазина:

  • Главная страница. Используется основной ключ – 10 % от СЯ, 30 % среднечастотных и 80 % низкочастотных запросов. Не спамим.
  • Услуги. На основной странице главный ключ услуги. Например, “маникюр в Пашковке”. Потом у нас идут подстраницы с описанием каждого вида: с нанесением шеллака, с декоративным рисунком. И под все это мы подбираем низкочастотные фразы.
  • Каталог товаров. Добавляем высокочастотные и среднечастотные ключи, описывающие товар в целом. Например, “недорогие костюмы танца живота в Новосибирске”. Страница делится на подкатегории – конкретные виды товаров. В нашем случае это “Шаровары с пайетками”, “Пояса”, “Комплекты из лифа и юбки” и т. д.
  • О нас. Описание компании, деятельности. Активно пользуемся ключами с названием фирмы или бренда, сферой деятельности, решением проблемы.
  • Партнеры. Информация о поставщиках, вакансии.
  • Покупателям. В FAQ вставляем фразы, связанные с проблемами и решением. В условиях доставки и способах оплаты делаем акцент на регионы.
  • Новости. Статьи, отсортированные по датам с тематическими и брендовыми ключами.
  • Личный кабинет. Закрыт от индексации. С ним мы не работаем.
  • Контакты. Отдельная страница с информацией и формой обратной связи.

Смотрите на название разделов, берете оттуда слова. К примеру, продажа средств для личной гигиены. Включаем в семантическое ядро название и виды товаров: ромашковое мыло, шампунь без SLS с натуральным экстрактом череды.

Изучаем конкурентов. У нас есть 2 способа:

  1. Вручную просматриваем результаты поиска по главным и вторичным запросам. Можно оценить конкуренцию. Если много контекстной рекламы, трастовых и крупных сайтов, то пробиться молодому проекту невозможно. Отказываемся от этого ключа. Минус: выбирать ключи из всего контекста придется вручную. Смотрим на ключи в description и title в коде страниц конкурентов.
  2. Парсим фразы, слова из разделов, заголовков и статей. В этом помогут онлайн-сервисы: Screaming Frog, NetPeak Spider.

Разберемся, как нарыть еще поисковых выражений, когда фантазия на пределе.

Введите тематическое слово. Посмотрите на правую колонку. Там показано, что еще люди ищут по этой теме. Не уточняйте запрос, и тогда в левой колонке результатов увидите несколько слов, которыми можно пользоваться.

  • Изучите подсказки поисковика

Введите в строку главное слово по теме и посмотрите, какими запросами еще пользуются.

  • Пользуйтесь словарем синонимов

Одну и ту же вещь люди называют по-разному. Кто-то говорит “лифчик”, другие – “бюстгальтер”. И так происходит со всеми вещами.

Не забудьте про сленговые выражения, которыми пользуется целевая аудитория. Почитайте форумы, обсуждения в соцсетях.

Подходящие слова компонуем в таблицу Excel или Google. Как удобнее. Не спешите добавлять ключи на сайт. Впереди у нас проверка, чистка.

Вот как примерно должен выглядеть список на этом этапе.

Какие виды ключей подойдут

Какие ключи подходят именно вам:

  • Коммерческие. Семантическое ядро состоит из слов вроде “купить”, “заказать”, “оплатить”. Используется для интернет-магазинов и других платных проектов. Не подходит для информационных сайтов и блогов.
  • Навигационные. По ним пытаются найти физический или интернет-адрес. Вводят название сайта, компании. Я вечно вбиваю в поиск “гугл таблицы”. Все никак не сделаю закладку. Кто заходит на знакомые сайты через поиск, пишите комментарии. Проверим, сколько нас таких.
  • Информационные. Это фразы для поиска информации. Они отвечают на вопросы, решают проблемы. Пример: “как очистить печку от жира”.

Молодой сайт лучше оптимизировать под низкочастотные запросы. Чтобы определить, к какому типу относится ключевое слово, пользуйтесь табличкой.

Тип частотности Количество показов в месяц Количество слов
Самые высокочастотные (СВЧ) 1 000 не менее 3

Яндекс.Вордстат

Собранные на предыдущем этапе слова будем прогонять через Яндекс.Вордстат. Сейчас мы проверим частоту ключей, удалим ненужные.

Что необходимо убрать:

  1. СВЧ и ВЧ.
  2. Нерелевантные слова. Например, вы учите людей вязать, поэтому ключ “купить вязаный голубой шарф” явно не подходит.


Открываем Яндекс.Вордстат. Вводим ключ в строку и нажимаем “Подобрать”.

Напротив ключа вы увидите, сколько раз в месяц им пользуются. У меня 653 показа – низкочастотный запрос, который я возьму за основной.

У геозависимых запросов проверьте частотность по регионам. Снизу строки Wordstat кликните “Все регионы”. Отметьте места, которые имеют значение. Для получения результатов нажмите “Выбрать”.

Мне хотелось уточнить запрос, чтобы отсеять лишнее. К сожалению, использовать формулу: “!ключевое слово!” – невозможно. Яндекс.Вордстат выдает ошибку.

Пользуйтесь оператором “(запрос|запрос|запрос)”, чтобы быстрее проверить частотность. Вы увидите информацию сразу о нескольких ключах одновременно. Больше 5 фраз вводить одновременно нельзя.

Оператор “-” убирает ненужные слова. Допустим, продажа элитных пластиковых окон. Тогда мы формулируем запрос так: “пластиковые окна -дешевые -шторы -ремонт -как установить”. В итоге мы получаем целый список годных слов для продвижения.

Другие полезные операторы:

  • “+” – добавляйте к запросу, когда нужна ключевая фраза со стоп-словами (союзами, предлогами). Пример: +как+диастаз.
  • “[]” – слова, заключенные в квадратные скобки, идут в том порядке, в каком вы их написали. Важно для оценки частотности запроса с дополнительными ключами. Пример: “[как проверить диастаз]” (без кавычек).

Для удобства установите плагин Yandex Wordstat Assistant для браузера. Не придется копировать и вставлять по одному ключу в вашу таблицу. Сохраняете в плагине каждое выражение, потом сразу все копируете и добавляете в Excel вместе с частотой.

Чтобы добавить слово в Yandex Wordstat Assistant, нужно нажать на “+” рядом.

В Яндекс.Вордстате можно собрать семантическое ядро для небольшого проекта. Но это требует много времени, усидчивости и терпения. Вряд ли вы сможете публиковать по статье в день при таком темпе работы. Поэтому советую автоматизировать процесс в программах. А Вордстат оставить для YouTube, соцсетей и мелких проектов.

Slovoeb

Скачиваем Словоеб с официального сайта. Распаковываем архив и открываем программу.

Шаг 1. Выбираем “Создать новый проект”.

Шаг 2. Откроем настройки, чтобы сделать парсинг продуктивным. В общем разделе я ограничила размер поисковых фраз до 7 слов. Слишком большие не нужны.

Затем заходим в раздел “Yandex.Wordstat”. Выбираем диапазон частотности ключей. Нам не нужны те, что набирают от 0 до 100. У себя я выставила от 300 до 3 500 показов в месяц.

Проследите, чтобы стояла галочка напротив сбора частотности с кавычками и восклицательным знаком.

Чтобы получить доступ к подбору фраз из левой колонки, необходимо привязать Яндекс-аккаунт. Для этого перейдите: “Настройки” → “Yandex.Direct”. Укажите данные профиля в формате “логин:пароль”. К примеру, “Kusachka:1234”. Нажмите “Сохранить изменения”.

Шаг 3. Добавляем стоп-слова, которые программа проигнорирует. Это мусорные союзы, предлоги и нерелевантные слова. Для статьи “Как проверить диастаз” это будут: “убрать”, “упражнения”, “операции”, “цена”, “лечение” и т. д.

Вы можете загрузить их из txt-файла или написать вручную.

Шаг 4. Собираем семантическое ядро из левой колонки. Загружаем из txt-файла или пишем вручную.

Обязательно уточняйте запросы, чтобы не делать двойную работу. Когда у меня были в списке “признаки”, “симптомы” без слова “диастаз”, попадали названия других болезней.

Я отметила галочкой “Не добавлять фразу, если она уже есть в других группах” и вам советую. Не будет повторений и путаницы.

Чтобы запустить процесс, нажмите “Начать сбор”.

Шаг 5. Удаляем мусор из списка до сохранения. К сожалению, иногда попадаются лишние слова. Отмечаем их галочкой. Во вкладке “Данные” кликаем на красный крестик.

Шаг 6. Узнаем настоящую частотность. Мы должны узнать, сколько раз люди реально пользовались этими выражениями для поиска. Нажимаем на лупу и проверяем частотность с восклицательным знаком.

Как видите, результат отличается в 3 – 4 раза. Даже самый крупный СЧ запрос, по которому я хочу продвигаться, на деле оказался НЧ. А некоторые выражения и вовсе оказались бесполезными, потому что их используют раз в месяц.

Бесполезные ключевые слова удаляем как в 5-м шаге.

Шаг 7. Экспортируем файл в таблицу Excel. Кликаем на значок программы вверху. Выбираем папку и нажимаем “Сохранить”.

Шаг 8. Упорядочим слова по частотности в таблице. Выделяем все. Нажимаем “Сортировка и фильтр” в правом углу.

Выбираем “Настраиваемая сортировка”.

Сортируем по частотности *!*, значениям. В порядке возрастания, когда первым делом нужны НЧ запросы. По убыванию, если основа стратегии продвижения – ВЧ ключи.

Теперь у нас есть готовое семантическое ядро для статьи.

Для магазина проделываем ту же работу, только ориентируемся на коммерческие запросы. Проверяем конкурентность вручную или с помощью сервисов. О них я расскажу ниже.

Мутаген

Я обеими лапками за это сервис. Он проводит анализ чистой и базовой частотностей. Можно узнать конкуренцию в баллах, сколько просмотров наберет рекламное объявление в Директе, и количество хвостов у ключа.

Мутаген дарит 10 бесплатных проверок ежедневно. Но тут есть подвох. Во-первых, вы должны единоразово пополнить баланс на 2 рубля. Во-вторых, бесплатно доступна проверка по одному ключу. Значит, за день вы получите отчет только по 10 фразам. Если список состоит из 40 слов, уйдет 4 дня на проверку.

Но есть и хорошая новость. Парсинг 1 ключа стоит 2 копейки. Массовая проверка на конкурентов, хвосты, просмотры 24 ключей – все это обойдется в 7,2 рубля.

Сейчас я покажу определение конкурентности по запросам. Перед этим зарегистрируйтесь в Мутагене.

Шаг 1. В разделе “Конкуренция” выберите “Онлайн-проверка”.

Шаг 2. Скопируйте и вставьте из файла или напишите вручную ключ. Нажмите на стрелку рядом.

Шаг 3. Изучите результаты. Их нужно ввести в Excel вручную. Скачать можно только хвосты – уточняющие слова, которые помогут сделать НЧ запросы с хорошим трафиком. Например, “Морская свинка” → “Ангорская морская свинка”.

Что показывает бесплатная проверка:

  1. Стоимость клика в Яндекс.Директе. Сколько будет стоить контекстная реклама с этой фразой.
  2. Уровень конкуренции. Чем ниже, тем лучше. Желательно продвигаться по запросам, которые набрали менее 10 баллов.
  3. Количество просмотров в поиске.
  4. Наличие хвостов. Если их много, значит, в ключевое словосочетание можно добавить еще несколько уточняющих слов.


Почему для магазинов, блогов лучше массовая проверка:

  1. Можно загрузить результаты в таблицу.
  2. Не нужно вручную вбивать и проверять каждый ключ. Копируете и вставляете все семантическое ядро.

Это дешево. Один ключ обойдется в 2 – 4 копейки.

Ниже я научу вас делать платную комплексную проверку.

Шаг 1. Выберите “Конкуренция” → “Массовые проверки”.

Шаг 2. Скопируйте из таблицы ключевые слова или загрузите из txt-файла. Кликните “Отправить на проверку”.

Шаг 3. Смотрим отчет. Чтобы сохранить на компьютер, нажмите “Экспорт данных в формате .csv”.

Группировка

Основной запрос пойдет в:

  • заголовок;
  • alt миниатюры;
  • первый абзац;
  • title (название страницы);
  • описание (description).

Из всей кучи ключей мы выбираем тот, у которого больше настоящая частота. Балл конкуренции – до 10. И он должен отражать главную мысль текста, страницы настолько, чтобы им можно было озаглавить.

Оставшиеся запросы мы равномерно распределяем по странице.

Группировка (кластеризация) нужна и при создании сайта, контент-плана. Когда кучей собираете ключи, которые относятся к теме сайта и служат идеей для создания контента. Например, у вас перемешались: “скачать программу для камеры видеонаблюдения”, “что нужно для получения лицензии видеонаблюдения”. Сразу понятно, что должны быть на разных страницах.

Другие полезные сервисы и программы

Сервисы подбора и анализа ключевых слов стоят копейки, а вы экономите 4 – 5 часов на трудоемкой работе.

Проводит автоматический анализ частотности ключей для сайта. Стоит это удовольствие копейки. Копируете список ключей из таблицы, которую мы сделали в первом шаге, а сервис показывает подробный учет. Мне это обошлось в 5,95 рубля.

Маст-хэв для SEO-специалистов, владельцев сайтов, которые сами занимаются поисковой оптимизацией. Рекомендации по перелинковке, сбор и анализ ключей, кластеризация, определение ценности фраз и конкуренции – это все про эту программу. Она платная. Платишь 1 800 рублей и пользуешься вечно.

Англоязычный сервис, который позволяет искать и проверять ключевые фразы на 50 языках. Показывает стоимость контекстного объявления в Google Adwords. Можно узнать коэффициент трудности продвижения по выбранному запросу. Он рассчитывается по уровню конкурентности, частотности. Месячная подписка стоит 29,9 – 79,9 $. Пробный период – 10 дней.

Собирает ключевые слова для естественного продвижения. Один из способов применения – LSI-копирайтинг. К сожалению, работает только с англоязычными ключами. Но если вы занимаетесь зарубежным проектом, этот сервис придется кстати. Цена за один месяц использования составляет 27 $.

Бесплатный планировщик ключевых слов. Рассчитан в основном на контекстную рекламу. Но некоторые умельцы пользуются им для составления семантического ядра. Анализирует поведение пользователей за год, выдает подходящие ключи с частотностью, стоимостью и конкуренцией.

Умный подбор запросов сам отсеет нерелевантные и ненужные слова, кластеризует запросы по вашим параметрам, покажет реальную частотность.
Это экономит до 8 часов работы. Результат можно сохранить в таблице Excel. Минус – сервис платный. За месяц использования нужно отдать 1 978 рублей.

Кладезь для SEO-менеджера. Ahrefs анализирует конкурентов, сайты в поисковой выдаче, анкоры, трудность ключевых слов для продвижения. Можно купить неделю использования за 7 $, дальше – 99 $ в месяц.

Парсит ключи Яндекс.Вордстата, Планировщика ключевых слов от Google, Google Analytics. Можно сделать группировку, включить в игнор-список ненужные слова. Для удобства результаты можно разделить на окошки или поместить в таблицу.

Быстро собирает и оценивает поисковые запросы. Может искать похожие ключи, группировать их по страницам. Минус: за один раз может осилить только 2 000 слов. Полный анализ конкурентов, мониторинг позиций сайтов доступен для платной подписки за 69 $/месяц. Бесплатно можно поочередно проверять по одному запросу.

Парсит много запросов из Google и Bing. К сожалению, не поддерживает Яндекс.Вордстат. Инструмент разделяет по разным столбцам похожие слова и с настоящей частотностью. Можно сразу посмотреть, какие сайты выходят в топ выдачи по этим запросам. Регистрация обязательна. Неделю дают бесплатно попользоваться, потом месяц использования стоит 99,95 $.

Не просто проверяет введенные вами ключи, а выдает дополнительные тематические слова из подсказок и Планировщика Google. Они расширят семантическое ядро и приведут больше трафика.

Инструмент парсит запросы не только в Google, но и в соцсетях. Вы можете составить семантическое ядро видеоролика для YouTube.

Увы, не все так сладко. Сами фразы он покажет, но частотность – нет. Нужно оплатить подписку, чтобы получить доступ ко всей информации.

Собирает семантическое ядро, отслеживает позиции сайта в поисковой выдаче. Проверяет ключи на частотность, привлекательность для пользователей. Может их группировать по страницам. Нужно лишь указать точность и стоп-слова.

Инструмент на тот случай, когда нет времени делать словосочетания из ключей, уточнять их. Вы вводите слова в 3 разных списка, и они смешиваются между собой. Например, в один пишете “купить”, “заказать”, в другой – “пижаму из хлопка”, “шелковую комбинацию”. И получаете семантическое ядро для интернет-магазина.

Минус: не склоняет слова.

Составляет из слов фразы. Можно настроить порядок смешивания. Чтобы слова из второй колонки были впереди или наоборот. Сервис может автоматически проставить квадратные или круглые скобки. Это упростит работу в Вордстате.

Куда добавлять

Важно не только правильно подобрать, но и раскидать ключевые слова по странице сайта. Они должны быть в:

  • метатегах: description и title;
  • url и доменном имени;
  • анкорах (описание ссылок);
  • теге Alt изображений;
  • тексте страницы;.
  • заголовках H1 – H3.

Обязательно узнайте, как SEO-оптимизировать статью, чтобы грамотно вставить ключи и занять первые позиции в поиске.

Заключение

Поздравляю! Вы научились подбирать ключевые слова. Это уже 50 % успеха продвижения. Но есть и другие нюансы, которые стоит знать, если вы хотите занять первые позиции в поиске. Хотите узнать какие? Тогда подписывайтесь на блог. У нас много полезного материала про создание качественного контента и поисковую оптимизацию.

Пробовали собрать ключи, как в статье? Получилось? Какую программу использовали? Если что-то не получилось, то помогу, подскажу.

100 полезных скриптов для автоматизации работы в Google AdWords. Часть 2

Автор: Софи Хауэлл (Sophie Howell) – менеджер проектов PPC в агентстве Koozai.

Автор статьи уделила много времени анализу существующих на сегодняшний день скриптов, сделав подборку из наиболее полезных в работе менеджера рекламных аккаунтов.

Илон Маск рекомендует:  Обновления курсов по JavaScript

Продолжение. Первую часть публикации читайте по ссылке.


Скрипты для запуска сезонных кампаний

56. Скрипт «Update Ads For The New Year» от разработчика из FreeAdWordsScripts.com окажется особенно полезен, тем, в чьих текстах объявлений упоминается текущий год. 1-го января каждого нового года скрипт будет автоматически проверять объявление и обновлять дату. Функционал может оказаться полезным практически для любого бизнеса.

57. Скрипт «Update Your Keywords For The Holiday Season», предназначенный для обновления ключевых слов в объявлениях на время Рождественских и Новогодних праздников, даёт возможность рекламодателю автоматизировать процесс обновления ключевых слов с наступлением каждого нового праздничного сезона.

Скрипты для автоматизации технических задач

58. Специальный скрипт «Automating Maintenance Tasks With AdWords Scripting Part 1» от FreeAdWordsScripts.com позволяет автоматически находить ключевые слова, стоимость конверсии по которым слишком высока.

59. «Automating Maintenance Tasks with AdWords Scripting Part 2» помогает выявлять ключевые слова, которые приносят самый дешевый трафик.

60. Скрипт «Automating Maintenance Tasks with AdWords Scripting Part 3» находит внутри аккаунта ключевые слова, которые не приносят конверсий, позволяя мгновенно избавляться от них.

Все эти скрипты заметно экономят время специалиста, позволяя автоматизировать ряд задач на уровне аккаунта.

Скрипты для создания ярлыков

61. Чтобы скрипт «Label Keywords With Organic Rank Data» от Brainlabs работал должным образом, менеджеру аккаунта необходимо добавить информацию об интересующих ключевых словах и их позициях в органической выдачи в таблицу Google. Сценарий автоматически соотнесет ключевые слова из органики с ключевиками, использующимися в PPC-кампаниях. На основе этих данных специалист может разработать более эффективную стратегию продвижения.

62. Скрипт «Label Countdown For Ignoring New Elements» автоматически присвоит ярлыки ключевым словам, которые были добавлены в аккаунт недавно, и позволит мгновенно понять, какие ключевики лучше оптимизировать в первую очередь, а от каких — и вовсе можно избавиться.

63. «Merge Labels From Multiple Campaigns» позволяет автоматически сравнивать и объединять кампании, а также автоматически переносить ярлыки из старой кампании в новую. Это, в свою очередь, предоставляет специалисту возможность работать с новой кампанией привычным ему образом.

64. Скрипт «Labels For When New Ads, Ad Groups, Keywords or Campaigns Were Created» присваивает ярлыки объявлениям, получившим первые показы. Это позволяет в дальнейшем отслеживать эффективность каждого конкретного объявления, группы объявлений, ключевого слова или кампании. С помощью скрипта можно проследить историю кампании и эффективно оптимизировать её.

65. Используя «AdWords Dashboard By Label» от Pushfire, можно массово присваивать ярлыки различным кампаниям для удобной фильтрации данных.

66. Скрипт AdWords «Account Labels» предоставляет распоряжение специалиста множество различных ярлыков, которые можно присваивать как на уровне кампании, так и на уровне аккаунта.

67. Скрипт «Ярлыки» помогает заметно упростить процесс выявления неэффективных ключевых слов. Он также автоматически присваивает разные ярлыки словам, содержащим и не содержащим названия брендов, и отправляет сводные оповещения о добавляемых словах.

Скрипты для отслеживания данных по кампаниям

68. Код для отслеживания показателя качества ключевых слов «Track Quality Score» использует ярлыки. Все изменения фиксируются, а уведомления о них отправляются на e-mail специалисту. Данные за период можно отслеживать и сопоставлять при помощи Таблиц Google.

69. В скрипте «Track AdWords Script Runs with Google Analytics» используются данные из Google Analytics. Это дает возможность специалисту свести все данные по аккаунту в единый отчёт для дальнейшей работы с ними.

70.«MCC Script Dashboard» автоматически создает таблицы для всех рекламных аккаунтов, в которых наглядно отображается вся статистика затрат на ведение кампаний по дням и неделям. Таблицы легко настраиваются и масштабируются в зависимости от задач и потребностей рекламного менеджера.

71. Скрипт «Track Campaigns By CPA» автоматически анализирует эффективность кампаний по модели CPA, отключая неэффективные ключевые слова.

72. Инструмент для автоматического отслеживания параметров, необходимых к добавлению в кампанию «Auto Add Track Parameters If Not There» выявляет недостающие параметры и позволяет вносить изменения на уровне всего аккаунта.

Cкрипты для работы над текстами объявлений

73. Сценарий «Fixing Capitalisation Errors In Your Ads» в фоновом режиме перепроверяет все объявления и автоматически заменяет одно другим в случае необходимости.

74. «Ad Creative Test Automation Script» в автоматическом режиме отслеживает показатели во время тестирования рекламного креатива. Все параметры могут быть зафиксированы Таблицах Google для последующей обработки и анализа.

75. Название скрипта «Manage Your AdWords Creatives Using Excel» говорит само за себя: он предназначен для тех, кто предпочитает работать с данными аккаунтов AdWords при помощи таблиц Excel. Скрипт позволяет управлять объявлениями и группами объявлений, а также расширениями с помощью Excel. Многие считают такой подход намного более простым, чем выполнение аналогичных задач в интерфейсе AdWords.

76. Программа автоматического переноса объявлений на страницы с другим URL «Copy Existing AdWords Ads With A New Destination URL» окажется эффективной при проведении сплит-тестирования, когда необходимо быстро сравнить между собой показатели по нескольким объявлениям.

77. Скрипт «Feed Your Inventory Count Into AdWords Ads» от RankHammer предназначен для тех, кто работает с платформой WooCommerce и позволяет приостанавливать показ объявлений с рекламой конкретного продукта после того, как его распродажа завершается. Скрипт подойдет представителям e-commerce.

78. «AdWords Countdown Ads Updater Script» позволяет автоматически заменять объявления, содержащие модификатор обратного отсчета. Таким образом, объявления рекламодателя всегда будут оставаться актуальными.

79. Скрипт «Automated Creative Testing With Statistical Significance» отслеживает статистику объявлений и оперативно оповещает рекламодателя по e-mail обо всех отклонениях от нормы. При грамотной настройке и применении скрипт позволяет заметно повысить CTR объявлений.

Скрипты для работы с ключевыми словами

80. Скрипт «Reverse ‘Close Variant Matching’» от Brainlabs предоставляет специалистам по рекламе возможность создавать объявления по точному соответствию ключевым словам, которая была закрыта в Google Adwords в сентябре 2014 года. Сценарий идеально подойдет для тех, кому необходимо, чтобы объявления показывались в результатах поиска только по точному соответствию, исключая близкие варианты ключевых слов.

81. «Account Performance By Keyword Match Type» дает возможность рекламодателю сопоставить показатели видимости для ключевых слов по различным типам соответствия и выбрать наиболее подходящий вариант. Однако приступить к работе с данным скриптом могут только авторизованные пользователи сервисов компании Optmyzr.

82. Скрипт «Search Query Opportunities» анализирует отчеты о поисковых запросах для кампаний и предоставляет рекламодателю возможность оценить, какие ключевые слова наиболее эффективны.

83. «Perform Search Query Analysis» позволяет произвести детальный анализ данных о поисковых запросах, используя функционал Таблиц Google.

84. Скрипты AdWords «Negative Keyword Lists» дают возможность рекламодателю создавать списки минус-слов, автоматически добавлять и в кампанию и удалять при необходимости. Таким образом, работа специалиста по созданию списков минус-слов становится куда более простой и эффективной.

85. Скрипт «Negative Keywords» предоставляет специалисту возможность работать с минус-словами как на уровне групп объявлений, так и на уровне всей кампании. Он идеально подойдет тем, кто не хотел бы заниматься подобной работой в интерфейсе AdWords.

86. Ещё один скрипт AdWords «Master Negative List» позволяет использовать один список минус-слов для нескольких рекламных кампаний. Скрипт будет полезен тем, кто запускает однотипные кампании в нескольких аккаунтах.

87. Скрипт AdWords «Keywords» или «Ключевые слова» обеспечивает возможность рекламодателю добавлять необходимые ключевые слова в существующую группу объявлений, приостанавливать показ объявлений по текущим ключевым словам, агрегировать все ключевые слова по интересующей группе объявлений и получать статистику по ним.

Все перечисленные выше Скрипты AdWords созданы специально для тех, кто по каким-либо причинам избегает осуществлять данные задачи в интерфейсе рекламного сервиса.

Скрипты для настройки кампаний в GDN и «Торговых кампаний» (Google Shopping)

88. «Shopping Campaigns» – специальный скрипт AdWords, предназначенный для автоматизированного и эффективного управления «Торговыми кампаниями». Он позволяет полноценно работать с функционалом вне интерфейса Google AdWords.

89. «Shopping Content» помогает создавать описания продуктов, представленных в объявлениях «Торговых кампаний» и автоматизирует включение текстов в эти объявления.

90. «Google Display Network» позволяет быстро и эффективно управлять настройками кампаний в сети Google Display Network (GDN).

91. Полезный скрипт «Reviews GDN Placements», созданный разработчиком из Ask.com, предоставляет рекламодателям уникальную возможность находить дополнительные возможности для размещений и эффективно управлять ставками.

92. «Review Google Shopping Products For Sharp Changes» – ещё одна разработка Дерека Мартина из Ask.com. Скрипт фиксирует все заметные изменения в аккаунтах для кампаний Google Shopping. Используя разработку, рекламодатель будет оставаться в курсе всех существенных изменений средней цены за клик и сможет оперативно вносить изменения в кампании, тем самым, оптимизировать ставки.

93. «Массовое создание групп товарных объявлений» – скрипт AdWords, позволяющий создавать в торговых кампаниях сразу несколько групп объявлений и товаров. Функционал автоматически извлекает из таблицы параметры групп объявлений и иерархии групп товаров с определёнными ставками. После этого на основе полученных данных группы создаются в AdWords. Скрипт открывает таблицу с данными и обрабатывает ее по строкам.


Прочее

94. Скрипт, созданный на основе Google Prediction API, позволяет использовать интерфейс программирования наряду с другими скриптами AdWords. Это дает возможность детально анализировать данные по кампаниям РРС. Помимо прочего, скрипт создает автоматические прогнозы, которые позволяют анализировать данные по кампаниям на перспективу.

95. «Use GDrive To Load A Single AdWords Script Into Multiple Accounts» от разработчика из FreeAdWordsScripts.com предоставляет специалисту возможность аккумулировать данные по нескольким аккаунтам всего в одной Таблице Google. Это заметно экономит время менеджера, поскольку ему не требуется осуществлять вход в каждый аккаунт по отдельности для обновления данных.

96. Скрипт «Building Entity Deep Links with AdWords Scripts» – ещё одна удачная разработка, предназначенная для автоматического создания «глубоких ссылок», которые бы вели на страницу объекта (товара или услуги), с описанием которого связаны те или иные проблемы в аккаунте. Это заметно экономит время специалиста при выявлении ошибок.

97. Use Google Feed API To Convert RSS to JSON позволяет автоматически конвертировать XML в RSS-ленте в формат JSON.

98. Инструмент «Making Sure The Date/Time Zone Is Correct» будет полезен тем, для кого критически важно, чтобы объявления транслировались в строго определённое время. Скрипт позволяет автоматически проверять корректность даты и настроек часового пояса при планировании кампании.

99. Программный код, созданный на базе скриптов AdWords от Дерека Мартина из Ask.com идеально подойдет для поиска ключевых слов. За основу берутся поисковые подсказки Google. Инструмент позволит заметно расширить списки ключевых слов в рекламных аккаунтах.

100. «Merge Multiple Campaigns Together» — этот скрипт приостанавливает устаревшие кампании и автоматически переносит данные по ним в единую базу. Это позволяет отслеживать данные за определенный период времени. Особенно полезным такой скрипт может стать при запуске новых кампаний, данные для которых заимствуются из более ранних.

Подводя итоги

Автор статьи искренне надеется на то, что представленная подборка скриптов будет полезна интернет-маркетологам и менеджерам по рекламе, продвигающим проекты, товары и услуги с помощью Google AdWords. Внедрив всего лишь несколько скриптов, специалист сможет заметно сэкономить время и оптимизировать бюджеты по кампаниям, а работа в аккаунте рекламного сервиса станет намного эффективнее и проще. Не стоит также забывать об отладке скриптов с последующей проверкой их работы.

Настроив такой сценарий однажды, менеджер аккаунта сможет заметно облегчить процесс управления действующими рекламными кампаниями.

Скрипт формирует список ключевых слов по содержимому сайта

Serpstat использует файлы cookie для обеспечения работоспособности сервиса, улучшения навигации, предоставления возможности связаться с командой поддержки, а также маркетинговых активностей Serpstat.

Нажав кнопку «Принять и продолжить», вы соглашаетесь с Политики конфиденциальности

Мы запустили рейтинг зарплат интернет-маркетологов! Прими участие в анонимном опросе.

How-to – Читать 11 минут – 4 марта 2020

Семантическое ядро — список всех ключевых фраз, которые используются для продвижения сайта. Количество таких фраз зависит от тематики проекта и на больших порталах может исчисляться в миллионах. Основная цель сбора семантического ядра — охват спроса и разработка стратегии по продвижению сайта для повышения видимости в поисковых системах.

Составление семантического ядра происходит при помощи различных инструментов, наиболее популярные — Яндекс.Wordstat, Планировщик ключевых слов Google AdWords, Похожие фразы Serpstat, Key Collector и другие.

Семантическое ядро сайта состоит из низко-, средне- и высокочастотных запросов. Частотность определяется средним количеством ежемесячных показов в поисковых системах. Для разных тематик числовые показатели, характеризующие частотность, будут отличаться.

Для популярных тематик, например, одежда или игрушки, высокочастотные запросы достигают десятков тысяч показов ежемесячно. В некоторых случаях сверхпопулярные ключевые слова могут запрашиваться миллионы раз в месяц. Например, запрос «Фильмы» в точном вхождении показывается в Яндексе более трех миллионов раз ежемесячно:

В среднем, классификация для достаточно популярных тематик такова:

  • низкочастотные запросы — меньше тысячи ежемесячно;
  • среднечастотные — от тысячи до трех тысяч в месяц;
  • высокочастотные — более трех тысяч ежемесячно.

Подходы к извлечению данных из веб-ресурсов

В предыдущей статье мы рассмотрели основные понятия и термины в рамках технологии Data Mining. Сегодня более детально остановимся на Web Mining и подходах к извлечению данных из веб-ресурсов.

Web Mining — это процесс извлечения данных из веб-ресурсов, который, как правило, имеет больше практическую составляющую нежели теоретическую. Основная цель Web Mining — это сбор данных (парсинг) с последующим сохранением в нужном формате. Фактически, задача сводится к написанию HTML парсеров, и как раз об этом поговорим более детально.

Есть несколько подходов к извлечению данных:

  1. Анализ DOM дерева, использование XPath.
  2. Парсинг строк.
  3. Использование регулярных выражений.
  4. XML парсинг.
  5. Визуальный подход.

Рассмотрим все подходы более детально.

Анализ DOM дерева

Этот подход основывается на анализе DOM дерева. Используя этот подход, данные можно получить напрямую по идентификатору, имени или других атрибутов элемента дерева (таким элементом может служить параграф, таблица, блок и т.д.). Кроме того, если элемент не обозначен каким-либо идентификатором, то к нему можно добраться по некоему уникальному пути, спускаясь вниз по DOM дереву, например:

body -> p[10] -> a[1] -> текст ссылки

или пройтись по коллекции однотипных элементов, например:

body -> links -> 5 элемент -> текст ссылки

Достоинства этого подхода:

  • можно получить данные любого типа и любого уровня сложности
  • зная расположение элемента, можно получить его значение, прописав путь к нему

Недостатки такого подхода:

  • различные HTML / JavaScript движки по-разному генерируют DOM дерево, поэтому нужно привязываться к конкретному движку
  • путь элемента может измениться, поэтому, как правило, такие парсеры рассчитаны на кратковременный период сбора данных
  • DOM-путь может быть сложный и не всегда однозначный

Этот подход можно использовать вместе с библиотекой Microsoft.mshtml, которая, по сути. является core элементом в Internet Explorer.

Data Extracting SDK использует Microsoft.mshtml для анализа DOM дерева, но является «надстройкой» над библиотекой для удобства работы:

UriHtmlProcessor proc = new UriHtmlProcessor( new Uri ( «http://habrahabr.ru/new/page1/» ));
proc.Initialize();

* This source code was highlighted with Source Code Highlighter .

Следующим эволюционным этапом анализа DOM дерева является использования XPath — т.е. путей, которые широко используются при парсинге XML данных. Суть данного подхода в том, чтобы с помощью некоторого простого синтаксиса описывать путь к элементу без необходимости постепенного движения вниз по DOM дереву. Данный подход использует всеми известная библиотека jQuery и библиотека HtmlAgilityPack:

HtmlDocument doc = new HtmlDocument();
doc.Load( «file.htm» );
foreach (HtmlNode link in doc.DocumentElement.SelectNodes( «//a[@href» ])
<
HtmlAttribute att = link[ «href» ];
att.Value = FixLink(att);
>
doc.Save( «file.htm» );

* This source code was highlighted with Source Code Highlighter .

Парсинг строк

Несмотря на то, что этот подход нельзя применять для написания серьезных парсеров, я о нем немного расскажу.

Иногда данные отображаются с помощью некоторого шаблона (например, таблица характеристик мобильного телефона), когда значения параметров стандартные, а меняются только их значения. В таком случае данные могут быть получены без анализа DOM дерева, а путем парсинга строк, например, как это сделано в Data Extracting SDK:

Компания: Microsoft
Штаб-квартира: Редмонд

» ;
string company = data.GetHtmlString( «Компания: » , «


» );
string location = data.GetHtmlString( «Штаб-квартира: » , «

Илон Маск рекомендует:  Как выбрать блок питания для компьютера

// output
// company = «Microsoft»
// location = «Редмонт»

* This source code was highlighted with Source Code Highlighter .

Использование набора методов для анализа строк иногда (чаще — простых шаблонных случаях) более эффективный чем анализ DOM дерева или XPath.

Регулярные выражения и парсинг XML

Очень часто видел, когда HTML полностью парсили с помощью регулярных выражений. Это в корне неверный подход, так как таким образом можно получить больше проблем, чем пользы.

Регулярные выражения необходимо использоваться только для извлечения данных, которые имеют строгий формат — электронные адреса, телефоны и т.д., в редких случаях — адреса, шаблонные данные.

Еще одним неэффективным подходом является рассматривать HTML как XML данные. Причина в том, что HTML редко бывает валидным, т.е. таким, что его можно рассматривать как XML данные. Библиотеки, реализовавшие такой подход, больше времени уделяли преобразованию HTML в XML и уже потом непосредственно парсингу данных. Поэтому лучше избегайте этот подход.

Визуальный подход

В данный момент визуальный подход находится на начальной стадии развития. Суть подхода в том, чтобы пользователь мог без использования программного языка или API «настроить» систему для получения нужных данных любой сложности и вложенности. О чем-то похожем (правда применимым в другой области) — методах анализа веб-страниц на уровне информационных блоков, я уже писал. Думаю, что парсеры будущего будут именно визуальными.

Проблемы и общие рекомендации

Проблемы при парсинге HTML данных — использование JavaScript / AJAX / асинхронных загрузок очень усложняют написание парсеров; различные движки для рендеринга HTML могут выдавать разные DOM дерева (кроме того, движки могут иметь баги, которые потом влияют на результаты работы парсеров); большие объемы данных требуют писать распределенные парсеры, что влечет за собой дополнительные затраты на синхронизацию.

Нельзя однозначно выделить подход, который будет 100% применим во всех случаях, поэтому современные библиотеки для парсинга HTML данных, как правило, комбинируют, разные подходы. Например, HtmlAgilityPack позволяет анализировать DOM дерево (использовать XPath), а также с недавних пор поддерживается технология Linq to XML. Data Extracting SDK использует анализ DOM дерева, содержит набор дополнительных методов для парсинга строк, а аткже позволяет использовать технологию Linq для запросов в DOM модели страницы.

На сегодня абсолютным лидером для парсинга HTML данных для дотнетчиков является библиотека HtmlAgilityPack, но ради интереса можно посмотреть и на другие библиотеки.

Мощный гайд по SEO: как подобрать ключевые слова для сайта

Автор блога Seoquick

Если вы устали тратить свое время и силы на поиск работающих ключевых слов, то Николай Шмичков, автор блога Seoquick, подготовил для вас подробное руководство по SEO и работе с ключевыми словами.

Изучаем структуру существующих сайтов

Неважно, есть ли у вас структура сайта на реальном сайте или в голове, нужно сделать следующее:

  • Проанализируйте конкурентов. В 99% случаев вы не первые на рынке. Поэтому вы найдете пару-тройку конкурентов в ТОПе за несколько кликов.
  • Проведите мозговой штурм. Собрать все идеи основных ключей можно сначала на совещании с коллегами — с отделом продаж или отделом маркетинга
  • Выстройте иерархию потенциальных страниц по логике. Здесь обычно все сайты имеют следующую структуру:
Страница Описание
Главная страница Содержит основной ключ по вашей семантике. Обозначает чаще всего профиль деятельности компании.
Страница услуг Содержит подстраницы для каждой основной продаваемой услуги.
Страницы категорий товаров Могут дробиться на подкатегории. Разбиты могут быть по разной логике — по применению (для какой группы), по бренду, по типу товара.
Страница «О нас» Часто это брендовая страница с описанием компании. Обычно она содержит дополнительные ссылки на отдельные страницы брендов, продукции партнеров и документацию.
Страницы для партнеров Здесь чаще всего указана информация для дилеров, поставщиков и размещены вакансии.
Страницы для клиентов Часто это здесь указана полезная информация для клиентов (FAQ), ссылки на акционные предложения, условия доставки и оплаты, данные о конфиденциальности, отзывы, портфолио.
Раздел новостей или блога Этот раздел содержит в себе статьи, разделенные по категориям. Категории новостей выбираются согласно популярности и логике.
Личный кабинет Если ваш сайт подразумевает регистрацию и у него есть страничка регистрации / входа / внутренней «админки» для клиента, то обычно внутренний раздел закрывается от индексации, кроме страниц входа/регистрации.
Контакты Часто это отдельная страница со всеми формами связи.

Собираем матрицу ключевых слов

Возьмем запрос, связанный с этой статьей «ключевые слова».

Первоначально тактика будет следующей:

  • Выбираем синонимы.
  • Анализируем по высокочастотным (ВЧ) синонимам конкурентные страницы.
  • Собираем низкочастотные хвосты для наших слов.

Выбираем синонимы

Поначалу это может показаться самым простым. Вот какие синонимы подходят под нашу категорию:

  • ключи продвижения
  • ключевики
  • ключевые фразы
  • keyword
  • кейворды
  • семантическое ядро

Синонимы (или маркеры) — это такие ключевые слова, которые могут присутствовать на странице вашего сайта, сосуществуя друг с другом. Например, это может быть электробритва и электрическая бритва или ключевое слово и ключевик.

Легко подобрать синонимы можно изучив результаты поисковой выдачи Google. Просто вбейте нужное слово в поисковик и полистайте выдачу, изучая сниппеты. Или почитайте статьи по вашей области и освойте жаргон.

Анализируем конкурентов

Для этого можно воспользоваться сервисами по анализу позиций SerpStat.com или Ahrefs.Com.

Используем наш запрос и находим конкурентов.

Затем выбираем отдельных конкурентов и используем поиск в интернете при помощи поисковых запросов

site:Название конкурента “Ключевое слово”

Например, по первому сайту видим следующий результат:

В итоге в выдаче видны только страницы конкурента, который уже написал контент по этим фразам.

Дальше дело техники: взять каждый URL, скопировать его и проверить позиции в поиске.

После проверки ключевых слов в выдаче мы увидим ВЧ-фразы.


Самые высокочастотные фразы нужно выписать и сохранить.

Расширяем семантическое ядро

Но что делать, если у вас очень высокочастотный запрос? Наш как раз таким и является. В таком случае стоит перейти к этапу кластеризации — вероятной разбивке групп ключей для разных страниц. А значит нужно спарсить все ключи для нас воедино.

Первоначально воспользуемся сервисом Wordstat.

Найдем дополнительные подсказки для запроса «ключевые слова».

Помимо этих ресурсов, можно использовать и другие:

  • Планировщик ключевых слов. Для работы пригодится активный аккаунт в AdWords.
  • AnswerthePublic.com — мощный сервис по сбору низкочастотных хвостов.
  • Ubersuggest.io — аналогичный сервис для сбора ключевых хвостов.
  • Keywordtool.io — один из немногих сервисов, который может собрать семантику по Bing, Amazon и YouTube.
  • Ahrefs — мощный сервис по сбору ключей. Из минусов — таргетинг только на страну. Нельзя таргетировать на город. Снимает множество полезных SEO метрик.

Ищем дополнительные подсказки

Используем генератор ключевых слов для поиска и сбора всех вариантов подсказок. Впишем их в нужные поля:

  1. Перед словом «ключевые слова» поставим оператор *
  2. Слова, которые идут после слова «ключевые слова» выпишем в первую колонку.
  3. Те, которые идут перед ним — во вторую.

Ненужные слова тоже могут пригодиться:

  1. Занесите их в поле минус-слов.
  2. Укажите регион вордстата (его вы найдете в теле URL — см. скриншот).
  3. Нажмите кнопку «Получить ключевые слова»

Получив подсказки, нажимаем кнопку «Найти еще ключевые слова».

При переходе на Вордстат вы снова увидите ключевые слова, а процесс поиска хвостов для фразы будет продолжаться.

Чем уже тематика, тем процесс проще. Итоговый список будет состоять из уже собранных узких фраз.

Выбираем словоформу ключевого слова

Наши собранные ключевые фразы могут выглядеть не очень опрятно после такого механизма сборки:

Есть множество способов проверки словоформы, но самый простой — это WordStat.Yandex.ru. Просто нажмите в 1 клик каждое слово и вы попадете на страничку WordStat.

Сохраните словоформу каждого первого слова вручную.

Парсинг поисковых подсказок

Незаменимый инструмент каждого SEO-специалиста это Key Collector. Это приложение позволяет с легкостью собирать семантические ядра для всех сайтов, ни разу не повторившись ни в одном ключевом слове, сохраняя структуру сайта и позволяя легко ее дорабатывать.

Собрать поисковые подсказки можно из разных мест.

Сбор по WordStat. Соберите весь НЧ-хвост к своим словам. Используйте в запросах операторы:

  • Плюс + позволяет включить слово в обязательном использовании. Например, предлоги если нужно их обязательное использование.
  • Минус — позволяет исключить ненужное слово заранее, если вы знаете, что оно встречается часто.
  • Квадратные скобки [ ] позволяют искать все слова в точном порядке, как вы их указали. Сами слова могут модифицироваться (склонения, спряжения и проч.). В контексте отвечает за фразовое соответствие (аналогичное в AdWords). Например, [продвижение сайта] +в -бесплатно дает такой результат:
  • Вертикальный разделитель | нужен для изучения частоты вариативных запросов.
  • Скобки ( ) — для группировки запросов. Например (продвижение|раскрутка) сайта +в (гугл|google|Яндекс) сделает такой вариант:
  • Восклицательный знак ! запрещает склонять/спрягать/модифицировать слово. Ставим перед словом. Некоторые слова, например, названия таких городов, рекомендуется использовать именно с восклицательным знаком.
  • Кавычки «» позволяют учесть только точную фразу, указанную в кавычках. Что спросили, то и получили. По факту для поиска ключевых слов не используется.

Просто добавляйте свои идеи сразу в KeyCollector и собирайте подсказки.

Также вы можете использовать сбор из

  1. Правой колонки Яндекса.
  2. Подсказки из AdWords.
  3. Поисковые подсказки различных поисковых систем.

Выгрузите вашу статистику ключевых слов из Google Analytics и Яндекс.Метрики.

Собрав все подсказки, переходите к этапу чистки.

Очистка собранных списков

Многие сервисов предлагают разные способы очистки семантики, но лидером остается KeyCollector.

Если у вас есть четкий список минус-слов, просто внесите его и отметьте ненужные слова заранее.

  1. Выберите кнопку «Стоп-слова».
  2. Добавьте свой список слов.


Если же у вас его нет, составьте его на основе собранных слов, затем удалите ненужные фразы. Если в итоговом пулле окажется 3000-5000 слов, то это нормальное явление.

Кластеризация списков ключевых слов

Затем слова следует распределить по страницам. Этот процесс называется кластеризацией.

Разбивка ключевых слов производится по следующему принципу:

  • Нужно проверить поисковую выдачу в ТОП10 по каждому слову.
  • Затем провести анализ совпадения, у каких ключевых слов совпадает хотя бы X из 10 страниц. X в данном случае это наш условный SERP-индекс. (SERP — от сокращения Search Engine Result Page).

Существует множество платных сервисов для кластеризации ключевых слов.

Рассмотрим несколько из них.

Serpstat

Пока на стадии бета-тестирования. Предлагает платное количество слов в месяц в тарифном плане. Кластеризацию делает достаточно оперативно. Из минусов — пока в проект можно “скормить” только 2000 слов. Большой сайт не протестировать.

Как результат — слова кластеризуются по группам:

  1. Выбираем группу кластера.
  2. Указываем максимально подобный URL для данного кластера.

Итоговое семантическое ядро скачиваем и работаем уже с ним.

Топвизор

Аналогичный сервис предлагается в бесплатном тарифе. Импортируйте свой список запросов.

  1. Выберите регион и поисковую систему.
  2. Выберите степень группировки — чем больше степень, тем больше групп будет создано.
  3. Выберите метод кластеризации:
    1. Мягкий — когда в одну группу могут попадать ключи, у которых совпадает хотя бы одна страница. Пригодится при невысокой конкуренции в семантике (например, у одного ключа есть страница, которая может совпасть у другого ключа, но не повторится у третьего).
    2. Средний — когда минимум должно быть совпадение до двух общих URL в запросе.
    3. Трудный — когда должна быть хотя бы одна общая URL для всех ключей в кластере. Пригодится, когда конкуренция в тематике очень высокая.

Учтите, проект платный и чем больше ключей забросили, тем круглее будет сумма

KeyCollector

Бесплатный сервис. Просто соберите показатели SERP по Google и Яндекс:

Затем дождитесь результата и приступите к группировке.

Откройте раздел Данные — Анализ групп.

  1. Выберите тип сортировки «По поисковой выдаче [улучшенная]».
  2. Отрегулируйте силу по SERP.
  3. Просмотрите результаты группировки.
  4. Сохраните результат в Excel.

Единственный минус — группировать по URL придется все вручную и ждать сбора позиций без платных сервисов придется пару часов. Но если вы не торопитесь, то это будет лучшим вариантом.

Еще есть более дедовский способ — делать все вручную.

Просто каждый ключ закидываем в поиск и запоминаем его выдачу. Но я его не рекомендую — тот же KeyCollector помнит выдачу по каждому ключу:

Изучайте трудность ключевых слов

Выбранные ключи могут оказаться трудными для продвижения.

Да, вы можете выбрать клевую семантику, но ваши группы ключевых слов могут уже быть продвинутыми в ТОП у конкурентов.

Например, у ключа «Продвижение сайта и раскрутка сайта» разные ключи в ТОП. И по факту это тоже могут быть главные страницы сайтов.

Почему так? Все просто: в заголовке умещается максимум один ключ — больше длина не позволяет. Более того, очень сложно раскидать релевантный текст сразу на всю страницу, включив оба ключа и при этом не допустить переспама.

Для оценки трудности ключевых слов используйте Ahrefs. Просто добавьте свой список ключевых слов в сервис в разделе «Анализ ключевых слов».

В готовом результате изучите:

  1. Показатель KD (Keyword Difficulty) — чем ниже, тем лучше для вас.
  2. Сходную тематику. Расширьте запас ключевых слов в данной группе.

Учтите, сбор показателей метрик — платный. Следите за числом израсходованных метрик в сервисе.

Выбираем ключ для заголовка

Заключительный этап составления семантического ядра — это написание правильного заголовка страницы.

Не так давно Google отказался учитывать описание при ранжировании. Уже давно канул в лету тег KeyWord. Единственным тегом для продвижения остался Title (заголовок) страницы.

Основные критерии выбора заголовка:

  • Длина — 60 символов или 6-10 слов.
  • Цифры делают кликабельность заголовка выше на 36%.
  • Скобки также увеличивают кликабельность на 38%.
  • Используйте побуждающие слова для вашего бизнеса. Но не переусердствуйте.
  • Упоминайте свой бренд для повышения узнавамости.
  • Пишите Каждую Первую Букву Большой.
  • Не используйте черные методы и не вводите в обман пользователей.

Вот полезное видео на эту тему:

Для постоянного контроля есть бесплатный онлайн калькулятор

Выводы

  • Изучайте конкурентов и анализируйте их структуру. Можете воспользоваться каким-нибудь из 25 бесплатных инструментов для сбора ключевых слов.
  • Собирайте матрицу ключевых слов. Используйте для поиска идей наш калькулятор.
  • Кластеризуйте семантику. Используйте вышеперечисленные решения для кластеризации семантики.

Семантическое ядро — лишь начальный этап в SEO-продвижении. Полную версию курса можно прочитать здесь.

Материалы по теме:

Нашли опечатку? Выделите текст и нажмите Ctrl + Enter

Keywords

Keywords – это метатег, в котором записываются ключевые слова, то есть то, что максимально соответствует теме страницы и сайта в целом. Он применяется для того, чтобы роботы поисковых систем могли идентифицировать страницу и установить ее релевантность.

Синтаксис и советы по написанию

  • Такой метатег располагается в head-части страницы. Размер содержимого тега должен быть не более 100-150 символов. Пример:
  • Все ключевые слова и фразы должны быть перечислены через пробел, без каких-либо других знаков препинания (запятых, точек с запятой и прочих). Благодаря отсутствию разделения роботы самостоятельно формируют фразы из указанного перечня.
  • Каждая страница должна иметь собственный уникальный список слов.
  • Не стоит применять одно и тоже КС более трех раз. При этом указывайте фразы исходя из их частотности в порядке убывания – от самых употребляемых до наименее. Также не нужно указывать в списке высокочастотные слова.
  • Пишите все ключи с маленькой буквы. Исключение составляют различные аббревиатуры и имена.
  • Не склоняйте и не меняйте число слов (кроме случаев, когда форма множественного отличается от единственной по составу корня).

История появления

Представленный метатег существует очень давно – впервые его применили в 1995. Его целью было облегчение работы поисковых систем во время обработки множества веб-страниц. В этом теге указывались ключевые слова, имеющие отношение к теме текста, а роботы получали данные вместе со всем кодом.

Затем полученная информация анализировалась, и страницы, содержащие конкретный ключ, поднимались выше в поисковой выдаче. Со временем keywords стал активно применяться для распространения спама. Методов существовало масса – начиная от повторных упоминаний ключевых слов и заканчивая указанием тех фраз, которые совершенно не соответствуют тематике содержимого.

С 1998 года поисковая система Google прекратила анализировать Keywords для определения релевантности страницы. Другие поисковики также обратили внимание на недостатки метатега и значительно снизили его влияние на позиции сайтов.

Понравилась статья? Поделиться с друзьями:
Кодинг, CSS и SQL