Индексация сайта

 

Чтобы страницы сайта участвовали в поиске и занимали какие-либо позиции по ключевым запросам, они должны быть успешно просканированы и проиндексированы поисковым роботом. Если сайт не полностью индексируется, он недополучит органического трафика (посетителей из поиска).

Правильная настройка индексации сайта является первым и фундаментальным этапом работы над поисковым продвижением сайта и к ней нужно подойти серьезно и основательно.

 

 

Анализ и выявление ошибок в индексации сайта

 

Задачи анализа индексации сайта — две:

  1. Найти продвигаемые страницы, которые не проиндексированы поисковиками (или одним из них);
  2. Найти страницы, которые попали в индекс, а не должны там быть.

 

 

Итоговая задача: выяснить конкретные ошибки, устранить их или запланировать и реализовать другие работы по индексированию всех продвигаемых страниц сайта.

 

 

А) Анализ помощью сервисов Яндекс и Google (более надежный способ)

 

Анализ индексации в Яндексе

 

Для того, чтобы проверить и выявить ошибки в индексации поисковым роботом Яндекса, сделаем 3 анализа и получим 3 отчета помощью встроенного инструмента в панели для вебмастеров от Яндекса.

 

Анализ индексации в Яндексе

 

 

Отчет №1. Исключенные из поиска страницы

 

Первым делом стоит проверить какие страницы сайта Яндекс не включил в поиск и по какой причине.

Где смотреть: Яндекс Вебмастер > Индексирование > Страницы в поиске > Исключенные страницы.

 

Пример отчета в Яндекс Вебмастере - исключенные из поиска страницы

 

 

Выгружаем список всех страниц. Для этого в правом нижнем углу есть кнопка Скачать таблицу в CSV или XLS формате.

Помощью данного анализа мы можем узнать важный момент: не исключены ли из поиска полезные, продвигаемые и нужные страницы. Если да, ищем причину и создаем ТЗ на исправление ошибок и план работ по возвращению страниц в поиск.

Отметим, что исключение страниц по причине “неканоническая” и “редирект” нормальный процесс. Это означает что страницы скорее всего дублировались и в поиске заменены другими.

Стоит особенно серьезно отнестись к:

  • Частом появлении статуса «BAD_QUALITY» (с такими страницами обязательно нужно работать);
  • Большому количеству исключенных страниц с ошибкой 404;
  • Массовом исключении страницы из индекса. Это говорить о серьезной проблеме, и нужно провести работы по ее выявлению.

 

 

Отчет №2. Проиндексированные Яндексом страницы

 

Это отчет о всех страницах, участвующих в поиске Яндекса.

Где посмотреть: Яндекс Вебмастер > Индексирование > Страницы в поиске > Все страницы. Выгрузить список можно так же, как и предыдущий отчет.

Какие выводы нужно сделать:

  1. Нет ли в индексе ненужные страницы — административные, “мусорные”, страницы с конфиденциальными данными и т.д. Если такие находятся, нужно проверить настройки индексации (дальше по тексту об этом будем говорить много);
  2. Достаточное ли количество страниц сайта проиндексировано. Возможно это будет не 100% — если 2, 3 или 10 карточек товаров из 3000, например, не проиндексировано — ничего страшного. Но если 100, 200 или более — уже вопрос.

 

 

Отчет №3. Просканированные роботом Яндекса страницы

 

Отчет покажет нам какие страницы сайта поисковый робот обошел, просканировал (т.е. о существовании каких страницах робот в принципе знает). Не путать с “проиндексировал”!

Где посмотреть: Яндекс Вебмастер > Индексирование > Статистика обхода > Все страницы.

 

Пример отчета - просканированные роботом Яндекса страницы

 

 

До анализа нужно убедиться, что в выгруженном списке нет дублей URL.

 

 

Что можем узнать помощью данного анализа:
  1. Не появились ли в индексе страницы, которые не должны там быть: На что смотрим в отчете: какие страницы из тех, что имели статус N/a, получили код 200;
  2. Не появились ли на сайте (и не только) битые ссылки. Что об этом говорить: появились страницы с кодом 404 (раньше N/a);
  3. Стабильно ли работает сервер? Что об этом говорить: не появились страницы с кодом 500 или 502;
  4. Не удалены ли некоторые страницы. Что об этом говорить: код 200 стал 404;
  5. Не стали ли несуществующие страницы “существующими”. Что об этом говорить: код из 404 стал 200.

 

 

Анализ индексации в Google

 

С помощью анализа индексации в Google Search Console мы выясняем те же вопросы:

  1. Если ли среди проиндексированных страниц такие, которые НЕ должны индексироваться;
  2. Все ли НЕ индексируемые страницы действительно должны быть скрыты от робота поисковой системы.

 

 

В разделе “Страницы” Search Console можно сразу наглядно увидеть 2 отчета:

  • страницы в поиске (проиндексированные);
  • не проиндексированные страницы;

 

Пример - скриншот из Google Search Console

Скриншот из Google Search Console

 

 

Отчет №1. Не проиндексированные страницы

 

Где смотреть: GSC > Страницы > Почему эти страницы не индексируются.

 

Пример отчета - не проиндексированные страницы в Google

 

В отчете видны несколько групп страниц, разделенные на основе причины, из-за которой не попали в индекс.

Анализируем исключенные страницы и выявляем между ними нужные, продвигаемые страницы. Потом составляем задание на исправление ошибок и дальнейшую индексацию страниц.

Повторимся здесь тоже, что исключение страниц по причинам “Неканоническая” “Запрещено элементом noindex”, “Заблокировано в файле robots.txt” и “Переадресация” — скорее всего решение, а не проблема, как было сказано выше в теоретической части. Это означает что страницы скорее всего дублировались и в поиске заменены другими, либо осознанно оттуда исключены.
Чуть ниже объясню что с такими страницами делать.

 

Особенно обратить внимание на:

  • Частое появление статуса «Просканирована или Обнаружена, но не проиндексирована». С такими страницами обязательно нужно работать, если это рабочие, нужные страницы;
  • Большое количество исключенных страниц с ошибкой 404;
  • Массовом исключении страницы из индекса. Это говорить о серьезной проблеме, и нужно провести доп. работы по ее выявлению.

 

 

Отчет №2. Проиндексированные (страницы в поиске)

 

Где смотреть: GSC > Страницы > Посмотреть данные об индексированных страницах

 

Пример отчета - проиндексированные страницы в Google

 

Этот отчет показывает страницы, которые проиндексированы роботом Google. Но, возможно, среди них находятся страницы, которые не должны там быть.
Поэтому стоит проанализировать URLs, хотя бы выборочно.

 

 

Б) Анализ помощью посторонних программ (более простой и быстрый способ)

 

Screaming Frog SEO Spider

 

Screaming Frog SEO Spider — мощная SEO программа, настоящий комбайн. Помощью нее можно решать разные SEO-аналитические задачи, в т.ч. анализ индексации. Программа довольно проста в работе, с понятный интерфейсом (правда, на английском). Для сканирования до 500 урлов — бесплатная.

Как проверить в ней индексацию я рассказывал в видео.

 

 

ComparseR

 

ComparseR — программа в которой очень удобно и просто определить индексацию. По заявлениям разработчика, именно это и является ее основной задачей и отличием от многих других SEO программ и сервисов. Основная ценность компарсера не просто в парсинге страниц сайта, а в сравнении полученных данных при парсинге самого сайта с данными из выдачи поисковиков, что быстро дает понять, какие страницы сайта не индексируются, а какие страницы в индексе, а не должны быть там.
Программа работает просто, но медленно (иногда и сутки требуются). На выходе получаете вот такой файл. Правда, это файл уже после небольшой обработкой — но все данные в нем выдает программа.

 

 

Сравнение и выводы после анализа

 

После проведения анализов и получения отчетов, нужно провести сравнительную аналитику и выводы.

  1. Сделать общие выводы о сканировании и индексации сайта роботами поисковиков;
  2. Определить заблокированные для индексации страницы (и должны ли быть такими);
  3. Определить, какие страницы проиндексированы Google;
  4. Определить, какие страницы НЕ проиндексированы Google (за исключением тех, запрет на индексацию которых мы ставили сами);
  5. Определить, какие страницы проиндексированы Яндекс;
  6. Определить, какие страницы НЕ проиндексированы в Яндекс (за исключением тех, запрет на индексацию которых мы ставили сами);
  7. Запланировать работы по устранению ошибок и последующей индексации непроиндексированных страниц (для Яндекса и Google). Это может быть просто добавление страницы на переобход роботом, снятие запрета индексации, уникализация контента, добавление нового контента, техническая оптимизация страницы, удаление дублей, прочее;
  8. Закрыть от индексации страницы которые не должны быть в поиске (служебные, админские, страницы версии печати, дубли и иные). Запретить можно в файле robots.txt или помощью метатега robots.

 

 

Дополнительный индекс Google

 

Стоит дополнительно обратить внимание на индекс Google. Хоть это и неофициально, считается что у него есть основной и дополнительный индекс. В основном находятся страницы которые участвуют в поиске по целевым фразам, а в дополнительном — те, которые не участвуют, или участвуют очень редко. Иными словами, страницы из дополнительного индекса Google — c одной стороны проиндексированы, с другой, бесполезны, т.к. не показываются в поисковой выдаче.

В дополнительный индекс обычно попадают некачественные страницы, дубли, страницы на которых мало контента и т.п. Словом — мало полезные. Единственный способ чтобы они попали в основной индекс — сделать их качественными и полезными. Добавить больше уникального контента, не повторять содержимое других страниц сайта, устранить технические дубли (об этом подробнее дальше), и т.п.

 

 

Как определить страницы, которые попали не в основной индекс гугла?

 

Нужно в поиске гугл использовать специальные формулы.

Общее число проиндексированных страниц можно получить помощью запроса “site:site.ru”.
Страницы из основного индекса (которые участвуют в поиске) можно получить по запросу “site:site.ru/&”.
Разница — страницы из дополнительного индекса Google, редко участвующие в поиске. Это конечно предполагает дополнительную ручную работу, но специализированного софта для надежного решения таких задач нет.

 

Общее число проиндексированных страниц в Google

Общее число проиндексированных страниц

 

 

Страницы из основного индекса Google

Страницы из основного индекса

 

 

Что еще нужно сделать для настройки правильной индексации?

 

1. Проверить доступность и наличие сбоев в работе сайта

 

Частые перебои в работе сайта усложняют его взаимодействие с поисковыми роботами (он часто оказывается для них недоступным), что затрудняет индексацию. Из-за частых перебоев сайт вообще может быть даже полностью исключен из поиска.

Главную роль в стабильности работы и доступности сайта играет не сам сайт, а стабильность сервера, на котором он размещен. Сервера обычно арендуют у хостинг-провайдеров в разных формах: виртуальный хостинг, VPS, аренда выделенных серверов. Самый простой и доступный: виртуальный хостинг (по сути аренда места в облачном хранилище провайдера).

Очень важно серьезно подойти к выбору хостинга. Главный параметр – высокий аптайм (uptime). Это время непрерывной доступности ресурса (сайта/хостинга/сервера), и у хороших хостингов он достигает отметку в 99,95%. Рекомендую пользоваться хостингом beget.com. Это современный, надежный и проверенный временем провайдер.

 

 

2. Проверить и правильно настроить коды ответов сервера

 

Код ответа сервера — это три цифры, выдаваемые сервером в ответ на вводимый запрос, в которых зашифрована информация о состоянии страницы.

Неправильные ответы серверов могут помешать корректной индексации сайта. Важно убедиться, что они настроены корректно.
Проверить можно в одной их многих программ парсеров сайта (например Screaming Frog SEO Spider), а также встроенными инструментами в панели для вебмастеров.

 

Коды ответов серверов - пример

Коды ответов серверов в программе Screaming Frog

 

Главные коды ответов серверов:

  • 200 ОК (означает, что страница работает и открывается исправно);
  • 404 (при запросе несуществующего или ошибочного адреса, сервер отдает код 404 — страница не существует);
  • 301 (настроен редирект, при запросе одной адреса происходит переадресация на другую страницу);
  • 500 (страница не открывается, серверная ошибка, проблема на стороне хостинга).

 

 

Есть и другие, но это были самые значимые и часто встречаемые на практике.

 

 

3. Создать правильный файл robots.txt

 

Служебный текстовый файл, в котором содержится важная информация для поисковых систем. По сути, это файл для управления индексацией сайта (хоть и считается рекомендательным).

В нем указывается:

  1. Основной адрес сайта (главное зеркало);
  2. Адрес sitemap.xml;
  3. Указание страниц, разделов и ресурсов сайта которых нужно, и которых не нужно индексировать.

 

 

Также указывают дополнительную информацию:

  • можно указать роботу на задержку в индексации при высокой нагрузке на сайт;
  • указать минимальный период времени между окончанием загрузки одной страницы и началом загрузки следующей;
  • указать параметры URL страницы (например, UTM метки), которые не нужно учитывать при индексировании;
  • доп. разрешение на сканирования определенных файлов и ресурсов, чаще всего это изображения (/images/), а также файлы .js и .css (но только в случае, когда иными правилами их индексирование запрещено, например верхний раздел не индексируется).

 

 

Robots.txt должен содержать все необходимые директивы, но с другой стороны не нужно перестараться — вносите в файл только нужное, без лишних указаний.

 

 

Краткий чек-лист по проверке robots.txt

 

Убедитесь, что в robots.txt:

  • НЕТ запрета на индексации нужных разделов сайта;
  • ЕСТЬ запрет на индексацию служебных и ненужных разделов (админ. панель, серверные логи, страницы для печати и пр.);
  • ЕСТЬ запрет на индексацию страниц с динамическими параметрами (/?utm, /?session, *?replytocom);
  • Прописан адрес sitemap.xml;
  • Заданы разные User-Agent для Яндекса и Google;
  • В robots.txt для Яндекса используется Clean-param (подробнее ниже по тексту);
  • Открыты ресурсы для Google (js, css…). Пример ниже.

 

 

Пример открытых ресурсов для Google

Пример открытых ресурсов для Google в robots.txt

 

 

4. Разобраться с дублями страниц и динамическими страницами

 

Страницы-дубли на сайте появляются из-за технических настроек и особенностей систем управления сайтами, появления динамических параметров к некоторым URL-адресам или в результате целенаправленной работы с сайтом.
Кроме дублирования страниц, проблемой представляют динамические, автоматически генерируемые страницы (URL-адреса) на сайте — они не должны индексироваться.

Есть три способа борьбы с дублями и ненужными страницами на сайтах:

  • 301 редирект;
  • атрибут rel=»canonical»;
  • запрет индексации.

 

 

Переадресация (301 редирект)

 

Переадресация с одной страницы на другую (301 редирект) используется всегда, когда дубли страниц бесполезны и не нужны. Настройка редиректа приведет к тому, что поисковая система поймет, что индексировать нужно одну из них (ту, на которую ссылаются). Но, повторимся, т.к. это важно: это только если эти дубли появляются “сами по себе”, не имеют смысла, и одной такой страницы достаточно.

Например, из-за особенностей CMS сайта адреса главной и/или внутренних страниц могут дублироваться. Самый простой пример, когда главная страница доступна и через “www”, и без него. Это классическое дублирование, для поисковика это два разных адреса. Важно, чтобы все страницы сайта (главная и внутренние) всегда открывались только по одному URL адресу. Для этого нужно настроить 301 редиректы:

  • www редирект (сайт доступен только с приставкой, либо без нее);
  • HTTP / HTTPS редирект (сайт доступен только по одному протоколу);
  • редиректы для главной страницы сайта при наличии приставок в конце адреса. Чаще это index.php, index.html, index.htm, main.php. Означает, что главная старница не должна открываться по двум адресам, например site.ru и site.ru/index.html — а только по базовому;
  • «/» редирект (адреса страниц сайта заканчиваются либо со слешем “/” в конце, либо без него);
  • редирект при использовании в URL верхнего регистра символов (происходит переадресация на стандартный нижний регистр).

 

 

Атрибут rel=»canonical» (канонизация)

 

Бывают ситуации, когда дубли делаются целенаправленно, и они необходимы. Например, дубли (или практические дубли, мало отличающиеся между собой) появляются когда нужно один товар разместить в разных категориях, или товар отличается только по цвету.
В таком случае можно указать какая из двух или нескольких страниц-дублей — главная (каноническая). Для этого используется атрибут rel=»canonical».
Тогда не будет происходить переадресация, пользователям будут доступны обе страницы, но поисковый робот будет индексировать одну из них.

Частые случаи использования канонизации:

  • страницы пагинации (пагинация – порядковая нумерация страниц. Например, они создаются, когда список товаров разбиваются на несколько страниц с переходами между ними) ;
  • “осознанные” дубли (один товар в разных категориях).

 

 

Важно, чтобы правильно и только один раз на странице использовать «rel=canonical».
Страницы не должны ссылаться сами на себя (это частая ошибка, когда стоит атрибут canonical указывая на эту же страницу), а исключительно на каноническую страницу на сайте («более главную» страницу с таким же контентом).

Отметим, что в случае со страницами пагинации можно поступить по-другому — уникализировать их. Сделать так, что контент и текст на порядковых страницах 2-3-4 и т. д. — НЕ дублируется, у каждой страницы свое наполнение. Но если их много и сайт большой — это трудный путь.

 

 

Запрет индексации

 

Кроме дублей, иногда создаются автоматические страницы, и страницы с различными параметрами, бесполезными для пользователей. Их индексацию нужно запретить в robots.txt:

  • страницы с различными метками (параметры которые добавляются к адресу URL для отслеживания источника трафика);
  • страницы с динамическими параметрами (параметры URL — это набор символов, следующих в конце адреса после символа вопросительный знак “?”);
  • страницы, генерируемые движком сайта — например, для сохранении истории взаимодействия пользователя с сайтом система использует т.н. сессии, в результате чего в URL страниц появляется параметр PHPSESSID. Для таких целей лучше использовать cookies;
  • страницы, формируемые в результате поиска по сайту или использования фильтров (по необходимости! Страницы фильтров могут и индексироваться, решение принимается индивидуально).

 

 

Дополнительный способ борьбы со страницами с разными параметрами — директива Clean-param. Правда, работает только для Яндекса. Помощью данной директивы в файле robots.txt можно указать поисковику не учитывать динамические GET-параметры (например, идентификаторы сессий, пользователей) или метки (например, UTM).

 

 

5. Настроить сайты дубликаты (если они есть)

 

Если существуют сайты, дублирующие основную версию сайта, в избежании проблем с индексацией в Яндексе нужно загрузить к ним идентичный robots.txt, что и к основному сайту.
В случае с Google нужно для всех страниц дублирующих сайтов использовать атрибут rel=»canonical».
Самый надежный способ узнать, существуют ли дубликаты сайта — вспомнить :-). Нет ли тестовые версии разработки, поддомены, не переезжал ли сайт, а старая версия осталась рабочей, и т.п.

 

 

6. Создать правильный файл sitemap.xml

 

Файл sitemap.xml — служебный документ, в котором содержится полный список всех URL адресов на сайте. Здесь поисковая система может быстро найти и проиндексировать все страницы сайта.

Несколько правил составления XML карты:

  • В XML-карте сайта не должно быть ссылок на страницы с редиректами. Лучше чтобы там были только конечные URL адреса. Добавим, что не только в сайтмап, а и в целом на сайте лучше, чтобы не было ссылок, которые отдают 301 редирект, если сразу можно поставить конечную ссылку;
  • Карта не должна содержать битые ссылки (с кодом ответа 404);
  • В карте не должны быть дубли страниц (в т.ч. неканонические версии страницы), служебные, тестовые, страницы “ в разработке”, версии для печати, автоматически сгенерированные, и т.п.
  • В сайтмап не должны быть ссылки, запрещенные к индексации через robots.txt;
  • Для указания адресов изображений с сайта стоит делать отдельную xml-карту сайта;
  • Сайтмап должна регулярно обновляться и быть доступна по адресу указанному в robots.txt.

 

 

Сгенерировать sitemap.xml можно внешними сервисами-генераторами или дополнительными модулями для CMS (систем управления сайтами). После создания нужно загрузить в корень сайта и указать адрес на нее в Яндекс Вебмастер и Google Search Console.

 

 

7. Создать полную html карту сайта

 

HTML карта сайта, в отличие от sitemap.xml — обычная страница на сайте (т.е. это не xml файл) с ссылками на все страницы сайта, на которые вы хотите чтобы поисковый робот точно попал. Для совсем небольшого сайта ее можно создать руками, а для больших или средних сайтов можно использовать плагины для CMS (например Hierarchical HTML Sitemap для WordPress или Sitemap для Drupal). HTML карта, возможно, не обязательна, и индексация может пройти исправно и без нее, но она нередко используется и пользователями, особенно если сайт большой и с неидеальной навигацией.

 

 

Технический аудит сайта

 

Технический аудит — это анализ и оценка технических параметров сайта. Поисковые системы уделяют им серьезное внимание и считают их важным фактором ранжирования в результатах поисковой выдачи.

На техническое состояние сайта влияют его наполнение, настройки и особенности CMS (система управления сайтом), настройки и особенности сервера и хостинга, и то, как сайт был сделан разработчиком (чистый и правильный код, использование разных технологий, скриптов, плагинов и модулей).
Но не все технические факторы при этом имеют одинаковый вес — есть более и менее важные.

 

 

Скорость загрузки

 

Скорость загрузки сайта имеет важное значение, как для поисковых систем, так и для пользователей. Согласитесь, вы не стали бы ждать загрузку сайта 10-15 секунд, а скорее бы перешли уже на следующий.
Идеальное время загрузки — до 2 сек. Приемлемое — до 4-5 сек., не больше.

Самый популярный инструмент измерения скорости загрузки — от Google. Но есть важный нюанс: он не измеряет фактическую скорость загрузки, а всего лишь процент от максимально возможного. Там вы не увидите скорость в секундах, а значение в процентах, а также что можно исправить, чтобы ускорить сайт. Считается, что если в зеленой зоне (90-100 баллов) — это отличный результат. 70-90 — достаточный.
Ниже 50 — обязательно требует исправление недочетов.

 

Google Page Insights - скорость загрузки сайта

Данные Google Page Insights о скорости загрузки сайта

 

Для реального измерения скорости загрузки есть несколько других сервисов: loading.express, sitespeed.ru или sitespeed.me.

 

 

Что можно сделать чтобы ускорить загрузку сайта?
  1. Оптимизировать изображения на сайте (сжать их);
  2. Включить на сайте сжатие GZIP или deflate;
  3. Сократить до минимума объемы HTML кода;
  4. Сократить до минимум используемые скрипты на сайте (и по возможности вынести их в отдельные файлы);
  5. Все CSS стили оптимизировать (сократить) и вынести в отдельные файлы (не в самом html коде);
  6. Использовать кэш браузера и заголовки expires, last modified и if-modified-since (помогают браузеру понять, когда были последние изменения на сайте, и если они были до последнего посещения страницы пользователем, т.е ничего с тех пор не изменилось — то открывает сохраненную у себя в кеше версию, что быстрее);
  7. Не использовать слишком много переадресаций и циклические ссылки (страницы ссылающиеся сами на себя);
  8. Увеличить доступность ресурса — аптайм. В большинстве случаев подразумевает смену хостинга на более быстрый.

 

 

Адаптивная верстка или мобильная версия сайта

 

Главное, чтобы сайт был удобен для просмотра с мобильных устройств. Я лично предпочитаю адаптивную версию, но если у вас есть причины делать отдельную мобильную версию сайта, я не против :-).

Главное, чтобы сайт проходил мобильную валидацию от Яндекса и Google, и, даже более важно — чтобы действительно было удобно пользоваться сайтом с телефона.

Когда говорим об адаптивности, стоит еще упомянут кроссбаузерность — т.е. адаптивность сайта под разные браузеры (Яндекс Браузер, Хром, Мозилла, и т.п.).
Проверить можно вручную, или такими сервисами как browsershots.org или browsera.com.

 

 

URL адреса

 

Частично урлы на сайте создаются автоматически, системой управления сайтами, частично создает их администратор сайта (при создании новых страниц, первая часть обычно задана в настройках системы, а завершающую задает вебмастер).
В адресе, site.ru/catalog/category/tovar1 например, /catalog/category/ скорее всего заданы на уровне CMS, а /tovar1 задается руками при создании новой страницы на сайте.

Нужно настроить систему и аккуратно вписывать ручные адреса, для того чтобы URL адреса соответствовали нескольким правилам:

  • На сайте используются ЧПУ (человеку понятные урлы, но написанные латиницей). Нужно писать site.ru/statya-o-urlah, а не site.ru/27849-sfh;
  • Есть логичная структура и иерархия URL-ов. Правильно — site.ru/catalog/category1/tovar1. Неправильно site.ru/tovar1. Зависит конечно от ассортимента и числа разделов, категорий и подкатегорий. Но не нужно перестараться — убедитесь, что уровень вложенности в URL не превышает 5;
  • Используются краткие и понятные URL-ы, с ключевыми словами, но без переспама. Вот так нельзя: site.ru/catalog-tovarov/categorya-tovarov/tovar1;
  • Старайтесь не использовать заглавные буквы и нижние подчеркивания (лучше использовать дефисы «-«);
  • URL разводящих страниц (разделов, категорий) должны содержать такие элементы как: /catalog/; /tovari/; /products/; /shop/ /uslugi/, /services/ и т. д.

 

 

Протокол HTTPS

 

Использование защищенного протокола уже является обязательным фактором ранжирования и в Яндексе и в уже подавно в Google. Обязательно приобретите SSL сертификат и настройте доступность сайта только через защищенный HTTPS протокол.

Несколько правил использования SSL и Https:

  1. Используется сервер (хостинг) с поддержкой HTTP Strict Transport Security (HSTS). Можно просто уточнить у хостинга;
  2. Все страницы сайта доступны только через защищенный протокол Https. Настроена переадресация, и все страницы на сайте с HTTP ссылаются на адрес с HTTPS, а не наоборот;
  3. Срок действия сертификатов не истекает в скором времени;
  4. Используется сертификат надежного сертификационного центра. Если бесплатный, то только Let’s Encrypt;
  5. На сервере используется последняя и наиболее безопасная версия протокола TLS1.2 (не старые версии TLS или SSL3 протокола). Уточнить у хостинга;
  6. Сертификат работает во всех веб-браузерах. Рекомендую проверить вручную;
  7. Проверьте помощью сервиса https://www.jitbit.com/sslcheck/ нет ли на сайте смешанного контента (т.е. часть доступна через Http, часть через Https).

 

 

Микроразметка

 

Перечисляем внедрение микроразметки в технические работы, потому что по факту это работа для технического специалиста. Но отношения к техническому состоянию сайта она не имеет. И без нее сайт работает исправно.

 

 

Для поисковых систем

 

Микроразметка помогает поисковым системам лучше понять о чем сайт, что на нем, и какие данные взять с сайта для показа расширенного сниппета в результатах поисковой выдачи.
Сниппет – это краткая информация, которая показывается в выдаче вместе с ссылкой на сайт.
Расширенный сниппет улучшает представление сайта в поисковой выдаче, пользователям понятнее что тут, и они охотнее переходят на сайт. Для расширенного сниппета используются данные, размеченные микроразметкой. 

 

Сайт без микроразметки - пример

Пример сайта без микроразметки

 

 

Сайт с микроразметкой - пример

Сайт с микроразметкой

 

Самая популярная и рекомендуемая Яндексом и Google микроразметка — Schema.org. Помощью микроразметки schema.org можно размечать товары и их стоимость, отзывы, контакты, статьи, изображения.

 

 

Для социальных медиа

 

Существует еще и стандарт разметки Open Graph. Он позволяет контролировать представление сайта при публикации ссылки в социальных сетях. Чтобы было красивое превью, а не просто ссылка — тем самым увеличивая вероятность взаимодействия с пользователями.
Видео про микроразметку.

 

 

Еще советы по технической оптимизации сайта

  1. Убедитесь, что на сайте нет битых ссылок. По крайней мере, в больших количествах;
  2. Проверьте, нет ли частых ошибок со стороны сервера/хостинга (коды ответа сервера: 5xx). Установите “слежку” за работой хостинга, настройте мониторинг помощью таких сервисов: uptimerobot.com или uptimedoctor.com/ru.
  3. Если набрать ошибочный адрес, открывается страница, на которой ясно указано, что это ошибка 404, и что такого адреса нет. И обязательно со ссылкой на главную страницу сайта;
  4. Проверьте, есть ли у сайта есть favicon.ico (маленькая иконка в браузере). Если нет — добавьте ее;
  5. Для сайта указана и используется корректная кодировка- оптимально UTF-8; Проверить можно в практически любую SEO программу или онлайн сервис — например этот;
  6. Удостоверьтесь, что нет критических ошибок в валидности кода по W3C HTML и W3C CSS, которые способны повлиять на отображение контента. Проверить в сервисе https://validator.w3.org. Обратите внимание: ошибок точно будет, они есть у любого сайта, и тут не нужно стремиться к идеалу. Речь идет только о по-настоящему критических;
  7. Проверьте, не задействованы ли теги заголовков h1-h6 в меню, ссылках, сквозных элементах сайта. Эти заголовки используются исключительно в тексте на странице. И наоборот: в заголовках на странице не должны встречаться иные теги, кроме тегов h1-h6;
  8. Если есть возможность, не используйте на сайте Flash и Frame (или убедитесь что в них нет ценного контента, которые должен быть проиндексирован поисковыми системами);
  9. Ссылки, которые не должны передавать вес сделайте скриптами (формы обратной связи, телефон, скайп, e-mail, pdf, галереи, всплывающие элементы, и т.п.);
  10. Убедитесь, что ссылки в пунктах меню прописаны текстом, а не картинками;
  11. Если на сайте есть сквозные (повторяющиеся на все или на многих страницах) блоки или элементы, которые вряд ли нужно показывать поисковой системе — закройте их от индексации;
  12. Старайтесь, чтобы документы (страницы) весили не больше 10 МБ.

 

 

Программы и сервисы, помощью которых можно сделать технический аудит сайта

 

Перечислим несколько сервисов и программ, помощью которых можно в т.ч. проверить все то, о чем шла речь выше (и не только).

 

 

Выводы

 

Техническая исправность сайта влияет на восприятие его поисковыми системами, а этим и на ранжирование и позиции в результатах выдачи. Особенно если на сайте допустить весомые ошибки. Поэтому не пренебрегайте этой частью оптимизации сайта — она очень важна.
Но помните: техническая часть — больше для роботов. А ваш сайт — для людей. Уделяйте не меньше внимания его наполнению, качеству контента, удобству, пользы которой он дает вашим пользователям. И все будет хорошо!

Игор Ивчевски
Автор:
Интернет-маркетолог, автор маркетинговой системы с сайтоцентричным подходом. Сочетание 7+ маркетинговых навыков. Опыт с 2013 года.
Все публикации автора