Как создать XML карту сайта

Нам часто стали приходить предложения написать несколько статей про основы SEO оптимизации сайтов. Поэтому мы запускаем серию статей на данную тему, и начнем с Карты сайта. XML Карта сайта представляет собой простой текстовый файл, который используется, чтобы предоставить информацию о каждой ссылке на вашем веб-сайте. Карта сайта включает в себя местоположение, дату последнего изменения страницы, частота изменения и приоритета для каждого URL адреса. Если у вас есть международный или многоязычный сайт, вы можете также использовать карту сайта, чтобы составить связь между языковыми версиями URL адресов. Все эти элементы снабжают поисковых ботов информацией о вашем сайте, помогая им сканировать и индексировать страницы наиболее легко и эффективно.

Ниже представлена карта сайта многоязычного сайта:

xml карта сайта

Вот краткое изложение терминов:

  • <urlset> - Стандартный протокол для открытия и закрытия XML карты сайта.
  • <url> - Тег, который обозначает начало каждой записи URL.
  • <loc> - Расположение страницы. Всегда используйте одинаковый вид URL-адресов в ваших Sitemaps (https: //, WWW и т.д.)
  • <lastmod> - Последняя дата изменения страницы. Всегда пишите дату в формате YYYY-MM-DD.
  • <changefreq> - Как часто вы вносите изменения в этот файл.
  • <priority> - Насколько важна эта страница для сайта в целом. Значение находится в диапазоне от 0,0 до 1,0. 0,5 - приоритет по умолчанию.
  • <xnk:link> - Этот тег содержит URL-адреса альтернативных версий страницы. В нашем случае они указывают на версии страниц на разных языках.

Тег <loc> необходим для каждого URL адреса который вы добавляете в карту сайта. Это говорит поисковым ботам, где находятся эти страницы. Также многие думают что могут обмануть поисковые системы, установив тег <changefreq> со значением "ежедневно", чтобы поисковые роботы чаще сканировали эти страницы. Но если Sitemap не отражает реальные значения, наиболее вероятно что поисковые системы будут игнорировать их, что может привести к более долгому сканированию.

Добавляйте тег <image> для информирования Google и Yandex о ваших изображений, чтобы они могли появиться в поиске по изображениям. Каждый тег <image>, должен находиться внутри тега <url>:

<url>

    <loc>https://www.example.com</loc>
    <image:image>

        <image:loc>https://www.example.com/image.jpg</image:loc>
    </image:image>

</url>

Вы также можете установить дополнительные атрибуты для тега <image>, чтобы предоставить более подробную информацию об изображении:

  • <image:caption> - Короткое описание изображения
  • <image:geo_location> - Геолокация изображения
  • <image:title> - Заголовок изображения
  • <image:license> - Ссылка на лицензию

Если вы используете видео на своих страницах, сделать его доступным для поиска по видео, возможно при помощи тега <video>. Например, если ваша страница www.example.com/video1 имеет встроенное видео, видеоплеер или необработанное видео, добавить тег <video> внутри тега <url>:

<url>

<loc>https://www.example.com/video1</loc>

<video:video>

<video:thumbnail_loc>https://www.example.com/thumbnail/vid1.jpg</video:thumbnail_loc>

<video:title>Простое видео 1</video:title>

<video:description>Это небольшое описание вашего видео. Максимальная длинна 2048 символов.</video:description>

<video:content_loc>https://www.example.com/video/sample1.mov</video:content_loc>

<video:duration>10</video:duration>

</video:video>

</url> 

Есть большое количество дополнительных атрибутов, благодаря которым вы можете предоставить больше информации о вашем видео поисковым системам:

  • <video:player_loc> - URL адрес, указывающий на проигрыватель для видео. Если видео встроено на сторонней страницы например YouTube или Vimeo, вы можете использовать этот тэг вместо video:content_loc. Как правило, этот URL присутствует в коде встраивания видео со стороннего ресурса.
  • <video:duration> - Продолжительность видео в минутах от 0 до 28800 (8 часов). Технически данный атрибут не обязательный, но Google рекомендует использовать его.
  • <video:expiration_date> - Добавьте этот атрибут, если ваше видео не будет доступно после определенной даты. Дата должна быть в формате YYYY-MM-DD, и время Thh:mm:ss:TZD.
  • <video:rating> - Рейтинг видео. Принимает значения от 0.0 до 0.5.
  • <video:view_count> - Количество просмотров видео.
  • <video:publication_date> - Дата первой публикации видео.
  • <video:family_friendly> - Если значение No - то ваше видео будет появляться только в результатах поиска, когда пользователь отключает SafeSearch.
  • <video:tag> - Краткое описание основных концепций, связанных с видео. Данный элемент может содержать внутри себя еще 32 тега.
  • <video:category> - Категория обложки видео, например SEO, маркетинг, реклама.
  • <video:restriction relationship=allow/deny> - Список стран, в которых нужно ограничить доступ к видео, или наоборот, в зависимости от установленного значения. Страны разделяются пробелами и используют коды ISO 3166. Без использования этого тега, видео будет доступно по всему миру.
  • <video:gallery_loc> - URL адрес коллекции, в которой находится ваше видео. Каждое видео может иметь только один тег <video:gallery_loc>.
  • <video:requires_subscription> - Субтитры в видео.
  • <video:uploader> - Если видео встроено с другого видео сайта, указать в этом теге имя хоста. Этот URL-адрес должен быть таким же, как тег <loc>.
  • <video:platform_relationship=allow/deny> - Ограничение воспроизведения видео на определенных платформах (web, mobile или tv).

XML Карта сайта ограничена по размеру и количеству URL адресов, которые вы можете добавить в файл. Карта сайта может иметь только 50000 записей, до 1000 изображений и её максимальный размер составляет 10МБ. Если у вас действительно большой сайт, который имеет большое количество страниц, изображений или видео, вам нужно создать несколько сайтмапов. Если вы столкнулись с такой проблемой, вам нужно объединить несколько карт в одном файле, так называемом Sitemap Index File.

xml карта сайта

В основном это обычная XML карта сайта без дополнительных деталей, в которой есть теги <loc> и <lastmod> для каждого URL-адреса, которые ведут на разные XML Sitemap. Главное отличие здесь в теге <sitemap> который заменяет тег <url>, а также тег <sitemapindex> заменяет <urlset>.

Нужна ли XML Sitemap для моего сайта?

Является ли карта сайта строгой необходимостью? В техническом плане - Нет. Ваш сайт будет по-прежнему работать и без неё, и даже может быть отсканирован и проиндексирован поисковыми системами. Кроме того, Sitemaps не используются в качестве ранжирования, таким образом ваш сайт не получит более высокий ранг, если на нем присутствует карта сайта.

Так зачем её создавать? Самая главная причина создания XML карты сайта это - индексация. Даже если поисковые системы могут найти ваши страницы и без карты сайта, её наличие, сделает процесс поиска и индексации намного проще для поисковых роботов. Гораздо сложнее найти страницы выпадающие из компоновки вашего сайта (страницы, без внешних и внутренних ссылок). Sitemap особенно важен, когда вы добавляете новые страницы или создаете совершенно новый сайт, который не имеет большой ссылочной массы.

Файлы Sitemap также помогают поисковым системам сканировать страницы вашего сайта наиболее эффективно. Они принимают во внимание теги <changefreq> <lastmod>, которые помогают регулировать их частоту сканирования. Также страницы с более высоким уровнем приоритета, будут чаще сканироваться и индексироваться, что позволяет чаще обновлять наиболее важные части вашего сайта в поисковых системах.

Если у вас есть геотаргетинговый, международный сайт, или сайт который переведен на несколько языков, вы можете использовать XML Sitemap с наибольшей пользой. Как мы показали в примере выше, теги <hreflang> в файле Sitemap, сообщают сканерам, что у вас есть несколько версий указанной страницы. Поисковые системы могут использовать эту информацию, чтобы убедиться, что они выдают правильную версию вашего сайта для пользователей, на основе языка или местоположения.

Как создать XML карту сайта?

Существуют различные способы создания XML карты сайта. Для начала определитесь, какие страницы будут сканировать и индексировать поисковые системы, и убедитесь что вы не блокируете файл robots.txt или мета-тег robots. Затем определите канонические URL адреса (протокол, WWW, заглавные буквы и т.д.). Это очень важно, потому что XML Карта сайта требует использовать абсолютные URL-адреса.

После того, как вы определили, какие страницы и канонические URL-адреса вы хотите добавить в карту, нужно определиться со способом добавления, первый вариант - ручное добавление. Конечно, данный вариант не рекомендуется, чем больше ваш сайт, тем больше шансов допустить ошибку. К счастью, есть много инструментов, которые помогут сгенерировать вашу карту сайта за вас.

После того, как ваша карта сайта создана, убедитесь что она не слишком большая. Как мы уже упоминали ранее, размер XML карты сайта ограничен до 50000 URL и 10Мб. Убедитесь, что в карте используются не просто канонические адреса, но и дополнительные параметры URL адресов, такие как идентификаторы сеансов и правильное экранирование (если вы использовали качественный инструмент для генерации, вероятно, все эти пункты уже были сделаны за вас). Специальные символы должны быть написаны в кодировке ASCII:

  • Амперсанд (&): &
  • Одинарная кавычка (`): '
  • Двойная кавычка ("): "
  • Больше (>): >
  • Меньше (<): <

Осталось проделать последний шаг, перед тем как загрузить карту на сервер: Сжатие. Сжимая карту сайта позволяет уменьшить нагрузку на сервер, который играет важную роль, если это большой файл и его часто используют роботы. Для сжатия лучше всего использовать GZIP; Поисковые системы имеют проблемы с открытием .zip файлов.

Сохраните созданную карту сайта в корневом каталоге - в виде https://www.example.com/sitemap.xml. После того как вы добавили XML карту на свой сайт, добавьте её в Google Вебмастер, для поиска ошибок. Зайдите в Google Вебмастер, перейдите в раздел "Файлы Sitemap" и нажмите на кнопку "Добавление/Проверка файла Sitemap". Добавьте URL адрес карты сайта и нажмите кнопку "Тест".

Добавление карты сайта

После того, как вы исправили найденные ошибки в карте, предоставьте её Google, используя тот же инструмент. Также настоятельно рекомендую отправить карту сайта в Yandex и Bing, это делается таким же способом, при помощи инструмента "Вебмастер". Кроме того убедитесь, что вы указали местоположение XML Sitemap в файле robots.txt, используя путь Sitemap: https://www.example.com/sitemap.xml.

Заключение

Если вы все сделали правильно, XML карта сайта поможет поисковым системам быстро найти, сканировать и индексировать ваш веб-сайт. Убедитесь, что вы правильно отформатировали, сжали и отправили свою XML Карту сайта для поисковых систем, чтобы получить больше преимуществ.

Делитесь опытом создания карты сайта в комментариях. Какие преимущества вы заметили? Сталкивались ли Вы с какими-либо проблемами?

Перевод статьи XML Sitemaps: The Beginner’s Guide

Тэги: XMLsitemapseo

Вход

Уважаемый пользователь! Мы обнаружили, что вы используете AdBlock и вынуждены скрыть часть материалов на нашем сайте. Siteacademy существует и развивается за счет доходов от рекламы. Просим внести наш сайт в список исключений или отключить Блокировщик рекламы на нашем сайте.