Sitemap …Ð Ñ Ð±Ñ‹ не ходил. Кардинал не дама, разговор пойдет не о любви.
Robots.txt и Sitemap.xml или метод кнута и прÑника!
Почему так важно иÑпользовать карту Ñайта? Что предпочитают поиÑковые ÑиÑтемы и как улучшить индекÑацию Ñайта Ñ Ð¿Ð¾Ð¼Ð¾Ñ‰ÑŒÑŽ robots.txt и sitemap.xml? Как Ñделать Ñайт лакомым куÑочком Ð´Ð»Ñ Ð¿Ð¾Ð¸Ñковых ботов и предотвратить ÑиÑтемную перегрузку? РаÑÑмотрим на примерах популÑрных поиÑковых ÑиÑтем.
Карта Ñайта Ð´Ð»Ñ Ð¿Ð¾Ñетителей реÑурÑа – Ð²Ð¸Ð·ÑƒÐ°Ð»ÑŒÐ½Ð°Ñ Ð¼Ð¾Ð´ÐµÐ»ÑŒ его Ñтруктуры, чем – то ÑÑ…Ð¾Ð¶Ð°Ñ Ñ Ð³ÐµÐ¾Ð³Ñ€Ð°Ñ„Ð¸Ñ‡ÐµÑкой картой, но ÑƒÐºÐ°Ð·Ñ‹Ð²Ð°ÑŽÑ‰Ð°Ñ Ð»Ð¸Ð±Ð¾ вÑе его разделы и категории, либо общие только поверхноÑтные уровни. Sitemap.xml – файл, в котором ÑодержитÑÑ Ð¸Ð½Ñ„Ð¾Ñ€Ð¼Ð°Ñ†Ð¸Ñ Ð¾Ð±Ð¾ вÑех Ñтраницах Ñайта, которые должны быть проиндекÑированы. Robots.txt – Ñто текÑтовый файл, предназначенный Ð´Ð»Ñ Ð¸Ð½ÑÑ‚Ñ€ÑƒÐºÑ‚Ð¸Ñ€Ð¾Ð²Ð°Ð½Ð¸Ñ Ð¿Ð¾Ð¸Ñковых ботов и задающий определенные Ð¾Ð³Ñ€Ð°Ð½Ð¸Ñ‡ÐµÐ½Ð¸Ñ Ð¸Ñ… работы.
КÑтати, протокол sitemap.xml был впервые введен поиÑковой ÑиÑтемой Гугл Ð´Ð»Ñ Ñ‚Ð¾Ð³Ð¾, чтобы мы могли уведомлÑть поиÑковых роботов о Ñтраницах, требующих индекÑации. ПоÑле Ð½Ð¾Ð²Ð¾Ð²Ð²ÐµÐ´ÐµÐ½Ð¸Ñ Ð¿Ñ€Ð¾Ñ‚Ð¾ÐºÐ¾Ð» sitemap.xml был принÑÑ‚ поиÑковыми ÑиÑтемами MSN и Yahoo (2006 год), а ЯндекÑом аж в 2008 г. Также еÑть Ñпециальный плагин sitemap Ð´Ð»Ñ ÑÐ¾Ð·Ð´Ð°Ð½Ð¸Ñ ÐºÐ°Ñ€Ñ‚Ñ‹ блога на базе wordpress, поддержанный также Ñравнительно недавно. ЕÑли вы хотите уÑтановить карту Ñайта, но Ваш движок не поддерживает sitemap, можно воÑпользоватьÑÑ ÑƒÑлугами xml – sitemaps, который поможет Ñоздать xml файл.
Перед тем, как открыть двери перед поиÑковой ÑиÑтемой, необходимо тщательно подготовитьÑÑ. ПоÑтому было бы неплохо ознакомитьÑÑ Ñ Ñ€ÐµÐºÐ¾Ð¼ÐµÐ½Ð´Ð°Ñ†Ð¸Ñми по продвижению Ñайтов, которые доброжелательно предоÑтавлÑÑŽÑ‚ Ñами поиÑковые ÑиÑтемы. Ð”Ð»Ñ Ð¯Ð½Ð´ÐµÐºÑ Ð¸ Гугл приоритетное значение имеет файл robots.txt, раÑположенный в корневой директории Ñайта. ИÑпользование файла sitemap.xml возможно, но при Ñтом необходимо проинформировать поиÑковые ÑиÑтемы, которые поддерживают Ñтот протокол, о том, где он размещен Ñ Ð¿Ð¾Ð¼Ð¾Ñ‰ÑŒÑŽ файла robots. txt или при помощи http – запроÑа.
Ð’ файле sitemaps размещаетÑÑ Ð¸Ð½Ñ„Ð¾Ñ€Ð¼Ð°Ñ†Ð¸Ñ Ð¾ том, какие Ñтраницы реÑурÑа должны быть проиндекÑированы поиÑковыми ÑиÑтемами. Ðо применение протокола sitemaps не гарантирует их 100% индекÑацию. Тогда Ð´Ð»Ñ Ñ‡ÐµÐ³Ð¾ иÑпользовать sitemaps? ИÑпользование sitemaps не увеличит ÑкороÑть индекÑации Ñайта поиÑковыми ÑиÑтемами, он лишь оÑведомлÑет обо вÑех Ñтраницах Ñайта и о том, Ñ ÐºÐ°ÐºÐ¾Ð¹ чаÑтотой они обновлÑÑŽÑ‚ÑÑ, таким образом, Ð¾Ð±Ð»ÐµÐ³Ñ‡Ð°Ñ Ñ€Ð°Ð±Ð¾Ñ‚Ñƒ поиÑковых ÑиÑтем.
Также важно иÑпользовать и пропиÑывать файл robots.txt, Ñ Ð¿Ð¾Ð¼Ð¾Ñ‰ÑŒÑŽ которого можно как разрешить, так и запретить индекÑацию определенных Ñтраниц, что предотвратит перегрузку Ñервера и обеÑпечит беÑперебойную работу ÑиÑтемы. ОÑновное назначение файла robots.txt – не допуÑтить поиÑковых роботов к определенным директориÑм Ñайта. ЕÑли никаких указаний Ð´Ð»Ñ Ð¿Ð¾Ð¸Ñковых ÑиÑтем в файле robots.txt нет, то реÑÑƒÑ€Ñ Ð¿Ð¾Ñтупает полноÑтью в их раÑпорÑжение!
Ð’Ñ‹ понÑли, как дейÑтвует метод кнута и прÑника? Приручить поиÑкового бота можно Ñ Ð¿Ð¾Ð¼Ð¾Ñ‰ÑŒÑŽ robots. txt (кнут) и немного побаловать, облегчив работу Ñ Ð¿Ð¾Ð¼Ð¾Ñ‰ÑŒ sitemap. xml (прÑник)! И не забываем указывать меÑтонахождение sitemap, чтобы каждый раз не выÑылать приглашение поиÑковым ÑиÑтемам зайти на Ñайт. Таким образом, оптимальное решение – иÑпользовать преимущеÑтва и robots.txt и sitemap.xml!
Related posts:
- PageRank …Ðто даже хорошо,что пока нам плохо
- SEO …Ðе были мы ни в какой Таити. ÐÐ°Ñ Ð¸ здеÑÑŒ неплохо кормÑÑ‚.
- Supplemental index …Ходишь, ходишь в школу, а потом бац – Ð²Ñ‚Ð¾Ñ€Ð°Ñ Ñмена!
- Optimization …Я Ñам диÑÑидент – из Ðлабамы
- РаÑÑылка …Почему зачинщик ÑкÑперимента до Ñих пор не повешен

Ð’Ñе верно напиÑано, Ñти два файла очень полезны, Ñ Ð¿Ð¾Ð¼Ð¾Ñ‰ÑŒÑŽ robots.txt можно закрыть индекÑацию Ñайта многими не нужными ботами и Ñто реально разгрузит Ñервер.