robots.txt | Контекст + 2.0

Записи с меткой: robots.txt

Сегодня в СМИ

Последнее
- «Яндекс» и «Лаборатория Касперского» вошли в АНО «Умный МКД»
  В состав участников АНО «Умный МКД», занимающейся разработкой стандартов по цифровизации многоквартирных домов (МКД),
- Дуров: демократы требовали от Telegram выдать все данные после штурма Капитолия
  После штурма Капитолия в январе 2021 года руководство мессенджера Telegram получило обращение от представителей
- Microsoft прекратит поддержку пакетов приложений Office 2016 и 2019
  Американская корпорация Microsoft сообщила, что с 14 октября 2025 года полностью прекратит поддержку офисных пакетов
- В Threads могут появиться личные сообщения
  Американская корпорация Meta (признана экстремистской и запрещена в РФ) тестирует новую функцию в сервисе микроблогов
- Apple опустился на вторую строчку в списке крупнейших производителей смартфонов
  Поставки смартфонов Apple упали примерно на 10% в первом квартале 2024 года, сообщила исследовательская компания IDC.

Комментарии
- mogzem: Полезная информация для родителей - на что обратит »
- Вадим: Спасибо за новость »
- Анастасия: Очень люблю такую маску! Кстати, мёд тоже :) Ещё я »
- onlinemixx: А спецы америкосов стопроцентов уже давно имеют до »
- onlinemixx: Сколько людей - столько мнений, способов и прочего »

На чем я зарабатываю:

Последние твиты

Где раскручивать сайт:

Архив записей

Google «заблокировал» отдельные страницы, закрытые в robots.txt 5 апреля 2013 года | Google

На страницах групп в сервисе «Рекомендаций для веб-мастеров» появились жалобы отдельных пользователей на то, что в отчетах об индексации страниц Google (Index Status report) в «Инструментах для вебмастеров» они обнаружили уведомления о том, что алгоритм поисковика заблокировал URL отдельных страниц.

Поначалу данная информация вызвала легкое смятение у специалистов, однако в ходе проверки выяснилось, что в отчетах содержались данные о якобы блокировке отдельных веб-страниц, ранее закрытых в robots.txt. Хотя в

Google: robots.txt не должен превышать 500 Кб 1 февраля 2012 года | Google

Представитель команды помощи вебмастерам Google Джон Мюллер на своей странице в Google+ напомнил вебмастерам, что для файлов robots.txt установлен лимит по объёму в 500 Кб.

В комментариях к сообщению было отмечено, что даже у Google этот файл весит всего 6,43 Кб, поэтому аналогичный документ, занимающий полметра пространства, - это случай из разряда фантастики. Однако Мюллер заметил, что и такое может произойти, к примеру, если CMS сайта самостоятельно создаёт файл robots.txt.

Если ваш файл

Почему рискованно не иметь файл robots.txt 26 августа 2011 года | Google

В последнем видеоролике на Webmaster Help Мэтт Катс рассказал ответил на вопрос пользователя о файле robots.txt . Вопрос звучал так: “Лучше ли иметь пустой файл robots.txt или содержащий User-agent: *Disallow:” или, может быть, лучше не иметь файла robots.txt совсем?”

«Я бы ответил, любой из двух первых вариантов», - были первые слова Катса. «Совсем не иметь файл robots.txt несколько рискованно, потому что иногда, если у вас этого файла нет, ваш веб-хост отдает страницу 404, а это уже ведет к

Яндекс и Sitemap 3 июня 2008 года | Поисковые системы

Обычно робот Яндекса узнаёт о страницах сайта, переходя по ссылкам. В большинстве случаев этого достаточно для полной индексации сайта. Однако, если ваш сайт содержит много динамически создаваемых страниц или же страницы, для попадания на которые требуется много переходов по ссылкам, робот Яндекса может не сразу найти некоторые страницы сайта или неверно определить их важность. Файлы Sitemap помогают решить эти проблемы.

Файл Sitemap -- это файл с дополнительной информацией о страницах сайта,

Все о Robots.txt 28 января 2008 года | Поисковые системы

Поисковые сервера всегда перед индексацией вашего ресурса ищут в корневом каталоге вашего домена файл с именем "robots.txt" (http://www.mydomain.com/robots.txt). Этот файл сообщает роботам (паукам-индексаторам), какие файлы они могут индексировать, а какие нет.

Формат файла robots.txt - особый. Он состоит из записей. Каждая запись состоит из двух полей: строки с названием клиентского приложения (user-agent), и одной или нескольких строк, начинающихся с директивы disallow:

<Поле> ":"

Пн	Вт	Ср	Чт	Пт	Сб	Вс
« Мар
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

Записи с меткой: robots.txt

Сегодня в СМИ

На чем я зарабатываю:

Последние твиты

Где раскручивать сайт:

Архив записей

Google «заблокировал» отдельные страницы, закрытые в robots.txt

Google: robots.txt не должен превышать 500 Кб

Почему рискованно не иметь файл robots.txt

Яндекс и Sitemap

Все о Robots.txt

Последние записи

Календарь статей

Последние комментарии