Как узнать какие страницы выпали из индекса. Причины выпадения страниц из индекса

03.07.2020

Последнее время довольно актуальной является тема массового выпадения сайтов или отдельных страниц из Яндекса . Возникает вопрос?…почему так происходит? Что такого произошло, что Яндекс стал выкидывать страницы из своей базы.

С чем связано выпадение из Яндекса, до конца еще пока не выяснено. У меня сайт выпадал из Яндекса 2 раза, причем продажных ссылок 0, контент уникальный, нарушений в принципе нет. Так почему же Яндекс его выкидывает и через недели 2-3 возвращает на место. При этом после возвращения сайта в базу, получена проиндексированность более качественная, чем была до этого.

Думаю, что это скорее всего баг самой поисковой системы, бана не происходит, сайт свободно добавляется в форму регистрации и возвращается на утерянные позиции. Но не всем так везет в моменты АПа, некоторые получают бан. Яндекс безжалостно выкидывает страницы с продажными ссылками от Сапы и ему подобных автоматических бирж торгующих ссылочным золотом.

Совершенствуя свои алгоритмы работы, поисковая система Яндекс, с каждым разом ужесточает фильтры, выполняющие роль пессимизаторов страниц и сайтов нарушающих условия пользования поисковой системой. Яндекс такой же коммерческий продукт, как и большинство в сети и раз уж он предоставляет свои услуги по размещению сайтов в своей базе, соответственно как при капиталистическом строе, имеет право их выкинуть обратно.

Необходимо знать моменты, которые помогут не впасть в немилость к фильтрам Яндекса, тем самым избежать пессимизации или упаси бог бана поисковой системы:

  • Не злоупотребляйте ключевыми словами на странице (4-7% не более)
  • Не ставте избыточное количество внешних ссылок на одной странице, касается также продажных (3-5 более чем достаточно)
  • Не ставте нетематические ссылки, которые не имеют отношения к содержимому страниц
  • Не используйте черные способы продвижения, включая спам и обман поисковых систем

Работа Яндекса , да и любой поисковой системы как таковой, направлена на предоставлению пользователю наиболее ценной информации, исходя из анализа, которые поисковик применяет в своих алгоритмах. Попытка повлиять на результаты запрещенными методами, к хорошему не приведут. Выпадение страниц из Яндекса и прекращение их индексирования, тесно связано с ресурсами нарушающими правила.

Если вдруг сайт выпал из Яндекса , не стоит панниковать. Прежде всего необходимо проверить забанен он или нет, если условия Яндекса не были нарушены, то он вернется на свои позиции через 2-3 недели без потери оных. Добавьте адрес главной страницы в форму регистрации и если появится надпись «Ресурс успешно добавлен и в скором времени будет проиндексирован», останется только ждать.

Сегодня я с ужасом обнаружил, что целая куча страниц на всех моих сайтах выпали из Яндекса. Из-за этого трафик везде просел в два-три раза, а как понимаете - это полная печаль 🙁 Почему страницы выпали из Яндекса?


Причина, скорее всего, кроется в недавнем падении моего сервера, об этом я писал в своем живом журнале, тут писать, по понятным причинам, не мог. Сервер лежал почти сутки, называется, поковырялся в пятницу вечером!

НИКОГДА НИЧЕГО НЕ ДЕЛАЙТЕ НА СЕРВЕРЕ В ПЯТНИЦУ ВЕЧЕРОМ!

Почему? Потому что и у ребят, которые держат хостинг тоже есть выходные. Они оставляют дежурного специалиста, и я на собственном опыте убедился, что в это время суток сажают не самых лучших. Но это ладно, тема для отдельного разговора.

Сначала я подумал, что трафик просел из-за Пасхи , люди гуляют, интернетом пользуются реже. На выходных у меня всегда проседает немного посещаемость, а на большие праздники еще сильнее.

Но наступил понедельник, а трафик так и остался на пасхальном уровне, и вот тогда я начал беспокоиться. Полез стразу в Яндекс вебмастер, и вот что я вижу:

40% статей на этом блоге вылетели из индекса! Понятно, почему ! Связано ли это с падением сервера? Захожу в Яндекс вебмастер и сморю на исключенные страницы:

Как хорошо видно на фото, страницы вылетели из индекса 23 числа. Когда было падение сервера? Смотрим:

Как видно на графике, падение сервера было тоже 23 числа. Но это пока догадки, написал в Яндекс, через несколько часов получил ответ:

Здравствуйте, Андрей!

Все указанные страницы Вы можете найти среди исключенных из поиска в соответствующем разделе "Яндекс.Вебмастера". Дело в том, что 23 апреля, когда робот обращался к ним, Ваш сервер вернул код ответа 404. Сейчас со страницами все в порядке, роботу уже об этом известно, поэтому они смогут вернуться в поиск уже после следующего обновления поисковой базы.

О двух других сайтах, пожалуйста, напишите отдельно с помощью формы на странице .

Правило вести о каждом сайте отдельную переписку помогает нам избежать путаницы и быстрее отвечать Вам.

Спасибо за понимание, ждем Вашего письма!

Все ясно, пришел робот, а сайт в ауте, он не долго мучаясь выкинул пол сайта из индекса. МОЛОДЕЦ! ВОЗЬМИ С ПОЛКИ ПИРОЖОК!

Я все понимаю, алгоритмы там всякие, но вот объясните мне, сотрудники Яндекса: почему ОДИН раз не найдя страницу ваша поисковая система сразу выкидывает ее из индекса? В то же время у меня до сих пор в индексе много страниц, которые я уже как пол года назад удалил, и они все в индексе?

Но не об этом даже хотел я написать, это была прелюдия. В процессе решения этого вопроса у меня возник закономерный вопрос:

Как найти страницы выпавшие из Яндекса?

Рыская по интернету я нашел отличное решение по МАССОВОМУ поиску выпавших из индекса страниц, будь то из Яндекса или Google. Для этого нам понадобятся две программы: SiteMap Generator и .

Первая программа (бесплатная) поможет нам выкачать с сайта все статьи. Запускаем программу, пишем адрес сайта и запускаем сканирование:

Когда все страницы собраны, переходим во вкладку Yahoo и копируем список всех страниц.

Далее вставляем все это в таблицу EXEL и сортируем по алфавиту. Так как программа спарсила нам и все картинки, которые нам не нужны, благодаря сортировке мы сможем все их быстро найти и удалить. Теперь открываем Key Collector и идем в НАСТРОЙКИ программы:

В ИНТЕРФЕЙСЕ настраиваем все так, как показано на фото выше. Далее переходим в другую вкладку и удаляем все символы из указанных полей:

Теперь прописываем в верхнем правом поле адрес нашего сайта и запускаем сбор позиций Яндекс или Google:

После того как все закончилось выгружаем результат в EXEL. Что мы видим?

А видим простую картину: если страница не в индексе, то в выдаче релевантной страницей будет главная страница или другая похожая статья. Отсортируем левую колонку по алфавиту и сразу увидим страницы, которые выпали из индекса:

Все это делается за пять минут. Что дальше? В моем случае нужно ждать обновления выдачи (сегодня утром он случился), если же страницы выпали из индекса по другим причинам, то можно загнать их обратно способами, изложенными в этой статье - как можно ускорить индексацию сайта?

Написал это больше для себя, чтобы не забыть алгоритм, все может повторится, ну и вам может быть пригодится. И еще урок для всех: держи ноги в тепле, в сервер в холоде...

Не нашли ответ? Воспользуйтесь поиском по сайту

Если за последнее время, у вас просел трафик, страницы выпали из индекса, то тогда есть только 2 варианта. Первый: санкции от поисковых систем, второй:

Здравствуйте, уважаемые читатели блога сайт.

На связи Могиш Иван, и сегодня я расскажу вам об такой проблеме, когда из индекса поисковой системы выпадают (уже ранее) .

Буквально несколько дней назад, с нами случилась точно такая проблема. Из индекса гугла вылетело почти 50% страниц. Трафик упал с 800 на 169. Просто жесть. Сами посмотрите:

На сегодня вроде статистика выровнялась, но все равно есть ещё небольшой минус. Надеемся, через 2-3 дня выйдем на тот уровень что и были.

Так вот друзья, если у вас случилась такая проблема, считайте вам повезло. Расскажу все, что делали. Только сначала, давайте узнаем причины такой неприятной проблемы.

Основные причины вылета страниц из индекса поисковых систем

1. Санкции (АГС, Панда, Пингвин и т. д.). Первый признак наложенных фильтров является понижение трафика и вылет страниц из индекса. Поэтому, чтобы первым узнать о таких проблемах, каждый веб-мастер, блоггер просто обязан зарегистрировать свой ресурс в панелях веб-мастеров. Друзья, если вы ещё это не сделали, то не тяните:

Процедура добавления сайта довольно проста. Но все же если возникнут проблемы, то отпишитесь в комментариях. С радостью, помогу.

В общем, если ваш сайт попал под санкции, то вначале нужно узнать, какой именно фильтр наложен. Обычно, в панели для веб-мастеров приходит письмо со всей информацией (за что, когда наложен и т. д.).

P.S. Гугл отправляет сообщение веб-мастеру, только тогда, когда наложены ручные санкции. Если автоматические, письмо не придёт.

Вывод сайта из-под санкций, это совсем другая тема, о которой я расскажу в других своих статьях. , чтобы не пропустить.

А теперь, другая причина вылета страниц из индекса.

2. Закрывающий мета-тег. Да-да, друзья именно через один код, который появился в шаблоне случайно, принёс нам такую проблему. А вот и сам код:

Теперь, запускаете программу и поочередно открываете все Html и PHP файлы. Используя поиск программы, находите мета-тег и удаляете его. Чтобы ускорить поиск, можно открыть все файлы сразу, вверху (в разделах) нажать поиск а потом «Найти в файлах». Т.е. вы будете искать тег во всех файлах сразу.

После, как тег будет удалён, страницы вернуться в индекс самостоятельно.

В итоге

Как упоминал раньше, откуда всплыл этот мета-тег мы не знаем, если вы знаете, то напишите в комментариях. Будем признательны. Мы в свою очередь, на всякий случай сделали следующее:

  • Обновили WordPress до последней версии;
  • Обновили все плагины, в том числе и Yoast SEO;
  • Поменяли все пароли к доступу блога;
  • Установили плагин Anti-XSS attack для защиты WordPress.

Ну вроде все, можно заканчивать. Надеюсь, что статья вам поможет, вернуть все страницы в индекс и выйти на тот уровень, на котором были раньше. Для тех, в кого таких проблем не наблюдалось, добавьте статью в закладки. Возможно, в будущем пригодиться…

Каждый опытный вебмастер хотя бы раз в своей практике встречается с такой проблемой, что страницы сайта выпадают из индекса поисковых систем. Если вы с этим тоже столкнулись, то в этой статье мы разберем причины возникновения такого явления . Д ля начала нам нужно собрать все страницы которые были исключены с индекса и поддать их следующему анализу по следующим критериям:

10 основных причин выпадения страниц сайта из индекса Яндекса

Давайте разберем подробно причины выпадения из индекса поисковых систем страниц сайта. Почему это произошло и как поступить в сложившейся ситуации. Анализ можно провести самостоятельно и так же самостоятельно исправить выявленные проблемы.

Некачественный контент

Неуникальность . Конечно, если вы написали сами вполне внятный текст, проверяли на уникальность при публикации, и не постили где-нибудь еще, то тут может быть только одна причина – статью скопировали, разместили на стороннем ресурсе и скорее всего поисковые системы посчитали что первоисточник не вы.

Что делать? Проверьте текст на уникальность. Как это делать вы можете почитать в статье. Если вы нашли дубликаты в сети, то советуем проверить, как Яндекс относится к вашему тексту. Выберите один абзац не уникального текста, скопируйте и вставьте в поисковую строку Яндекса, возьмите этот кусочек текста в кавычки.

Если ваш сайт в выдаче находится первый, то волноваться нечего — ваш текст Яндекс считает первоисточником и ранжирует выше копий.

Если же наоборот – то надо обращаться с жалобой к владельцу сайта и хостинговой компании с просьбой удалить сворованный контент. При составлении письма советуем изучить закон об авторском праве и меры наказания за его нарушение.

Плохое качество контента. Что тут имеется ввиду? Это может быть грубый рерайт, размноженный текст с помощью синонимайзеров и прочих программ. Что делать? Переписать или дописать статью, так как плохой контент по сути никому не интересен.

Переоптимизация контента. Проверьте статью, которая выпала из индекса на количество вхождений ключевых слов. Сделать это можно любым сервисом http://advego.ru/text/seo/ или http://istio.com/rus/text/analyz/ . Тут обращайте внимание на максимальный процент по слову. Он должен быть максимум до 4%, или же ориентируйтесь по ТОПу выдачи, какой процент вхождения используют конкуренты, статьи которых занимают первые позиции. Так же обратите внимание как у вас прописаны метатеги: Title, Disсription, заголовок H1 и другие подзаголовки с тексте. Возможно вы перестарались и слишком много употребили ключевых слов.

Технические проблемы

Если сайт постоянно недоступен для ботов Яндекса, то поисковая система может посчитать, что данная страница уже не существует и исключить из поисковой выдачи. Иногда такие косяки бывают со стороны хостинга. Если он постоянно подводит, сайт часто становится недоступным, то надо переносить свои сайты на другой более качественный хостинг.

Так же проверьте, закрыта ли страница для индексации (проверьте запрещающие директивы файла роботс, и наличие атрибута noindex в metarobots. Вы могли не корректно настроить какой-нибудь плагин или CMS и случайно закрыть доступ роботам к индексации данного урл адреса.

За нарушение закона

Контент, размещенный на данной странице может нарушать закон об авторском праве. Или не соответствовать нормам, правилам и действующему законодательству РФ.

Что делать? Изучать более детально закон под действие которого попал ваш сайт. Если есть ошибки со стороны поисковой системы то это стоит решить в частной переписке со службой поддержки, если все по закону то удалить все нарушающие закон материалы и больше так не делать

Много исходящих ссылок с страницы

Проверьте количество исходящих ссылок, обратите внимание так же на количество расположенной рекламы. За агрессивную продажу ссылок Яндекс может посчитать страницу (или весь сайт) спамным, не соответствующим критериям качественного сайта.
Что делать? Убрать максимально возможное количество внешних ссылок, ведущие на сторонние ресурсы или закрыть их от индексации атрибутом rel=nofollow.

Дубли страниц внутри сайта

Очень частая мера при нахождении роботом в индексе страниц дублей это удаление лишних на усмотрение робота, и не редко бывает что удаляются совсем не те страницы которые нужно.
Что делать? Если у вас в индексе 24000 страниц а уникального контента всего 300 страниц, то будьте готовы к внезапному удалению 23500-23600 страниц или же, если лишние страницы не приносят вам трафик, пропишите корректные правила индексации в файле robots.txt и закройте все страницы не имеющие полезного уникального содержания.

Плохое качество сайта

У вас может быть изумительный контент, но если он будет подан на сломанной верстке или на совсем не естественной цветовой гамме то среднестатический пользователь вряд ли будет ее читать а скорее всего перейдет к конкурентам. Накопление статистики плохих поведенческих факторов может привести к наложению фильтра на ваш сайт.

Санкции в поисковых системах

Не стоит упускать такой момент, как фильтры поисковых систем. Как правило они накладываются уже за очень грубое и систематическое нарушение описанных здесь причин и если вы получили АГС или Бан тогда вам стоит пересмотреть все предыдущие пункты и найти конкретную причину за который вы получили санкции.

Глюк Яндекса

Если вы все проверили, но грубых нарушений не обнаружили, то это может быть обычный глюк Яндекса. Такое периодически бывает, и как правило восстанавливается в следующие 1-2 апдейта.

Если Вы новичок или наоборот уже опытный вебмастер, то, скорее всего, Вы сталкивались в своей жизни с ситуацией, когда в выдаче Яндекса остается мало страниц Вашего сайта. В этой статье я расскажу о причинах выпадения страниц из индекса поисковой машины , а также дам рекомендации, чтобы избежать эти причины.

Сайт может выпасть из индекса по разным причинам, но в большинстве случаев проблема заключается в самом сайте. Рассмотрим наиболее возможные причины выпадения страниц из индекса.

Причины выпадения сайта из индекса

1. Некачественный контент

В связи с большим ростом количества информации в интернете, поисковые машины (в особенности Яндекс) предпринимают усилия по чистке своего индекса от заведомо плохого контента. В эту группу попадают сайты, содержащие:

1.1. Автоматически сгенерированный контент

По-моему всем очевидно, что такой текст даже не является читаемым и пользы от него никакой. Для справки: раньше (до 2009 года) можно было загнать в индекс любой контент.

1.2. Контент только из копипаста

Я много видел примеров, когда копипаст не просто не вылетает из индекса, но ещё и занимает первые места в выдаче. Стоит сказать, что этого можно достичь далеко не всегда и не стоит этим увлекаться (сайт на копипасте это приговор ?).

В случае продажи ссылок на молодых сайтах (до 6 месяцев) они быстро уходят под АГС .

Теперь скажу пару слов о продаже ссылок на трастовых сайтах. Даже если Вашему сайту уже не один год и на него ссылаются авторитетные ресурсы, то все равно есть шанс остаться в индексе с 1 страницей, но это только в случае агрессивной продажи ссылок. Вы наверное спросите, а что я имею ввиду под понятием "агрессивная"? Я имею ввиду то, что если хотя бы на 50% страниц сайта за неделю появится хотя бы по одной внешней ссылке, то это и будет считаться агрессивной распродажей. Обычно после этого где-то через месяц у сайта остается несколько страниц в индексе.

Эта причина встречается довольно часто среди начинающих вебмастеров. Вернуться в индекс после этого реально, сняв все продажные ссылки с сайта.

4. Ошибки в html коде и ответах сервера

Возможно, Ваш сайт настолько плохо сделан, что даже поисковая машина не смогла разобраться в Вашем коде, а также в куче битых ссылок. Возможно также, что Ваш движок выдает какие-то странные ответы на запросы поисковых машин.

Эта причина встречается не часто.

5. Глюки поисковых систем

Примерно раз в полгода случаются глюки у поисковой машины. Чтобы убедиться в том, что это глюк, зайдите на seo-форумы и почитайте, что пишут другие. Если Вы не один такой, то есть большой шанс надеяться на то, что скоро все вернется на свои места. Время возвращения в индекс обычно составляет от 3 до 10 дней.

Причину выпадения страниц Вам всегда могут сообщить в саппорте Яндекса или Гугла, однако я не советую писать им по каждой ерунде. А если Ваш сайт ГС, то можете даже не писать, чтобы не тратить ни своё, ни их время.