Статьи · Pain & Recovery

Почему Google не индексирует сайт — гид по диагностике

Сайт работает, контент опубликован — но в Google его нет. Это самый болезненный SEO-сценарий: вы платите за хостинг, инвестируете в текст, а трафика ноль. В этом гиде — 12 главных причин почему Google не индексирует сайт, как точно проверить через Search Console, и пошаговый план восстановления. Без воды — конкретные проверки и фиксы.

Длина~2 800 слов
Причины12 главных
Диагностика5 шагов
Обновлено2026-05-14
Быстрая проверка

Как за 30 секунд понять — индексируется ли ваш сайт?

Откройте Google и введите site:example.com (замените на ваш домен). Если в выдаче 0 результатов — сайт не индексирован. Если несколько страниц но не все — частичная индексация. Если все ваши страницы — Google знает о сайте.

Самая быстрая проверка — оператор site:. Открываете Google.de, вводите site:vash-domen.de и смотрите количество результатов. Это верхняя граница того что Google знает о вашем сайте.

Но site: неточен — он показывает примерное число. Для точной диагностики нужен Google Search Console → Pages. Там увидите три категории:

«Indexed» — страницы успешно в индексе.
«Not indexed» — страницы которые Google знает, но не индексирует (с причиной).
«Crawled but not indexed» — Googlebot просканировал, но решил не добавлять. Самый опасный статус — обычно сигнал о quality issues.

Если вы не настраивали Search Console — это первое что нужно сделать. Без GSC вы слепы. Подробнее об этом — в следующей секции.

Google Search Console

Как проверить индексацию через URL Inspection Tool

URL Inspection в Search Console — главный инструмент диагностики. Введите URL — увидите статус (URL is on Google / URL is not on Google), последнее сканирование, обнаруженные проблемы, текущий robots.txt status, canonical, и mobile usability. Это вся правда о том что Google знает о странице.

Как пользоваться URL Inspection:

  1. Зайдите в Google Search Console
  2. Выберите ваш property (домен)
  3. В верхней строке поиска введите полный URL (например https://vash-site.de/blog/post/)
  4. Нажмите Enter — получите детальный отчёт

В отчёте смотрите три ключевых поля:

1) URL is on Google — страница в индексе ✓
2) URL is not on Google — не индексирована, ниже будет причина
3) Discovered — currently not indexed — Google знает URL но не сканировал/не индексировал

Типичные причины «not indexed» из GSC:

Blocked by robots.txtФайл robots.txt запрещает Googlebot сканировать URL
Page with redirectURL редиректит на другую страницу — индексируется конечная
Excluded by 'noindex' tagВ мета-теге или HTTP header стоит noindex
Duplicate without user-selected canonicalGoogle нашёл дубликат и сам выбрал canonical (не ваш)
Crawled — currently not indexedПросканировано но не добавлено. Quality issue.
Soft 404Страница возвращает 200 OK но контент пустой/error-like

Каждая причина из этого списка лечится по-разному. Дальше разберём 12 главных проблем индексации с конкретными фиксами.

12 главных причин

Почему сайт не индексируется — 12 причин по частоте

По моим SEO-аудитам 100+ сайтов в DACH самые частые причины не-индексации — robots.txt блокировка, noindex meta, низкое качество контента. Технические причины (sitemap, canonical) важны но решаются за час. Quality issues — это работа на недели.

  1. Блокировка в robots.txt

    Самая частая причина — забытое Disallow: / с этапа разработки. Проверить: vash-domen.de/robots.txt

  2. Meta noindex в HTML

    WordPress «Discourage search engines» (Settings → Reading) ставит noindex. После запуска забывают убрать.

  3. Crawled — currently not indexed

    Google сканирует но не индексирует. Quality issue — thin content, дубликаты, мало внешних сигналов.

  4. Дубликат без canonical

    Несколько URL с одинаковым контентом без rel="canonical" — Google выбирает свой canonical, ваш игнорируется.

  5. 404 / 5xx на критичных страницах

    Server errors во время краула. После 3-5 неудачных попыток Google перестаёт пытаться.

  6. JavaScript-only контент

    SPA (React/Vue) без SSR. Googlebot выполняет JS но с задержкой 7-9 дней. Часто не успевает.

  7. Crawl budget исчерпан

    Большой сайт (10K+ URL) с медленным сервером. Googlebot тратит budget на низкокачественные URL.

  8. Sitemap не работает

    Sitemap.xml возвращает 404 / содержит broken URLs / не submitted в GSC. Полная индексация невозможна.

  9. HTTP вместо HTTPS

    HTTP-версия сайта без 301 на HTTPS. Google индексирует оба как разные сайты, контент cannibalized.

  10. Cookie consent блокирует контент

    DACH-специфика. Cookie banner делает display:none на main content до accept. Googlebot не accept'ает → ничего не видит.

  11. Manual penalty (штраф)

    Manual Actions в GSC. Чёрные методы линкбилдинга, манипуляции, спам — Google вручную исключает сайт.

  12. Свежий домен / новый сайт

    Google ждёт 2-8 недель прежде чем активно индексировать новый домен. Это не баг — это sandbox effect.

Причина #1 · Robots.txt

Robots.txt блокирует Googlebot — самая частая ошибка

90% случаев когда «сайт не индексируется» — это Disallow: / в robots.txt оставленный с этапа разработки. Проверка занимает 10 секунд. Открываете vash-domen.de/robots.txt в браузере и смотрите содержимое.

Плохой robots.txt (блокирует весь сайт):

User-agent: *
Disallow: /
# ← Эта строка блокирует ВЕСЬ сайт. Удалить.

Хороший robots.txt (разрешает индексацию, блокирует только wp-admin):

User-agent: *
Allow: /
Disallow: /wp-admin/
Allow: /wp-admin/admin-ajax.php

Sitemap: https://vash-domen.de/sitemap_index.xml

Как исправить:

В WordPress: Settings → Reading → снимите галочку Discourage search engines from indexing this site. Это автоматически правит robots.txt и убирает meta noindex.

Через FTP/SSH: подключитесь к серверу, откройте файл /robots.txt в корне сайта, удалите Disallow: /, оставьте только необходимые блокировки.

Через Rank Math: WP Admin → Rank Math → General Settings → Edit robots.txt — здесь можно настроить без прямого доступа к файлу.

После фикса — в GSC отправьте sitemap.xml на переcканирование. Google обычно переиндексирует за 24-72 часа если только robots.txt был проблемой.

Причина #2 · Noindex

Meta noindex — невидимый блокер

Meta noindex в HTML делает страницу невидимой для индексации Google. В отличие от robots.txt — Googlebot её сканирует, но не добавляет в индекс. Часто остаётся после dev/staging этапа.

Как найти: View source страницы → Ctrl+F → ищите noindex. Если есть — это блокер.

Плохо (страница исключена из индекса):

<meta name="robots" content="noindex, nofollow">

Хорошо (страница индексируется):

<meta name="robots" content="index, follow">

Где исправить в WordPress:

Rank Math: на каждой странице → Rank Math meta-box → Advanced → Robots Meta → убрать noindex.

Yoast: Yoast SEO meta-box → Advanced → Allow search engines to show → Yes.

Глобально: Settings → Reading → снять «Discourage search engines» (это устанавливает noindex на ВСЕ страницы сайта).

Edge case — HTTP header X-Robots-Tag: Иногда noindex стоит в HTTP-заголовке через .htaccess или server config. Проверить можно через curl -I https://vash-domen.de/ — ищите строку X-Robots-Tag: noindex. Если есть — удалить из .htaccess или server config.

Причина #7 · Crawl Budget

Crawl budget исчерпан — почему большие сайты теряются

Crawl budget — количество URL которые Googlebot сканирует в день на вашем сайте. Зависит от скорости сервера и качества сайта. Для маленьких сайтов (до 1000 URL) это не проблема. Для интернет-магазинов и больших порталов (10K+ URL) — критично.

Признаки исчерпанного crawl budget:

  • Новые страницы не индексируются неделями
  • В GSC Coverage report много «Discovered — currently not indexed»
  • Большой разрыв между «Sitemap submitted» и «Indexed»
  • Lighthouse / GSC показывают высокий TTFB (> 1 сек)

Главные потребители crawl budget которые надо урезать:

  • Faceted navigation (фильтры в магазине) — генерируют миллионы URL комбинаций
  • Pagination без noindex на старых страницах
  • Internal site search results — нужно блокировать в robots.txt
  • Tag/category archives с дублирующимся контентом
  • Тестовые URL staging, dev копии

Как починить:

  • Блокировать в robots.txt faceted URLs: Disallow: /*?filter=
  • Удалить из sitemap.xml URL которые не должны индексироваться
  • Ускорить сервер (TTFB < 200 мс — Hetzner Cloud / managed WP hosting)
  • Internal linking — повысить authority важных страниц через ссылки с главной и pillar pages

Из своего опыта: для интернет-магазина 5K SKU оптимизация crawl budget даёт +30-50% индексированных URL за 4-6 недель.

Причина #3 · Quality

Crawled — currently not indexed: quality issue

Самый коварный статус в GSC: «Crawled — currently not indexed». Google просканировал страницу, но решил не добавлять в индекс. Robots.txt и noindex здесь ни при чём. Это quality signal — Google считает контент недостаточно ценным.

Три главные причины «Crawled but not indexed»:

1) Thin content — страница меньше 300 слов или с минимальной информационной ценностью. Карточки товаров с шаблонным описанием. Пустые tag archives.

2) Duplicate content — контент почти полностью совпадает с другими страницами вашего или чужих сайтов. Особенно опасно: dropshipping каталоги где описание копируется от производителя.

3) Низкий entity authority — Google не знает кто вы, нет E-E-A-T сигналов. Особенно строго для YMYL-ниш (Your Money Your Life: финансы, медицина, юриспруденция).

Как починить thin content:

  • Расширить контент до 800-1500 слов минимум для блог-постов, 200-400 для карточек товаров
  • Добавить уникальный value: примеры, кейсы, инструкции, FAQ
  • Удалить страницы которые невозможно расширить — лучше 50 хороших страниц чем 500 пустых

Как починить duplicate:

  • Использовать rel="canonical" чтобы указать главную версию
  • Переписать дубликаты с уникальным углом
  • Для интернет-магазинов: уникальные описания товаров (даже 100 слов unique > 500 слов копии)

Как улучшить entity authority:

  • Полноценный Schema markup (Organization, Person для авторов)
  • Author boxes с фото и био
  • Внешние сигналы: упоминания, ссылки с тематических ресурсов
  • Внутренние ссылки от pillar pages
Технические причины

Sitemap, canonical, JS-рендеринг — технические проблемы

Технические проблемы индексации решаются быстрее всего — обычно за день. Но без них Google не сможет правильно интерпретировать ваш сайт даже если контент идеальный.

Sitemap.xml broken

Sitemap возвращает 404 / XML invalid / содержит ссылки на 404 URLs. Проверить: vash-domen.de/sitemap.xml. Submit в GSC и смотреть errors.

Canonical конфликт

На странице несколько <link rel="canonical"> или canonical указывает на 404. Google игнорирует и выбирает свой canonical (обычно неудачный).

JavaScript-only контент

SPA без SSR. Googlebot откладывает рендеринг на 5-10 дней. Решение: SSR (Next.js, Nuxt) или Static Site Generation (Astro, Gatsby).

HTTP вместо HTTPS

Без 301 redirect от HTTP к HTTPS Google индексирует обе версии как разные сайты. Force HTTPS в .htaccess + GSC properties для обеих версий.

Cookie consent блокирует контент

DACH-специфика. Cookie banner делает display:none на main content. Googlebot не accept'ает → видит пустую страницу. Решение: не скрывать контент через banner.

Hreflang некорректный

Multilingual сайт с битыми hreflang между языками. Google запутывается и индексирует только одну версию. Полная карта обязательна.

Google штрафы и санкции

Manual penalty и Core Update — штрафы Google

Google штраф или санкции Google бывают двух типов: Manual Actions (ручной penalty от team Google за нарушение Webmaster Guidelines) и Algorithmic (автоматическое понижение из-за Core Update или Helpful Content Update). Manual видны в Search Console → Security & Manual Actions. Algorithmic — невидимы, диагностируются по падению трафика.

Manual Actions в Search Console — список с конкретными нарушениями:

  • Unnatural links to your site — покупка ссылок, ссылочный спам
  • Thin content with little or no added value — массовое создание мусорного контента
  • Pure spam — генерируемый контент, scraped content, doorway pages
  • Cloaking — разный контент для Google и пользователей
  • Hidden text or links — скрытый текст для SEO

Что делать при Manual Action:

  • Зайти в GSC → Security & Manual Actions → читать детали
  • Исправить все указанные проблемы (удалить плохие ссылки через Disavow, переписать thin content, убрать cloaking)
  • Submit Reconsideration Request с детальным описанием что было исправлено
  • Google отвечает обычно через 2-6 недель

Algorithmic penalty (Core Update сайт упал):

  • Диагностика — корреляция падения трафика с датами Core Updates (август, ноябрь, март обычно)
  • Анализ — какие именно страницы потеряли позиции, что общего
  • Лечение — улучшение качества контента, E-E-A-T сигналов, технического SEO
  • Восстановление — обычно после следующего Core Update (через 3-6 месяцев)

Из практики DACH: 80% «упал в Google после Core Update» — это не penalty, а commodity content переставший конкурировать с AI Overview. Решение — пересборка контента с unique angle, E-E-A-T, реальной экспертизой.

HowTo · План восстановления

Как восстановить сайт в Google — 5 шагов

План восстановления зависит от причины. Технические проблемы (robots.txt, noindex, sitemap) — фикс за день. Quality issues — недели работы. Manual penalty — 2-6 недель после Reconsideration Request. Core Update — 3-6 месяцев до следующего апдейта.

01
30 минут · Диагностика

Полная проверка через Search Console

  • Откройте Coverage report — посмотрите распределение Indexed / Not indexed
  • Запустите URL Inspection на главных страницах
  • Проверьте Security & Manual Actions
  • Сохраните скриншоты — это baseline
02
1 час · Quick wins

Фикс технических блокеров

  • Проверить vash-domen.de/robots.txt — убрать Disallow: /
  • Снять meta noindex (Settings → Reading или Rank Math)
  • Проверить sitemap.xml — валидный XML, нет broken URLs
  • Submit sitemap в GSC заново
03
3-7 дней · Quality audit

Аудит контента

  • Список всех страниц со статусом «Crawled but not indexed»
  • Для каждой — анализ: thin content, duplicate, или low entity authority
  • План улучшений: переписать / расширить / удалить
  • Internal linking: ссылки от pillar pages к проблемным страницам
04
2-4 недели · Implementation

Внедрение улучшений

  • Переписать thin content (расширение до 800+ слов)
  • Уникализация duplicate (особенно для интернет-магазинов)
  • Schema markup для E-E-A-T (Person, Organization, FAQPage)
  • Backlink audit — disavow подозрительных ссылок
05
4-12 недель · Monitoring

Контроль восстановления

  • Еженедельный мониторинг GSC Coverage report
  • Отслеживание роста «Indexed» страниц
  • Положительная динамика — индексация в течение 24-72 часов после публикации
  • Полный recovery — обычно 3-6 месяцев
FAQ

Частые вопросы про индексацию в Google

Почему сайт не индексируется в Google — главная причина?
Самая частая причина почему сайт не индексируется в Google — забытый Disallow: / в robots.txt со стадии разработки. На втором месте — meta noindex (часто включён через WP Settings → Reading «Discourage search engines»). На третьем — Crawled but not indexed (quality issue: thin content или duplicate).
Сколько времени нужно чтобы Google проиндексировал новый сайт?
Новый домен Google индексирует 2-8 недель — это так называемый «sandbox effect». Существующие сайты с историей индексируют новые страницы за 24-72 часа после публикации. Чтобы ускорить — submit sitemap в Search Console, добавить внутренние ссылки от важных страниц.
Почему гугл не индексирует сайт даже после submit sitemap?
Если sitemap submitted но индексация не растёт — проверьте: 1) robots.txt не блокирует URL из sitemap, 2) meta noindex отсутствует на URL, 3) URL в sitemap возвращают 200 OK (не 404/5xx), 4) контент уникальный (не дубликат). Если всё OK — quality issue, нужно работать над E-E-A-T.
Что такое Google штраф и как его получить?
Google штраф (Manual Action) — ручной penalty от команды Google за нарушение Webmaster Guidelines. Главные причины: покупка ссылок, генерируемый/scraped контент, cloaking, скрытый текст. Виден в Search Console → Security & Manual Actions. Снимается через Reconsideration Request после исправления.
Сайт упал в Google после Core Update — что делать?
«Сайт упал в Google» после Core Update обычно НЕ penalty, а algorithmic reassessment. Проверить: совпадает ли падение трафика с датами Core Updates (август/ноябрь/март обычно). Если да — нужно улучшение качества контента, E-E-A-T сигналов, уникального angle. Восстановление приходит со следующим Core Update — через 3-6 месяцев.
Как вернуть позиции в Google после потери?
План восстановления зависит от причины: 1) Технические проблемы (robots, noindex, sitemap) — фикс за 1-3 дня, восстановление позиций 1-4 недели. 2) Quality issues — переписать thin content, удалить дубликаты, улучшить E-E-A-T (3-6 мес). 3) Manual penalty — Reconsideration Request, ответ 2-6 недель. 4) Core Update — комплексное улучшение, ждать следующий апдейт.
Сайт не в топе гугл — это penalty или нормально?
«Сайт не в топе» не равно «penalty». Для нового сайта (< 6 мес) или непопулярного домена нормально не быть в топе — нужна работа над контентом, ссылками, entity authority. Реальный penalty виден в GSC Manual Actions. Если там пусто — это конкурентная позиция, а не штраф.
Как заказать SEO-аудит для сайта который не индексируется?
SEO-аудит для не-индексируемого сайта в NeuRank стоит 490 €. В отчёте: точный диагноз причин не-индексации (technical + quality), пошаговый план восстановления, приоритизация задач. Срок выполнения 5-7 дней. Заказать аудит.
Сайт не индексируется?

Получите точный диагноз почему ваш сайт не в Google

SEO-аудит с глубокой проверкой индексации: технические блокеры, quality issues, penalty risks. PDF-отчёт за 5-7 дней с пошаговым планом восстановления. Цена 490 €.

Автор

Mykola Vyshnevskyi

Senior SEO-специалист · 15+ лет

Прямой контакт без посредников: каждый клиент работает напрямую со мной. Опыт диагностики и восстановления индексации 200+ сайтов в DACH — от мелких блогов до интернет-магазинов на 5000+ SKU.

Языки: русский, украинский, английский, немецкий (B2). Локация: Wuppertal, NRW. Работа со всей Германией и DACH-регионом.

LinkedIn /in/mykola-vyshnevskyi · Связаться