Сайт работает, контент опубликован — но в Google его нет. Это самый болезненный SEO-сценарий: вы платите за хостинг, инвестируете в текст, а трафика ноль. В этом гиде — 12 главных причин почему Google не индексирует сайт, как точно проверить через Search Console, и пошаговый план восстановления. Без воды — конкретные проверки и фиксы.
Откройте Google и введите site:example.com (замените на ваш домен). Если в выдаче 0 результатов — сайт не индексирован. Если несколько страниц но не все — частичная индексация. Если все ваши страницы — Google знает о сайте.
Самая быстрая проверка — оператор site:. Открываете Google.de, вводите site:vash-domen.de и смотрите количество результатов. Это верхняя граница того что Google знает о вашем сайте.
Но site: неточен — он показывает примерное число. Для точной диагностики нужен Google Search Console → Pages. Там увидите три категории:
«Indexed» — страницы успешно в индексе.
«Not indexed» — страницы которые Google знает, но не индексирует (с причиной).
«Crawled but not indexed» — Googlebot просканировал, но решил не добавлять. Самый опасный статус — обычно сигнал о quality issues.
Если вы не настраивали Search Console — это первое что нужно сделать. Без GSC вы слепы. Подробнее об этом — в следующей секции.
Куда идти если сайт не индексируется — flowchart от первой проверки до фикса
URL Inspection в Search Console — главный инструмент диагностики. Введите URL — увидите статус (URL is on Google / URL is not on Google), последнее сканирование, обнаруженные проблемы, текущий robots.txt status, canonical, и mobile usability. Это вся правда о том что Google знает о странице.
Как пользоваться URL Inspection:
https://vash-site.de/blog/post/)В отчёте смотрите три ключевых поля:
1) URL is on Google — страница в индексе ✓
2) URL is not on Google — не индексирована, ниже будет причина
3) Discovered — currently not indexed — Google знает URL но не сканировал/не индексировал
Типичные причины «not indexed» из GSC:
Каждая причина из этого списка лечится по-разному. Дальше разберём 12 главных проблем индексации с конкретными фиксами.
Типичный отчёт URL Inspection с диагностикой проблемы — здесь видна конкретная причина
По моим SEO-аудитам 100+ сайтов в DACH самые частые причины не-индексации — robots.txt блокировка, noindex meta, низкое качество контента. Технические причины (sitemap, canonical) важны но решаются за час. Quality issues — это работа на недели.
Самая частая причина — забытое Disallow: / с этапа разработки. Проверить: vash-domen.de/robots.txt
WordPress «Discourage search engines» (Settings → Reading) ставит noindex. После запуска забывают убрать.
Google сканирует но не индексирует. Quality issue — thin content, дубликаты, мало внешних сигналов.
Несколько URL с одинаковым контентом без rel="canonical" — Google выбирает свой canonical, ваш игнорируется.
Server errors во время краула. После 3-5 неудачных попыток Google перестаёт пытаться.
SPA (React/Vue) без SSR. Googlebot выполняет JS но с задержкой 7-9 дней. Часто не успевает.
Большой сайт (10K+ URL) с медленным сервером. Googlebot тратит budget на низкокачественные URL.
Sitemap.xml возвращает 404 / содержит broken URLs / не submitted в GSC. Полная индексация невозможна.
HTTP-версия сайта без 301 на HTTPS. Google индексирует оба как разные сайты, контент cannibalized.
DACH-специфика. Cookie banner делает display:none на main content до accept. Googlebot не accept'ает → ничего не видит.
Manual Actions в GSC. Чёрные методы линкбилдинга, манипуляции, спам — Google вручную исключает сайт.
Google ждёт 2-8 недель прежде чем активно индексировать новый домен. Это не баг — это sandbox effect.
Из моих аудитов в DACH: какие проблемы встречаются чаще всего
Источник: внутренняя статистика NeuRank по 100+ SEO-аудитам в DACH (2023-2026). Округлено.
90% случаев когда «сайт не индексируется» — это Disallow: / в robots.txt оставленный с этапа разработки. Проверка занимает 10 секунд. Открываете vash-domen.de/robots.txt в браузере и смотрите содержимое.
Плохой robots.txt (блокирует весь сайт):
User-agent: * Disallow: / # ← Эта строка блокирует ВЕСЬ сайт. Удалить.
Хороший robots.txt (разрешает индексацию, блокирует только wp-admin):
User-agent: *
Allow: /
Disallow: /wp-admin/
Allow: /wp-admin/admin-ajax.php
Sitemap: https://vash-domen.de/sitemap_index.xml
Как исправить:
В WordPress: Settings → Reading → снимите галочку Discourage search engines from indexing this site. Это автоматически правит robots.txt и убирает meta noindex.
Через FTP/SSH: подключитесь к серверу, откройте файл /robots.txt в корне сайта, удалите Disallow: /, оставьте только необходимые блокировки.
Через Rank Math: WP Admin → Rank Math → General Settings → Edit robots.txt — здесь можно настроить без прямого доступа к файлу.
После фикса — в GSC отправьте sitemap.xml на переcканирование. Google обычно переиндексирует за 24-72 часа если только robots.txt был проблемой.
Meta noindex в HTML делает страницу невидимой для индексации Google. В отличие от robots.txt — Googlebot её сканирует, но не добавляет в индекс. Часто остаётся после dev/staging этапа.
Как найти: View source страницы → Ctrl+F → ищите noindex. Если есть — это блокер.
Плохо (страница исключена из индекса):
<meta name="robots" content="noindex, nofollow">
Хорошо (страница индексируется):
<meta name="robots" content="index, follow">
Где исправить в WordPress:
Rank Math: на каждой странице → Rank Math meta-box → Advanced → Robots Meta → убрать noindex.
Yoast: Yoast SEO meta-box → Advanced → Allow search engines to show → Yes.
Глобально: Settings → Reading → снять «Discourage search engines» (это устанавливает noindex на ВСЕ страницы сайта).
Edge case — HTTP header X-Robots-Tag: Иногда noindex стоит в HTTP-заголовке через .htaccess или server config. Проверить можно через curl -I https://vash-domen.de/ — ищите строку X-Robots-Tag: noindex. Если есть — удалить из .htaccess или server config.
Crawl budget — количество URL которые Googlebot сканирует в день на вашем сайте. Зависит от скорости сервера и качества сайта. Для маленьких сайтов (до 1000 URL) это не проблема. Для интернет-магазинов и больших порталов (10K+ URL) — критично.
Признаки исчерпанного crawl budget:
Главные потребители crawl budget которые надо урезать:
noindex на старых страницахКак починить:
robots.txt faceted URLs: Disallow: /*?filter=Из своего опыта: для интернет-магазина 5K SKU оптимизация crawl budget даёт +30-50% индексированных URL за 4-6 недель.
Самый коварный статус в GSC: «Crawled — currently not indexed». Google просканировал страницу, но решил не добавлять в индекс. Robots.txt и noindex здесь ни при чём. Это quality signal — Google считает контент недостаточно ценным.
Три главные причины «Crawled but not indexed»:
1) Thin content — страница меньше 300 слов или с минимальной информационной ценностью. Карточки товаров с шаблонным описанием. Пустые tag archives.
2) Duplicate content — контент почти полностью совпадает с другими страницами вашего или чужих сайтов. Особенно опасно: dropshipping каталоги где описание копируется от производителя.
3) Низкий entity authority — Google не знает кто вы, нет E-E-A-T сигналов. Особенно строго для YMYL-ниш (Your Money Your Life: финансы, медицина, юриспруденция).
Как починить thin content:
Как починить duplicate:
rel="canonical" чтобы указать главную версиюКак улучшить entity authority:
Технические проблемы индексации решаются быстрее всего — обычно за день. Но без них Google не сможет правильно интерпретировать ваш сайт даже если контент идеальный.
Sitemap возвращает 404 / XML invalid / содержит ссылки на 404 URLs. Проверить: vash-domen.de/sitemap.xml. Submit в GSC и смотреть errors.
На странице несколько <link rel="canonical"> или canonical указывает на 404. Google игнорирует и выбирает свой canonical (обычно неудачный).
SPA без SSR. Googlebot откладывает рендеринг на 5-10 дней. Решение: SSR (Next.js, Nuxt) или Static Site Generation (Astro, Gatsby).
Без 301 redirect от HTTP к HTTPS Google индексирует обе версии как разные сайты. Force HTTPS в .htaccess + GSC properties для обеих версий.
DACH-специфика. Cookie banner делает display:none на main content. Googlebot не accept'ает → видит пустую страницу. Решение: не скрывать контент через banner.
Multilingual сайт с битыми hreflang между языками. Google запутывается и индексирует только одну версию. Полная карта обязательна.
Google штраф или санкции Google бывают двух типов: Manual Actions (ручной penalty от team Google за нарушение Webmaster Guidelines) и Algorithmic (автоматическое понижение из-за Core Update или Helpful Content Update). Manual видны в Search Console → Security & Manual Actions. Algorithmic — невидимы, диагностируются по падению трафика.
Manual Actions в Search Console — список с конкретными нарушениями:
Что делать при Manual Action:
Algorithmic penalty (Core Update сайт упал):
Из практики DACH: 80% «упал в Google после Core Update» — это не penalty, а commodity content переставший конкурировать с AI Overview. Решение — пересборка контента с unique angle, E-E-A-T, реальной экспертизой.
План восстановления зависит от причины. Технические проблемы (robots.txt, noindex, sitemap) — фикс за день. Quality issues — недели работы. Manual penalty — 2-6 недель после Reconsideration Request. Core Update — 3-6 месяцев до следующего апдейта.
SEO-аудит с глубокой проверкой индексации: технические блокеры, quality issues, penalty risks. PDF-отчёт за 5-7 дней с пошаговым планом восстановления. Цена 490 €.
Полный гид по Core Web Vitals, 7 инструментов проверки, 8 факторов замедления, DACH-специфика.
Читать → УслугаRobots.txt, sitemap, schema, hreflang, canonical. Полная техническая оптимизация.
Подробнее → Услуга200+ пунктов проверки включая индексацию. PDF-отчёт с приоритизацией за 5-7 дней. 490 €.
Заказать →Senior SEO-специалист · 15+ лет
Прямой контакт без посредников: каждый клиент работает напрямую со мной. Опыт диагностики и восстановления индексации 200+ сайтов в DACH — от мелких блогов до интернет-магазинов на 5000+ SKU.
Языки: русский, украинский, английский, немецкий (B2). Локация: Wuppertal, NRW. Работа со всей Германией и DACH-регионом.