SSL-мониторинг через api-поддомены (Pingdom)
Кейс падения hdroom.xxx из-за edge-сертификата Cloudflare и стандарт: проверять SSL по api.домен, а не по основному домену.
1. История инцидента
В феврале 2026 сайт https://hdroom.xxx/ упал.
Cloudflare показывал ошибку:
Invalid SSL certificate
Причина — истёкший SSL-сертификат на сервере.
Что пошло не так
На момент инцидента:
- Pingdom уже был настроен по всем сиджам
- SSL-проверки существовали
- Но алерт не сработал
После расследования выяснили причину:
Cloudflare подставляет свой edge-сертификат даже в случае, когда серверный сертификат уже истёк.
В результате:
- При проверке
hdroom.xxxPingdom видел валидный сертификат Cloudflare - Но не видел проблему на origin-сервере
- Поэтому алерт не отправился
Итог — сайт упал, мониторинг это не поймал.
2. Вывод
Проверять SSL на основном домене недостаточно, если сайт находится за Cloudflare.
Нужно проверять именно тот сертификат, который стоит на сервере (origin), а не edge-сертификат Cloudflare.
3. Принятое решение
Мы перешли на следующую схему:
- SSL проверяется не на
site.xxx - А на
api.site.xxx
Например:
- ❌ Было:
hdroom.xxx - ✅ Стало:
api.hdroom.xxx
API-поддомен не маскируется Cloudflare edge-сертификатом таким же образом и позволяет корректно проверить серверный SSL.
4. Текущий статус
На текущий момент:
- Добавлены SSL-алерты через
api-поддомены по всем сиджам - Мониторинг теперь должен корректно ловить истечение сертификатов
5. Стандарт настройки для новых сиджей
При запуске любого нового сиджа:
Обязательно:
- Создать SSL-проверку в Pingdom
- Проверять
api.домен - Название проверки и данные внутри проверки — по аналогии с существующими
Пример:
bookmark_cert
Для нового сайта:
newsite_cert
⚠ Не нужно придумывать новую структуру — просто копировать существующую проверку и менять домен.
6. Таблица для заполнения данных
Для удобства используется единая таблица, где фиксируются данные для SSL-проверок:
👉 [Ссылка на таблицу — https://docs.google.com/spreadsheets/d/1Ffguco0cSekm_pu1FcSqKMo3RQXMgl_j4-vFm3qjSgc/edit?gid=0#gid=0 ]
Заполнять можно по примеру любого уже существующего сайта.
7. Главное правило
Если сайт за Cloudflare —
проверяем сертификат только через api-поддомен.
Проверка основного домена не гарантирует обнаружение проблемы.
8. Риски, которые теперь закрыты
- Протухший origin-сертификат больше не останется незамеченным
- Cloudflare не «замаскирует» проблему
- Истечение сертификатов будет алертиться заранее
🔗 Связанные заметки
Источник: карточка Trello #12 · открыть в Trello