Базовый чек-лист обслуживания серверов

Как часто, насколько тщательно и в каком режиме обслуживать сервера на colocation — зависит от количества, возраста и типа оборудования. Здесь как с техникой: регламент техобслуживания трехлетнего Hyundai Solaris один, а у годовалого YAMAHA FJR1300AE совсем другой. Но если усреднить, всю программу обслуживания серверов можно свести к простому списку рутинных операций.

Структура обслуживания 

Сервер — это комплекс программного обеспечения, работающего на аппаратной части. Соответственно, в обслуживание сервера включается техническое обслуживание (ТО) «железа» и поддержка программной составляющей. Начнем с «железа»:

  1. Очистка от пыли. У нас в машзалах настелены антистатические полы, на системе приточной вентиляции установлены фильтры, а уборка проводится ежедневно. Но пыль вездесуща и, рано или поздно, она забивается в зазоры и оседает на контактах. Тотальную чистку оборудования от пыли в среднем проводят 2 раза в год. В остальное время можно ограничиться визуальным контролем и ситуативными мерами.

  2. Контроль индикаторов и замена комплектующих, требующих вскрытия корпуса. Чаще всего из строя выходят жесткие диски, но состояние выработавших ресурс RAM и процессора также может потребовать замены.

  3. Проверка портов. Безопасности много не бывает, поэтому неиспользуемые открытые порты нужно время от времени просматривать на предмет посторонних подключений.

  4. Внешний и внутренний осмотр, оценка температурных параметров.

Проверка аппаратной части

Проверка аппаратной части

В программной части работы не меньше:

  1. Обновление системы. Наша многолетняя практика показывает, что автоматические обновления не всегда устанавливаются чисто. Принудительная установка позволяет сначала проверить их корректность на тестовом сервере.

  2. Плановая перезагрузка. В процессе чистятся логи и завершают работу фоновые задачи, невыполненные из-за сбоя.

  3. Проверка безопасности, включая сканирование системы и выявление скрытых заражений.

  4. Контроль корректности резервного копирования. Сбои происходят везде, даже в системе резервного копирования. Чтобы точно знать, что в запасе есть рабочая копия, регулярно проверяйте, делаются ли копии, правильно ли сохраняются, в нужном ли объеме. В этом же блоке работ имеет смысл проводить тестовое восстановление резервных копий и баз.

  5. Чистка диска от временных файлов. Эта регулярная операция поддерживает системный диск в чистоте и освобождает место под нужные данные.

  6. Отслеживание ошибок по журналу логов. По записям можно узнать о проблемных местах сервера и предотвратить возникновение критических ошибок, вместо того, чтобы впоследствии устранять их.

  7. Контроль систем мониторинга. Мониторинг снимает массу рутинной работы с администратора, но излишнее доверие системе может привести к излишнему потреблению ресурсов сервера. Дело в том, что система не всегда успевает вовремя отреагировать на изменение ситуации и здесь нужен только личный контроль: просмотр отчетов потребляемых ресурсов, поиск критических точек, анализ тенденций.

Большая часть этих работ проводится с периодичностью раз в месяц, но чем больше серверный парк и чем масштабнее проект, тем чаще оборудование требуется контролировать и обслуживать.   

Обслуживание сервера по регламенту

Обслуживание сервера по регламенту

В идеале под обслуживание серверов составляется инструкция или регламент. Регламент может быть большим или сжатым, детально прописанным или общим — не важно. Важно, чтобы он стал опорным пунктом для любого, кто столкнется с администрированием вашего оборудования.

Поделиться:
Читать еще
Внутренний аудит информационной безопасности 18.06.2021
В копилку службы ИБ: методы, подходы и чек-листы для внутреннего аудита информационной безопасности.
Читать подробнее
Как разобраться с логированием: гайд для начинающих 25.06.2021
Зачем оно нужно, это логирование и как упростить процесс сбора, анализа и хранения логов.
Читать подробнее
Когда нужен внешний аудит информационной безопасности 09.07.2021
Про объекты, результаты и периодичность внешнего аудита информационной безопасности для операторов ПДн, объектов критической информационной инфраструктуры, субъектов НПС и других компаний.
Читать подробнее
Что такое тикет-система и как она применяется в ЦОД 16.07.2021
Чем тикет-система лучше телефонной поддержки и как ЦОД использует тикеты для улучшения работы.
Читать подробнее
Аварии в ЦОД и как их избежать 23.07.2021
Про экстраординарные форс-мажоры ЦОД на примере аварии дата-центра «Курчатовский» и меры защиты от основных глобальных рисков
Читать подробнее
Введение нового порядка госаккредитации ИТ-компаний в РФ 30.07.2021
Как изменится госаккредитация ИТ-компаний с 1 августа 2021 года? Делаем обзор изменений и нововведений.
Читать подробнее
Оставить заявку
После отправки заявки ожидайте звонка нашего менеджера.
* Поля, обязательные к заполнению.
Спасибо!
Данные вашего заказа будут переданы в отдел продаж.
После чего ожидайте звонка вашего личного менеджера.
контакты компании
Адрес компании
124460, Москва, Зеленоград, ул. Конструктора Лукина, д. 14А, офис 501
Поддержка 24\7
8 800 350 15 00
ПОЧТИ готово!
Спасибо, данные вашего заказа будут переданы в отдел продаж.
После чего ожидайте звонка вашего личного менеджера.
* Поля, обязательные к заполнению.