Как часто, насколько тщательно и в каком режиме обслуживать сервера на colocation — зависит от количества, возраста и типа оборудования. Здесь как с техникой: регламент техобслуживания трехлетнего Hyundai Solaris один, а у годовалого YAMAHA FJR1300AE совсем другой. Но если усреднить, всю программу обслуживания серверов можно свести к простому списку рутинных операций.
Структура обслуживания
Сервер — это комплекс программного обеспечения, работающего на аппаратной части. Соответственно, в обслуживание сервера включается техническое обслуживание (ТО) «железа» и поддержка программной составляющей. Начнем с «железа»:
-
Очистка от пыли. У нас в машзалах настелены антистатические полы, на системе приточной вентиляции установлены фильтры, а уборка проводится ежедневно. Но пыль вездесуща и, рано или поздно, она забивается в зазоры и оседает на контактах. Тотальную чистку оборудования от пыли в среднем проводят 2 раза в год. В остальное время можно ограничиться визуальным контролем и ситуативными мерами.
-
Контроль индикаторов и замена комплектующих, требующих вскрытия корпуса. Чаще всего из строя выходят жесткие диски, но состояние выработавших ресурс RAM и процессора также может потребовать замены.
-
Проверка портов. Безопасности много не бывает, поэтому неиспользуемые открытые порты нужно время от времени просматривать на предмет посторонних подключений.
-
Внешний и внутренний осмотр, оценка температурных параметров.
Проверка аппаратной части
В программной части работы не меньше:
-
Обновление системы. Наша многолетняя практика показывает, что автоматические обновления не всегда устанавливаются чисто. Принудительная установка позволяет сначала проверить их корректность на тестовом сервере.
-
Плановая перезагрузка. В процессе чистятся логи и завершают работу фоновые задачи, невыполненные из-за сбоя.
-
Проверка безопасности, включая сканирование системы и выявление скрытых заражений.
-
Контроль корректности резервного копирования. Сбои происходят везде, даже в системе резервного копирования. Чтобы точно знать, что в запасе есть рабочая копия, регулярно проверяйте, делаются ли копии, правильно ли сохраняются, в нужном ли объеме. В этом же блоке работ имеет смысл проводить тестовое восстановление резервных копий и баз.
-
Чистка диска от временных файлов. Эта регулярная операция поддерживает системный диск в чистоте и освобождает место под нужные данные.
-
Отслеживание ошибок по журналу логов. По записям можно узнать о проблемных местах сервера и предотвратить возникновение критических ошибок, вместо того, чтобы впоследствии устранять их.
-
Контроль систем мониторинга. Мониторинг снимает массу рутинной работы с администратора, но излишнее доверие системе может привести к излишнему потреблению ресурсов сервера. Дело в том, что система не всегда успевает вовремя отреагировать на изменение ситуации и здесь нужен только личный контроль: просмотр отчетов потребляемых ресурсов, поиск критических точек, анализ тенденций.
Большая часть этих работ проводится с периодичностью раз в месяц, но чем больше серверный парк и чем масштабнее проект, тем чаще оборудование требуется контролировать и обслуживать.
Обслуживание сервера по регламенту
В идеале под обслуживание серверов составляется инструкция или регламент. Регламент может быть большим или сжатым, детально прописанным или общим — не важно. Важно, чтобы он стал опорным пунктом для любого, кто столкнется с администрированием вашего оборудования.