Дежурные инженеры — на передовой дата-центра. Они первыми лицом к лицу встречают инциденты, молниеносно принимают решения, а при необходимости могут одновременно обжимать витую пару и человеческим языком объяснять гостю ЦОДа принцип расстановки оборудования в стойке. В профессиональной среде их считают универсалами и многостаночниками. По сути, так оно и есть.
Чем занимаются дежурные инженеры в ЦОД
У дежурных инженеров ЦОД GreenBushDC широкий круг обязанностей, который не укладывается в стандартный рабочий режим с 9 до 18 часов. Дежурная смена в дата-центре находится 24 часа в сутки, в будни и выходные дни. Даже во время весеннего карантина специалисты работали в прежнем режиме. Иначе нельзя, ведь в их обязанности входит:
-
отслеживать показания систем мониторинга ЦОД (электроустановки, источники бесперебойного питания, система кондиционирования и пр.),
-
обходить и осматривать критические точки инфраструктуры,
-
регистрировать инциденты в системах,
-
устранять сбои, если они входят в их зону ответственности,
-
передавать инциденты сотрудникам служб эксплуатации инженерной инфраструктуры, сетевым инженерам и в другие специализированные отделы.
Если судить о работе дежурных инженеров по фотографиям, может показаться, что основное их занятие — медитативное созерцание мониторов.На самом деле дежурные — самые недоверчивые и скептичные настроенные сотрудники дата-центра. Они, конечно, верят электронике и показателям на мониторах, но несколько раз в течение смены перепроверяют их.
Монитор в диспетчерской
Один за другим обходят машзалы, выборочно фиксируя температуру по датчикам холодных и горячих коридоров, на панелях системы кондиционирования. Смотрят, все ли шнуры питания подключены, не забыл ли кто в машзале запрещенных предметов, например, картонную упаковку от оборудования. Заходят в венткамеры, на станцию автоматического пожаротушения и в электрощитовую, чтобы провести визуальный осмотр, проверить крепления, осмотреть пол на предмет мелких протечек.
Человеческий фактор
Нас иногда спрашивают, зачем нужна дежурная смена, если в дата-центре есть система мониторинга и диспетчеризации? Дело в том, что основной задачей дежурной смены является не контроль систем ЦОД — с этим как раз отлично справляются датчики и алгоритмы, а быстрое, точное и адекватное реагирование на инциденты.
Будни дежурного инженера
Конечно, на все инциденты у нас есть регламенты и инструкции, но только опытный инженер:
-
выделит в информационном потоке главное,
-
оценит риски,
-
проследит логическую связь между мелким сбоем одной системы и отказом другой,
-
предложит несколько вариантов решения.
Потом, после нормализации ситуации, решения инженеров ложатся в основу статистики инцидентов и включаются в обновленные регламенты и инструкции.
Помимо контроля основных систем ЦОД, в сферу ответственности дежурных инженеров входит и помощь клиентам. Именно инженеры помогают установить и настроить гипервизор, смонтировать, промаркировать и перезагрузить оборудование. Они же готовят стойки к монтажу, выполняют кроссировку и маркировку, прокладывают структурированную кабельную систему, проводят визуальный осмотр серверов и сопровождают клиентов по ЦОДу. Фактически, работа дежурных инженеров объединяет технологическую и сервисную составляющие дата-центра. Нам важны обе, поэтому подбору инженеров в дежурную смену мы уделяем не меньше внимания, чем температурному режиму в серверных залах. И таким подходом сводим к минимуму самый трудноуправляемый фактор риска — человеческий.