Управление физической инфраструктурой

Управление физической инфраструктурой через NetBox описано в разделе NetBox — Управление физической инфраструктурой.

Режим обслуживания вычислительных узлов (гипервизоров)

Для обслуживания вычислительного узла (гипервизора) предусмотрен механизм временной деактивации этого узла внутри кластера. На время деактивации узел будет исключён из пула планирования, однако продолжит быть участником кластера.

На Портале администратора можно отследить процесс перехода гипервизора в режим обслуживания (maintenance mode). Для этого нужно перейти в раздел Вычислительные ресурсы > Гипервизоры и посмотреть значение в столбце admin_state. При выборе действия Enable maintenance mode гипервизор переходит в режим обслуживания, а статус и значение admin_state меняется на EnteringMaintenanceMode.

Для перевода узла в режим обслуживания выполните следующие действия:

  1. На Портале администратора перейдите в раздел Вычислительные ресурсы > Гипервизоры.

  2. В выпадающем списке Actions для этого узла выберите действие Enable maintenance mode.

    Вычислительные узлы с возможностью отключения

    Вычислительные узлы с возможностью отключения

  3. Дождитесь, когда статус гипервизора сменится с EnteringMaintenanceMode на новый. Если по какой-то причине гипервизор не перешел в maintenance mode, это будет отображено в статусе так: disabled (Service was transitioned to Error.). В столбце admin_state будет описана причина — например, Error (Live migration of server N failed). В таком случае можно либо повторно попробовать перевести гипервизор в режим обслуживания, нажав Enable maintenance mode, либо вернуть его в статус enabled, выбрав Enable Service.

При переходе узла в режим обслуживания все ВМ начнут мигрировать с него на другие узлы без прерывания их работы. Также на время режима обслуживания на этом узле невозможно будет запустить новые ВМ.

Если гипервизор переведен в режим обслуживания, миграция ВМ с него происходит параллельно в соответствии с настройками max_concurrent_live_migrations. Машины эвакуируются по одной за раз. При этом в качестве причины отключения узла (disable_reason) выставляется maintenance mode: disable_service_by_uuid(token, service_id, reason='maintenance mode', region=region).

После перехода в режим обслуживания вычислительный узел можно отключить от питания и производить работы по ремонту или модернизации.

Просмотр диагностической информации по гипервизору

На Портале администратора вы можете просматривать информацию о потребляемых ресурсах вычислительных узлов (гипервизоров).

Выключение и перезагрузка гипервизоров

Для выключения или перезагрузки гипервизора выполните следующие действия:

  1. В левом меню Портала администратора перейдите в раздел Вычислительные ресурсы > Гипервизоры.

  2. Выберите необходимый вам гипервизор и включите режим обслуживания, выбрав в колонке actions действие Enable maintenance mode.

    Режим обслуживания гипервизора

    Режим обслуживания гипервизора

  3. Подтвердите действие в открывшемся окне.

  4. В выпадающем списке actions выберите Power management:

    • Чтобы перезапустить гипервизор, нажмите Reboot.

    • Чтобы выключить гипервизор, нажмите Shutoff.

    Выключение и перезагрузка гипервизора

    Выключение и перезагрузка гипервизора

  5. Подтвердите действие в открывшемся окне.

  6. Для возвращения гипервизора в рабочий режим после перезагрузки отключите режим технического обслуживания гипервизора, выбрав в колонке actions действие Disable maintenance mode.

    Отключение режима технического обслуживания гипервизора

    Отключение режима технического обслуживания гипервизора

  7. Измененный статус гипервизора отобразится в колонке admin_state.

Фенсинг узлов (fencing)

Фенсинг узлов (гипервизоров) проводит HA. Фенсинг — механизм изоляции неисправного узла от других системных компонентов. Такой узел исключается из пула планирования ресурсов, а для расположенных на нём ВМ проводится эвакуация. Затем изолированный узел либо выключается, либо перезагружается в принудительном порядке.

После проведения фенсинга узлы могут оказаться в статусе fenced, что будет отражено на Портале администратора. Такие узлы опознаются по префиксу FENCED: в disabled_reason.

Чтобы вывести узлы из этого состояния, выполните следующие действия:

  1. В левом меню Портала перейдите в раздел Вычислительные ресурсы > Гипервизоры.

  2. Найдите в таблице узел, который выделен жёлтым цветом и обозначен меткой fenced.

  3. В выпадающем списке Actions для этого узла выберите действие Disable Fence Mode.

    Узел в статусе «fenced»

    Узел в статусе «fenced»

Создание и управление агрегатами

Агрегат (host aggregate) — это группа вычислительных узлов, объединенных логически на основе каких-либо характеристик, например, аппаратных средств или показателей производительности. Один вычислительный узел можно назначить как одному, так и нескольким агрегатам.

На Портале администратора список агрегатов доступен в разделе Вычислительные ресурсы > Агрегаты.

Для создания агрегата выполните следующие действия:

  1. Перейдите в раздел Вычислительные ресурсы > Агрегаты и нажмите кнопку Создать агрегат.

  2. Укажите свойства создаваемого агрегата:

    • Имя агрегата.

    • Зону доступности, если необходимо. Если вы хотите создать новую зону доступности для агрегата, включите флаг в поле Создать новую зону доступности? и укажите имя зоны в поле Имя новой зоны. Если вы хотите указать существующую зону доступности, выберите её из списка в поле Зона доступности.

    • Узлы агрегата, если необходимо. Для этого выберите один или несколько узлов из списка в поле Узлы. Если зона доступности узлов, которые вы хотите добавить в новый агрегат, отличается от зоны доступности создаваемого агрегата, то узлы в новый агрегат включены не будут.

  3. Нажмите кнопку Создать.

    Создание нового агрегата

    Создание нового агрегата

  4. Созданный агрегат будет добавлен в список агрегатов. Через выпадающий список в столбце actions для каждого агрегата вы можете:

    • Управлять возможностью эвакуации агрегата посредством его перевода в режим HA через действие Включить/Выключить эвакуацию. Подробнее об эвакуации агрегатов см. в разделе Эвакуация агрегатов.

    • Изменить имя и зону доступности для агрегата через действие Изменить агрегат. Подробнее об изменении зон доступности агрегата см. в разделе Управление зонами доступности агрегатов.

    • Управлять узлами агрегата (удалять или добавлять новые из списка) через действие Управление узлами. Если для агрегата добавляется узел, уже привязанный к какому-либо другому агрегату, необходимо убедиться, что редактируемому агрегату либо не назначена никакая зона доступности, либо этот агрегат находится в той же зоне доступности, что и тот, к которому уже привязан узел.

    • Изменить метаданные агрегата через действие Изменение метадаты. Подробнее о метаданных см. в разделе Метаданные хост-агрегатов.

    • Удалить агрегат через действие Удалить агрегат. Удалять можно только те агрегаты, которым не назначен ни один узел. Посмотреть список узлов для агрегата вы можете в столбце hosts.

    Действия с агрегатом

    Действия с агрегатом

Управление зонами доступности агрегатов

Зона доступности (Availability Zone, AZ) — это изолированная логическая группа, состоящая из одного или нескольких вычислительных узлов в пределах одного региона. За счёт изоляции ресурсов зона доступности обеспечивает повышение отказоустойчивости инфраструктуры.

На Портале администратора зоны доступности создаются и управляются через агрегаты. При создании агрегата вы можете как выбрать для него уже существующую зону доступности, так и создать новую. Подробнее о назначении зоны доступности агрегату при его создании см. в разделе Создание и управление агрегатами.

Чтобы добавить или изменить зону доступности для агрегата, выполните следующие действия:

  1. Перейдите в раздел Вычислительные ресурсы > Агрегаты.

  2. Выберите действие Изменить агрегат в выпадающем списке в столбце actions для нужного агрегата.

  3. В открывшемся окне:

    • Если вы хотите создать новую зону доступности, включите флаг в поле Создать новую зону доступности? и укажите имя зоны в поле Имя новой зоны. Вы не сможете создать новую зону доступности для агрегата, вычислительные узлы которого уже находятся в какой-либо другой зоне доступности.

    • Если вы хотите назначить агрегату уже существующую зону доступности, выберите её из списка в поле Зона доступности. Вы не сможете назначить зону доступности агрегату, вычислительные узлы которого уже находятся в этой зоне. Для того чтобы назначить зону доступности такому агрегату, необходимо удалить его узлы, назначить ему зону доступности, а затем добавить узлы снова.

    Вычислительные узлы агрегата отображаются в столбце hosts.

  4. Подтвердите действие, нажав Изменить.

    Изменение зоны доступности агрегата

    Изменение зоны доступности агрегата

    Окно изменения агрегата

    Окно изменения агрегата

Дополнительная информация о зонах доступности представлена в разделе Метаданные хост-агрегатов.

Эвакуация агрегатов

Вы можете переводить созданные агрегаты в режим высокой доступности (high availability или HA). В случае аварии могут быть эвакуированы только агрегаты, переведённые в этот режим.

При создании режим HA для агрегата включается автоматически. Если для агрегата не включен режим HA, возле его названия отображается метка no HA.

Для ручного перевода агрегата в режим HA выполните следующие действия:

  1. Перейдите в раздел Вычислительные ресурсы > Агрегаты.

  2. Посмотрите, какие агрегаты отмечены меткой no HA. Для этих агрегатов доступен перевод в режим HA.

  3. Переведите один или несколько агрегатов в режим HA:

    • Чтобы перевести в данный режим конкретный агрегат, выберите для него действие Включить эвакуацию в выпадающем списке в столбце actions.

    • Чтобы перевести в данный режим все агрегаты, имеющие метку, нажмите кнопку Включить эвакуацию для всех в верхней части интерфейса.

    Включение режима HA для агрегата

    Включение режима HA для агрегата

  4. Подтвердите действие, нажав Включить в открывшемся окне.

Для вывода агрегатов из режима HA повторите действия выше с тем отличием, что в выпадающем списке столбца actions выберите Выключить эвакуацию, а при выборе всех агрегатов — нажмите кнопку Выключить эвакуацию для всех.