Как обеспечить катастрофоустойчивость ИТ-систем с помощью ЦОД и облаков?
TADетали
Для бизнеса важно предоставлять услуги своим клиентам в режиме 24/7. Но обеспечивать отказоустойчивость ИТ-систем собственными силами иногда сложно и часто — просто экономически невыгодно. В том, как выбрать правильный аутсорсинговый дата-центр и провайдера услуг, помогли разобраться Ренат Сайфутдинов, руководитель направления аутсорсинга вычислительных инфраструктур компании «Крок», и Дмитрий Иванюк, ведущий технический эксперт группы компаний Mont.
Содержание |
Обеспечение катастрофоустойчивости: основные тенденции
«Отказоустойчивость инфраструктуры – это гарантия постоянной доступност клиентских сервисов и как результат – успешности бизнеса. Это актуально одновременно и для крупных компаний, и для SMB. Цифровизация, развитие онлайн-сервисов, нон-стоп коммуникации с потребителями и фактически молниеносные ответы на их запросы — это те факторы, которые будут способствовать популярности услуг DR (disaster recovery) и HA (high availability). При этом мы видим, что большее количество запросов на услуги по обеспечению катастрофоустойчивости приходит от средних по масштабу компаний. На наш взгляд, это объясняется достаточно просто: крупные игроки еще в «тучные годы» заложили фундамент в виде надежных зарезервированных вычислительных систем, чего нельзя сказать про молодых, но быстрорастущих участников рынка», — рассказал руководитель направления аутсорсинга вычислительных инфраструктур компании «Крок» Ренат Сайфутдинов. |
По мнению эксперта, выбор тех или иных технических средств, заложенных в архитектуру катастрофоустойчивого решения, может отличаться в зависимости от масштаба компании, ее бюджета на ИТ, требований к уровню отказоустойчивости и работоспособности сервисов в критических ситуациях. К основным вариантам реализации проекта относится репликация данных на уровне СХД, кластеризация на уровне баз данных и приложений (если нужно обеспечить полную непрерывность), а также внедрение специализированного программного обеспечения для репликации данных (когда сохранность данных важнее мгновенного восстановления систем). Последнее может быть использовано в том числе на базе облачной инфраструктуры.
Крупный бизнес может позволить себе репликацию на уровне СХД. Средний и малый бизнес, напротив, часто обращает внимание на облачные решения, потому что это дешевле.
«Непрерывность бизнес-процессов, репутационные риски, комплексная защита данных, SLA, RTO и RPO — все чаще компании разных уровней задаются вопросом обеспечения отказоустойчивости и непрерывности ИТ-сервисов. С приходом понимания всех аспектов руководители компаний и ИТ-директора все чаще интересуются услугами DR и HA, обеспечивая нас интересными проектами и задачами», — отмечает Дмитрий Иванюк, ведущий технический эксперт группы компаний Mont. |
Собственный ЦОД или аутсорс?
Этот вопрос сугубо материальный: далеко не все компании могут позволить себе построить ЦОД с должным уровнем отказоустойчивости. Стоимость небольшого дата-центра на 10-12 стоек составит 60-80 млн рублей, затраты на строительство более крупных ЦОД измеряются миллиардами. Это не только крупные единовременные инвестиции в инфраструктуру, которые можно было бы перенаправить на развитие бизнеса, но и потребность в поиске и удержании квалифицированного персонала, занятого в обслуживании инфраструктуры. Это также головная боль ИТ-директора, который должен держать в уме, что каждые 3-5 лет нужно проводить апгрейд технических решений. С точки зрения окупаемости аренда ЦОД в пятилетней перспективе выгоднее, чем создание собственного дата-центра. И одновременно с этим — несравненно более удобна в плане управления ресурсами.
Но, выбирая аутсорсинг ЦОД, возникает другой вопрос: на какие характеристики коммерческого дата-центра строит обратить внимание, чтобы не было мучительно больно за потраченные на миграцию время и ресурсы.
«Современные тенденции развития бизнеса говорят о том, что скорость принятия решения и доступность по всему миру ИТ-инфраструктуры компании в любой момент времени являются одними из ключевых задач, стоящих перед руководством предприятия. Однако обслуживание сложных ИТ-систем высококвалифицированной ИТ-командой подразумевает наличие больших расходов для бизнеса, что зачастую для среднего и малого бизнеса является ключевым фактором при выборе аутсорсинговых услуг. При этом современные ЦОД, обладая всеми необходимыми ресурсами, соответствующими международным стандартам, надежными «железными» и программными решениями, обеспечат компании всем необходимым для создания ИТ-инфраструктуры. А благодаря удобным инструментам с такой системой вполне можно справиться силами одного квалифицированного сотрудника», — говорит Дмитрий Иванюк. |
«В первую очередь нужно обращать внимание на уровень арендуемого ЦОД, его сертификацию в соответствии с международными стандартами и следование лучшим практикам в области эксплуатации дата-центра. В целом, все эти параметры учитываются сертификатами Uptime Institute Tier III — Constructed Facility, подтверждающий соответствие ЦОД стандарту Tier III с точки зрения инженерной составляющей, и Gold Certification of Operational Sustainability, подтверждающий высокий уровень эксплуатации объекта. Размещаясь в дата-центре, имеющем эти сертификаты, клиенты аутсорсинговых услуг могут быть уверены в качестве оказываемого сервиса и избавляют себя от необходимости лишних проверок», — подтверждает Ренат Сайфутдинов. |
Эксперты также советуют избегать работы с переарендованными ЦОД, когда центр обработки данных фактически вручается заказчику через третьи руки. Это может вызвать дополнительные административные риски, тем более что прецеденты на рынке уже случались.
Как технически происходит резервирование инфраструктуры в ЦОД
Первый вариант — использовать аутсорсинговый ЦОД в качестве резервного для корпоративной системы или инфраструктуры. Второй вариант — отдать на аутсорсинг как основную площадку, так и резервную.
«Резервирование начинается с каналов связи. Но если клиент размещается в нашей сети дата-центров, то между ними уже проложено оптоволоконное кольцо. Дальше создаются кластеры на уровне серверной части, СХД и так далее, — перечисляет Ренат Сайфутдинов. — Мы реализуем проекты по обеспечению катастрофоустойчивости «под ключ», то есть мы не только предоставляем стойко-места, но и проектируем всю инфраструктуру, обеспечиваем ее поддержку и сам процесс переключения в случае сбоев, развертываем оборудование и ПО для резервного копирования. В частности, используем решения CommVault как хорошо зарекомендовавшие себя инструменты для защиты данных от потерь. Продукты от CommVault применяются не только для резервирования больших инфраструктур, они подходят и для небольших инсталляций: пользовательских устройств, физических и виртуальных серверов и даже почтовых ящиков». |
Первым этапом любого проекта «Крок» становится аудит инфраструктуры компании на уровне информационных систем. После этого бизнес определяет требования к отказоустойчивости по двум базовым показателям: RTO (recovery time objective — максимально допустимое время недоступности систем) и RPO (recovery point objective — точка восстановления данных после сбоя).Как с помощью EvaProject и EvaWiki построить прозрачную бесшовную среду для успешной работы крупного холдинга
На следующем этапе проектируется резервная инфраструктура и подбираются конкретные технологии, отвечающие требованиям бизнеса. Дальше происходит инсталляция, а раз в полгода-год производятся тестовые переключения между площадками и проверка резервных копий. Конкретные сроки внедрения и продолжительность каждого из этапов зависят от объема инфраструктуры и самой компании.
«Классический пример использования коммерческого ЦОД в качестве резервного — наш проект для банка «Интеза». Для него мы спроектировали надежную инфраструктуру в дополнение к имеющемуся дата-центру заказчика. В компании Avon была другая ситуация: заказчик разместил у нас и основную, и резервную площадки. Мы предоставляем им инфраструктуру по модели управляемого сервиса и обеспечиваем ее постоянную доступность. В том числе — отвечаем за поддержку и переключение с одной площадки на другую в случае сбоев», — рассказал Ренат Сайфутдинов. |
По словам Дмитрий Иванюка, сейчас на базе решения CommVault реализовано несколько сценариев для обеспечения максимальной доступности сервисов в инфраструктуре заказчиков. IaaS обеспечивает доступность арендованной виртуальной инфраструктуры и приложений, а RBaaS позволяет заказчикам получить возможность арендовать программные решения для использования на своих локальных мощностях.
Катастрофоустойчивость с помощью облака: в чем отличие?
Нередко заказчики выбирают использование облачной или гибридной инфраструктуры при обеспечении катастрофоустойчивости. В первом случае речь идет о размещении сервисов и систем на базе облачной платформы, распределенной между территориально удаленными дата-центрами. Такой проект компания «Крок» реализовала, в частности, для сети гипермаркетов Castorama. Во втором случае у компании есть собственный и/или аутсорсинговый ЦОД, а резервная площадка размещается в облаке. Этот вариант эксперты называют гибким с точки зрения ценообразования: бизнес будет платить только за те ресурсы, которые фактически потребляет в случае активации резервной площадки.
«Как выглядит технически второй сценарий? Мы резервируем инфраструктуру заказчика — это может быть как виртуализированная среда, так и физические серверы. В процессе установки происходит сначала репликация всех данных из основного ЦОД заказчика в облако, а потом, по мере изменения данных в исходной системе, они меняются и в облаке. Заказчик платит только за лицензии решений репликации, канал связи и за объем хранимых данных. В случае какой-то проблемы с основной площадкой, мы активируем резервную по звонку или заявке. Готовая к тестовым переключениям резервная площадка при таком сценарии готовится за две недели», — резюмирует Ренат Сайфутдинов. |
«Благодаря решению CommVault мы можем обеспечить миграцию инфраструктуры заказчика из одной среды виртуализации в другую. Произвести конвертацию локальных виртуальных машин в формат публичных облаков (Amazon и Azure) и обратно. Обеспечить максимально эффективную защиту приложений и сохранность данных на ноутбуках сотрудников заказчиков, где бы они не находились», — добавляет Дмитрий Иванюк. |
По мнению эксперта «Крок», сегодня в России услуги по обеспечение катастрофоустойчивости наиболее востребовано банками, торговыми сетями и промышленными компаниями. В финансовом секторе и производстве к высокому спросу подталкивают требования по непрерывности бизнеса, накладываемые регуляторами. В остальных же сегментах, включая ритейл, построение отказоустойчивых инфраструктур или их аренда из ЦОД и облака объясняется растущей конкуренцией. Это дает основания для прогнозирования роста на соответствующие услуги (в первую очередь, аутсорсинговые), примерно на 10-15% ежегодно.