Veeam - от резервного копирования к скоростному восстановлению

26 мая 2016 года в Москве прошёл второй российский форум компании Veeam. Наша редакция вновь получила приглашение и даже попала на закрытые для прессы мероприятия. Мне было интересно узнать, что изменилось за прошедший год и какие технические подробности организаторы готовы раскрыть на этот раз.

Открывали VeeamON Forum Russia 2016 выступления старшего вице-президента Veeam Дэниэла Фрида и регионального директора Veeam в России и СНГ Василия Ваганова. Из них следует, что в корпоративном сегменте резервное копирование становится уже не отдельной задачей, а частью общей системы обеспечения постоянной доступности бизнес-сервисов.

Региональный директор Veeam в России и СНГ Василий Ваганов.

Основные заказчики Veeam сегодня – это банки, операторы связи и сервис-провайдеры, одновременно обслуживающие миллионы клиентов. Для них критически важна скорость восстановления внутренних и онлайн-сервисов после сбоев, что весьма непросто обеспечить при петабайтных объёмах данных и постоянном потоке транзакций.

Дэниэл Фрид на VeeamON Forum Russia 2016.

Во время обсуждений новые продукты компании часто сравнивались с традиционными решениями для резервного копирования. Тут интересны не столько ожидаемые заявления о превосходстве собственных разработок, сколько концептуально другие подходы, применяющиеся для бэкапа и восстановления виртуальных сред.

Подробнее об этом рассказал руководитель группы виртуализации DataLine Михаил Соловьёв. Благодаря решениям Veeam, поддерживающим создание бэкапов с аппаратных снимков, в Dataline два человека обслуживают более тысячи виртуальных машин с совокупным объёмом данных свыше петабайта.

Своим опытом также поделился Михаил Бедарев – специалист по развитию виртуализации и аппаратных платформ компании «МегаФон». Сегодня этот оператор сотовой связи обслуживает свыше 76,8 млн. абонентов, для чего требуются эффективные технологии консолидации биллинговой системы. По словам Михаила, у Veeam для этого есть простые в использовании решения, позволяющие выполнить столь сложную задачу практически без приостановки сервисов.

Специалист по развитию виртуализации и аппаратных платформ компании «МегаФон» Михаил Бедарев.

Обычно бэкап ресурсоёмких хостов делает их недоступными на запись в течение большого периода времени (от получаса до нескольких часов). С решениями Veeam это время сокращается до пары минут (или даже секунд, если требуется просто приостановить операции ввода/вывода). Поэтому в короткие сроки группе Михаила удалось объединить свыше полутора тысяч виртуальных машин, продолжая оказывать всем абонентам услуги связи в штатном режиме.

Решения Veeam у оператора связи "МегаФон". — Решения Veeam у оператора связи «МегаФон».

Одно из самых быстрорастущих направлений сегодня в ИТ – это бэкап у сервис-провайдеров. Если в классическом варианте быстрое восстановление оказывается доступно только для самых приоритетных данных, то разработки Veeam позволяют в очень сжатые сроки сразу поднять целый пул упавших VM и полностью восстановить работу любого сервиса.

Для этого используется глубокая интеграция с СХД, аппаратные снимки и целый ряд других технологий, о которых на закрытой презентации рассказывал руководитель группы системных инженеров Veeam в России и СНГ Виталий Савченко. Мне удалось задать ему ряд вопросов после выступления.

Руководитель группы системных инженеров Veeam Виталий Савченко.

— Виталий, как на ваш взгляд изменилась сама концепция резервного копирования?

— За последние годы она стала принципиально другой и сейчас продолжает меняться. Раньше время восстановления измерялось часами, да и сами операции копирования выполнялись долго. Поэтому при составлении плана бэкапа все данные разделялись по приоритетам. Более приоритетные могли копироваться несколько раз в день, а менее – раз в неделю. Теперь такой подход во многих отраслях просто неприемлем. Любая компания сегодня сильно зависит от своих ИТ-сервисов, нагрузка на которые постоянно растёт. Все бизнес-процессы очень тесно интегрированы и расстановка приоритетов уже не играет такой роли. Порой отказ вспомогательного сервиса приводит к срыву заказов, ухудшению репутации и большим финансовым потерям. Поэтому сегодня мы говорим уже не столько о механизмах резервного копирования, сколько о технологиях повышения доступности данных в целом. В этом смысл концепции Always-On Enterprise – гарантировать быстрое восстановление и бесперебойную работу всех бизнес-процессов.

— Какие объективные критерии подтверждают это?

— В своих исследованиях мы опирались преимущественно на два ключевых показателя: RPO (целевая точка восстановления) и RTO (целевое время восстановления). Первый параметр характеризует временной промежуток, за который возможна потеря данных. Второй параметр показывает, насколько быстро возобновляется работа критичных ИТ-систем. Это время меньше или равно интервалу между двумя последовательно сделанными бэкапами. Большинство ИТ-руководителей признаются, что имеющиеся у них решения отстают от стандартов обеспечения непрерывности бизнес-процессов по обоим показателям на 3-4 часа. Продукты Veeam могут обеспечить 15-минутные показатели RTPO.

— Звучит довольно фантастично, особенно для крупных компаний с петабайтными объёмами.

Такие показатели RPO и RTO стали возможны благодаря целому комплексу технологий. Например, за счёт поддержки гипервизоров можно сразу подключить бэкап виртуальной машины в продуктив. Veeam Explorer позволяет мгновенно восстанавливать объекты приложений. Также решения Veeam тесно интегрируются с СХД и поддерживают резервное копирование с помощью аппаратных снимков. Это значительно улучшает скорость резервного копирования, в частности – за счет уменьшения времени операции VMware Snapshot commit.

Что касается частоты бэкапов: сбои обычно происходят при интенсивной нагрузке, а как раз во время неё администраторы отключают бэкап, чтобы высвободить ресурсы. Технология от Veeam – Backup I/O Control позволяет динамически регулировать скорость чтения данных при создании резервных копий в зависимости от текущей загрузки СХД. Благодаря этому больше не надо откладывать выполнение бэкапов, дожидаться конца рабочего дня или оставаться для их создания на выходные. Резервное копирование может выполняться как фоновый процесс, существенно не влияющий на скорость работы основных сервисов.

— Какие ключевые изменения произошли в продуктах Veeam с прошлого года?

За это время были выполнены ранее анонсированные шаги, такие как появление в девятой версии Veeam Availability Suite поддержки СХД EMC VNX, ускорение ключевых операций резервного копирования и восстановления данных… но это всё плановые изменения. Гораздо важнее, что появились принципиально новые вещи. Теперь в наших продуктах мы развиваем сервис DRaaS.

— Что представляет собой этот сервис?

DRaaS (Disaster Recovery as a Service) – это аварийное восстановление как услуга. Его техническая основа – это репликация в облако. По отзывам сервис-провайдеров и крупных клиентов сервис DRaaS стал настоящим прорывом. Теперь данные можно не просто переместить или продублировать в облако, а получить полностью готовый и очень эффективный сервис их восстановления из облачного хранилища.

— В чем смысл такого подхода для заказчика?

Заказчикам теперь гораздо проще и дешевле использовать современные технологии бэкапа. Теперь им не обязательно закупать дорогие СХД или масштабировать имеющиеся хранилища по мере роста объёмов данных. Облачные платформы предоставляют место по мере необходимости. На фоне затянувшегося кризиса это стало особенно популярным решением, так как фирмы стали урезать бюджеты на ИТ и другие непрофильные расходы. Они стали больше обращаться к сервис-провайдерам.

— Насколько я понимаю, восстановление из собственного СХД обычно происходит быстрее, чем из облака?

Скорость зависит от многих факторов, и не только чисто физических, вроде типа носителей и толщины канала. Мы используем сжатие и дедупликацию данных, чтобы эффективнее передавать их даже на каналах с малой пропускной способностью. Кроме того, сейчас популярны гибридные облака, в которых наиболее свежая и критичная к скорости часть данных хранится на собственном СХД заказчика, а всё не относящееся к продуктиву переносится на платформу сервис-провайдера, в частное или публичное облако.

— В своём выступлении вы упоминали о стремлении Veeam расширить поддержку публичных облаков. Расскажите подробнее?

Компании сейчас активно мигрируют в облака. Соответственно, мы тоже начинаем поддерживать облачные решения. Сейчас мы много вкладываем в интеграцию своих продуктов с платформами сервис-провайдеров. Они предлагают частные или публичные облачные сервисы. Например, это Microsoft Azure и Amazon Elastic Cloud. В прошлом году у нас появилось решение Veeam Cloud Connect для MS Azure. С ним заказчики получили возможность использовать сервис бэкапа с загрузкой резервных копий в Azure. В этом же году появилась возможность восстанавливать данные непосредственно в Azure.

— Как это технически происходит?

С технической точки зрения для клиентов сервис Azure работает по принципу «чёрного ящика». Microsoft не раскрывает детали об инфраструктуре своей облачной платформы. Это проприетарная система, закрытая для других разработчиков. Однако, как партнёры Microsoft, мы получаем частичный доступ к её закрытым технологиям. Поэтому Veeam может выпускать решения с глубокой интеграцией сторонних сервисов. Например, появление Direct Restore to Azure for Veeam Backups с функцией прямого восстановления в облако Microsoft как раз стало следствием такой схемы сотрудничества.

— Какие другие облачные сервисы планируется поддерживать в следующих версиях продуктов Veeam?

На текущий момент интеграция с облаками – это начало большого пути. О такой необходимости говорится уже давно, ведь заказчики хотят выбирать, а не быть привязанными к какой-то одной платформе. Поэтому я думаю, что мы, скорее всего, будем развивать аналогичную схему интеграции с облачными сервисами других компаний – Amazon, Google и других лидеров рынка.

— Над какими новыми продуктами сейчас работают в Veeam?

Скоро мы представим Veeam Availability Orchestrator. Это новый инструмент, позволяющий оптимизировать управление процессом восстановления данных после сбоев. Он ориентирован в первую очередь на крупных заказчиков с большим числом защищаемых систем и виртуальных машин, быстрое восстановление которых вручную невозможно в принципе. Orchestrator возьмёт эту функцию на себя.

— Сейчас у Veeam закрытый формат контейнера резервных копий. Планируете ли вы сделать его открытым?

Пока в планах такой задачи нет, но сама идея неплохая. У нас уже информация о бэкапе хранится в самом бэкапе, поэтому утрата сервера управления не приводит к потере данных. По большому счёту бэкап – это архив. Открытый формат, наверное, позволил бы нам реализовать его поддержку в утилитах и плагинах других разработчиков, расширить список поддерживаемых платформ, а также привлечь внимание сторонников СПО.

Veeam — от резервного копирования к скоростному восстановлению