За внешней простотой продукта часто кроются нетривиальные технические решения. Это в полной мере касается современных программ, выполняющих ответственные операции с данными. На первом российском форуме VeeamON Forum Moscow нам удалось побеседовать с руководителем группы системных инженеров Veeam Software Виталием Савченко. В ходе эксклюзивного интервью он рассказал о подробностях фирменных технологий для ускорения операций резервного копирования, восстановления данных и повышения их доступности.
Виталий, в ходе выступления вы упоминали о технологии ускорения передачи данных при резервном копировании – акселерации WAN. Она работает между разными ЦОДами или и на меньших масштабах тоже?
Наверное, говоря о WAN акселерации, лучше отталкиваться не от масштаба, а от задач и пропускной способности канала. Наши основные задачи – выбросить повторяющиеся блоки, оптимально сжать данные и грамотно их передать. Основной принцип заключается в том, что если канал слабый, то логично использовать WAN акселерацию.
В каких случаях вы не рекомендуете её использовать?
При малом количестве повторяющихся данных и высокой пропускной способности канала. Сама дедупликация большую часть времени происходит в один поток, поскольку это итерационный процесс. Надо взять один блок данных, выполнить вычисления, сравнить со следующим и так далее. В итоге сокращается объём передаваемых данных, но тратится время на их предварительную оптимизацию. Если у данных и так низкая энтропия, то они будут слабо сжиматься, а выигрыш от снижения их объёма получится небольшим. При высокой пропускной способности целесообразнее передавать их без предварительного сжатия. Теоретически выгоду от WAN акселерации можно получить и на десятигигабитном канале, поскольку высвобождается полоса для передачи операционных данных и работы других сервисов. По опыту же мы ориентируемся на гигабит. Если для задач бэкапа и синхронизации данных доступен канал от гигабита, то обычно их нет смысла сжимать.
Можно ли в ваших продуктах регулировать долю бэкапного трафика к общему?
Да, такие технологии приоритезации трафика у нас есть. Я просто не акцентировал на них внимание в своём выступлении. К примеру, есть канал 10 Гбит/с. Заказчик хочет, чтобы трафик резервного копирования занимал полосу не больше 200 Мбит/с, поскольку отдаёт приоритет операционным данным. Это возможно сделать.
Видел подобное решение на аппаратном уровне. Некоторые Ethernet-адаптеры приоритезируют трафик по типу, а также снижают латентность за счёт одновременной обработки пакетов. Планирует ли Veeam использовать аппаратные технологии ускорения?
Наверное, в целом это было бы правильно, но спектр аппаратных решений очень большой и может существенно удорожать стоимость решений для резервного копирования. Надо исследовать рынок и рассчитывать экономический эффект. Мы хотим иметь возможность предоставлять услуги заказчикам любого уровня, в том числе – малым компаниям, которые не могут себе позволить аппаратные решения.
Вы позиционируете WAN акселерацию как уникальную разработку?
Скорее, как реально значимую. Оптимизацией трафика в рамках своих продуктов занимаются многие. Мы тоже узкоспециализированы. Акселерация WAN с помощью технологий сжатия данных и кэширования сокращает только трафик резервных копий и не затрагивает другие сервисы.
В презентации вы упоминали технологию проверки SureBackup. В чём её концептуальное отличие от рутинного механизма валидации резервных копий?
В первую очередь – в том, что SureBackup работает в фоне и по расписанию. Это позволяет снизить влияние человеческого фактора. В частности, очень многие администраторы забывают или ленятся выполнять проверку резервных копий. У нас же это автоматический процесс. То есть, SureBackup сам всегда делает то, что и так обязан делать администратор. Причём, он не ограничивается простой проверкой контрольных сумм, которые лишь гарантируют целостность данных. SureBackup проверяет именно работоспособность сохранённого состояния виртуальной машины, разворачивая её в «песочнице». Во время этого процесса с помощью скриптов последовательно проверяется ход её загрузки и запуск сервисов, доступность оперативной памяти и других ресурсов, что в итоге гарантирует не только валидность копии, но и реальную возможность восстановления из неё машины в рабочем состоянии.
Что из себя представляет эта «песочница» и каковы её особенности?
Технически наша «песочница» – это виртуальная среда с маршрутизатором и файерволлом. Она запускается с полной эмуляцией сетевой инфраструктуры – с именами, IP-адресами, глобальными идентификаторами и так далее, но обратно в реальную сеть подключиться не может. Это безопасная изолированная среда для фоновой проверки работоспособности резервных копий виртуальных машин.
В продуктах резервного копирования вы используете только свои решения, или интегрируете в них и сторонние разработки тоже? Например, какие-нибудь библиотеки с открытым исходным кодом?
Набор технологий vPower, песочница, возможность старта виртуальной машины сразу из бэкапа – это всё наши запатентованные разработки. На сетевом уровне и в качестве программного маршрутизатора мы используем открытые решения на базе Linux.
Говоря о доступности данных, вы сравнивали диски и ленты. На мой взгляд, сейчас заказчики массово переходят на массивы SSD и RAM GRID. Особенно, если у них не столько большой объём данных, сколько высокая скорость их обновления. Учитываются ли эти технические особенности современной ИТ-инфраструктуры в продуктах Veeam и как?
SSD и RAM GRID действительно становятся популярнее, но только для операционных данных — продуктива, который актуален в данный момент. Держать на них вообще все данные – слишком дорого. Хранение бэкапов и архивных копий по-прежнему выполняется на дисках и лентах, как самых дешёвых носителях. Обычно на ленту отправляется то, что вряд ли потребуется срочно. Забирать же данные для бэкапа с SSD – вообще идеальный вариант. Наше ПО способно выполнять свои задачи независимо от типа носителя. Конечно, чем он будет быстрее и надёжнее – тем лучше.
Есть ли в продуктах Veeam возможность шифрования резервных копий?
Да, конечно есть. По алгоритму AES с длиной ключа 256 бит.
Её программная реализация выполнялась вашими программистами?
Непосредственно для шифрования используются библиотеки и другие средства операционной системы, а вот механизм генерирования ключей и их хранения реализован нами. Здесь очень много технических особенностей. Например, в базе Enterprise management хранится мастер-ключ, который можно использовать, если вы забыли пароль от резервной копии.
Видел в зале стенд Veeam Labs с надписью о возможности получить сертификат. Вы проводите внутрикорпоративное обучение, или привлекаете заинтересованных людей со стороны?
Совместно с нашими дистрибьюторами команда инженеров Veeam в России и странах СНГ сделала демонстрационные стенды. На них можно удалённо выполнить лабораторные работы для обучения партнёров и заказчиков. Эта инициатива направлена в основном на партнёров (как на проводников идей) и на обучение технических специалистов. Также на сайте может зарегистрироваться любой желающий и пройти онлайн-курсы. Эти курсы немного другие по структуре. В частности, там нет лабораторных работ. В целом наша команда очень много делает в сфере онлайн-тренингов и вебинаров.
В примерах историй успеха ваших заказчиков часто обсуждались особенности бэкапа и восстановления в гетерогенной среде – с использованием облаков как части инфраструктуры компании. При этом начальник отдела базовой ИТ-инфраструктуры Райффайзен банка Сергей Квашук сказал, что у них облачные сервисы запрещены как класс на уровне политики безопасности. Как вы считаете, какой подход более оправдан?
Говоря о роли облачных сервисов, надо сравнивать сколько стоят данные и их обслуживание в разных схемах. Какие-то некритичные в плане коммерческой тайны данные удобнее и дешевле хранить в облаках, а самые актуальные и ценные – держать поближе на собственных серверах под надёжной и контролируемой защитой. Поэтому одним из популярных трендов становятся гибридные облака, как раз позволяющие разделять данные по приоритету, хранить их более гибко и выгодно. Продукты Veeam поддерживают гибридные облака и, в частности, интеграцию с Microsoft Azure.
Каковы основные направления развития ваших решений с технической точки зрения?
В целом выбор направлений зависит от потребностей наших заказчиков. Например, появляются новые сервисы и их поддержку хотят видеть в наших продуктах. Во второй половине этого года мы планируем выпустить девятую версию Veeam Availability Suite. В ней как раз будет сделан акцент на интеграцию с гибридными массивами, оптимизацию работы с аппаратными снимками и много других важных изменений.