Компания Cycle Computing, предоставляющая технические решения для высокопроизводительных вычислений, установила новый рекорд. Пиковая мощность объединённого кластера на базе восьми географически удалённых дата-центров Amazon под управлением CycleServer в течение восемнадцати часов превышала 1,21 Пфлопс, а на каждую виртуальную машину приходилось в среднем по 9,3 процессорного ядра.
Казалось бы, по производительности такой кластер мог бы соперничать с японским суперкомпьютером Helios, занимающим сегодня двадцатую строчку рейтинга Топ-500. Однако исполнительный директор Cycle Computing Джейсон Стоув (Jason Stowe) поясняет, что пока речь идёт о преодолении петафлопсного барьера только в рамках теоретической общей производительности всех ЦОДов Amazon.
Чтобы продемонстрировать свыше квадриллиона операций в секунду на специализированных тестовых программах вроде Linpack, требуется большая скорость передачи данных и физически близкие друг к другу вычислительные узлы.
Впрочем, назначение кластера состоит не в предоставлении всей доступной мощности для одной задачи, а в одновременном обеспечении высокой производительности тысяч отдельных виртуальных машин, между которыми не требуется наличия скоростных соединений:
«Это другая категория проблем из параллельного направления высокопроизводительных вычислений. Вероятно, [для оценки кластеров] следует создать свои тесты, имитирующие решение задач из области Big Data — генетики, бизнес-аналитики и других сфер».
По классической методике оценки основной кластер Amazon EC2 занимает «всего лишь» 127-е место в последней редакции списка пятисот самых быстрых суперкомпьютеров мира. Он состоит из 2 128 восьмиядерных процессоров Xeon и демонстрирует в Linpack 240 Тфлопс.
Даже с таким результатом для большинства компаний и научных учреждений сервисы облачных вычислений, подобные Amazon Elastic Compute Cloud, сегодня выглядят привлекательнее, чем использование суперкомпьютера любой классической архитектуры.
Получить возможность загрузить одну из таких машин своими вычислительными задачами крайне сложно. Надо обосновать их важность и дождаться своей очереди (в среднем около шести месяцев). Затем требуется переписать свой код вместе с программистами обслуживающего суперкомпьютер института и полностью оплатить все рабочие дни, независимо от реального объёма вычислений. Облачные платформы доступны сразу, легко масштабируются и обходятся значительно дешевле.
Профессор химии Марк Томпсон (Mark Thompson) комментирует изданию ArsTechnica свои научные потребности в высокопроизводительных вычислениях (его исследовательская группа разрабатывает новые покрытия для солнечных батарей, чтобы сделать альтернативную энергетику более эффективной):
«Для каждого из возможных веществ только этапы синтеза, очистки и первичного анализа свойств потребовали бы около года работы аспирантов. Затраты на оборудование и реактивы исчислялись бы сотнями тысяч долларов».
Компьютерное моделирование свойств молекул различных соединений сокращает время и сумму расходов на порядки, отсеивая менее подходящие вещества на раннем этапе без необходимости физической работы с ними.
Группа Томпсона использовала программный пакет Schrödinger и платформу облачных вычислений. Определение свойств двухсот пятидесяти тысяч потенциальных кандидатов на роль нового покрытия солнечных панелей заняло неделю и обошлось в $33 тыс. Эта же работа потребовала бы 2,3 млн часов при традиционном подходе — то есть была бы попросту невозможна.