На проходящей в Сан-Хосе ежегодной конференции Nvidia GTC 2015 компания представила DevBox – миниатюрный суперкомпьютер ориентировочной стоимостью $15000. Соучредитель и президент Nvidia Джен-Сан Хуанг пояснил, что это самое мощное на сегодня решение для системы глубокого машинного обучения (DIGITS – Deep Learning GPU Training System) в форм-факторе настольного компьютера.
Внутри DIGITS DevBox в конфигурации Quad-GPU SLI (x8/x8/x16/x8) работают четыре новейших видеокарты топового сегмента – GeForce GTX Titan X, официально представленные вчера. Они установлены в слоты PCI-Express v.3.0 материнской платы серии Asus X99, поддерживающей процессоры Intel Core i7 (Socket 2011-v3).
Оперативная память стандарта DDR4 объёмом до 64 ГБ работает в четырёхканальном режиме. В зависимости от типа решаемых задач, DIGITS DevBox предлагается в разных вариантах – с дисковым массивом RAID 5 в конфигурации 3 x 3 ТБ или с твердотельными накопителями. Только для видеокарт требуется киловатт мощности, поэтому в DevBox устанавливается блок питания стандарта ATX мощностью 1500 Вт. По габаритам корпус DevBox сравним с парой системных блоков ATX MidiTower.
Работает этот мини-суперкомпьютер под управлением Ubuntu 14.04. Он поставляется с предварительно установленным пакетом специализированных программ и фреймворков для самостоятельной разработки нейронных сетей: Caffe, Torch, Theano, BIDMach, cuDNN v2 и CUDA 7.0.
Поскольку нейронные сети отлично масштабируются, от DevBox можно ожидать четырёхкратного прироста в скорости по сравнению с рабочими станциями с одной видеокартой GeForce GTX Titan X (выступающей в роли ускорителя неграфических вычислений при помощи 3072 ядер CUDA и 12 ГБ видеопамяти).
«Обучение AlexNet при помощи DevBox может быть завершено всего за 13 часов, – пояснил Джен-Сан Хуанг. – Лучшему ПК с GeForce GTX Titan X на это потребуется более двух дней, либо целый месяц, если полагаться только на процессорные ядра».
Теоретическая производительность DevBox в неграфических вычислениях (GP-GPU) составляет 28 ТФлопс при операциях одинарной точности с плавающей запятой (FP32). При вычислениях с двойной точностью (FP64) она падает в 32 раза – до 0,875 ТФлопс. Уменьшить данный разрыв планируется в новой архитектуре Pascal, дебют которой запланирован в Nvidia на май этого года.
Готовые образы сборок системы глубокого машинного обучения и всё сопутствующее программное обеспечение доступно бесплатно на сайте Nvidia. Для самостоятельного развёртывания DIGITS из открытых исходников посетите GitHub.
Продажи Digits DevBox начнутся в мае этого года на территории США. Зарегистрированные пользователи смогут приобрести мини-суперкомпьютер по цене от $15000 через два месяца после подачи заявки.
Вычисления — это драйв!
Другим интересным анонсом стала платформа Drive PX, созданная компанией с целью совместной разработки системы автопилота для различных типов автомобилей и других транспортных средств. Её основой стали два чипа Nvidia Tegra X1, выполненные по технологическим нормам 20 нм. Каждый из этих гибридных процессоров содержит восьмиядерный (4 x ARM A57 + 4 x ARM A53) 64-разрядный ЦП и 256 ядер ГП архитектуры Maxwell.
Drive PX также использует алгоритмы глубокого машинного обучения для повышения безопасности компьютерной системы расширенной помощи водителю – ADAS (Advanced Driver Assistance Systems).Предполагается, что работающая на базе нейронных сетей ADAS будет самостоятельно и непрерывно обучаться, запоминая правильные и неправильные реакции на различные ситуации, одновременно анализируя и сопоставляя миллионы изображений. Вместо выбора из ограниченного числа предопределённых вариантов, интеллектуальные транспортные средства научатся вырабатывать уникальный способ поведения в конкретной ситуации.
«Вождение не сводится к задаче распознавания, это использование усвоенных уроков поведения. Трудно предусмотреть их все и невозможно запрограммировать неограниченное число вариантов в системах автопилота», – сказал Джен-Сан Хуанг в своём выступлении.
Во время первого теста Drive PX пыталась в буквальном смысле убиться об стену вместе с автомобилем. Проанализировав первые 52 тысячи изображений, система сама научилась избегать крупных преград. Полностью учитывать все препятствия Drive PX смогла после анализа 225 тысячи фотографий.
Машинное зрение Drive PX существенно отличается от человеческого: 12 камер расположены так, чтобы давать полную панораму происходящего вокруг. У них нет «слепых зон», а обработка изображения требует 630 миллионов операций в секунду. Комплект Drive PX для разработчиков будет доступен в мае по цене от $10000.