В рамках проекта Фонда перспективных исследований (ФПИ) продемонстрирована работа первого российского специализированного нейросетевого процессора для энергоэффективного выполнения алгоритмов машинного обучения, основанных на математическом аппарате глубоких нейронных сетей. Головным исполнителем проекта выступает лаборатория нейровычислительных систем МФТИ, в кооперацию соисполнителей входят ГосНИИАС и ИНУЭМ имени И. С. Брука. Поддержку проекта осуществляет Минобрнауки России.
Алгоритмы машинного обучения, основанные на глубоких нейронных сетях, сегодня широко используются для автоматического решения интеллектуальных задач в области распознавания изображений и человеческой речи, управления беспилотными автомобилями и многих других целей.
Такие алгоритмы требуют значительных вычислительных ресурсов, для их выполнения, как правило, используются графические ускорители. При этом энергопотребление графических ускорителей слишком велико для многих мобильных платформ — небольших беспилотных летательных аппаратов, компактных наземных робототехнических комплексов, «умных камер». Поэтому во всем мире сегодня активно развивается направление создания специализированных нейросетевых тензорных процессоров, которые, за счет использования специфических вычислительных свойств нейросетей, способны достигать гораздо более высокой энергоэффективности, чем графические ускорители.
Представленный МФТИ нейросетевой процессор NCore изготовлен на зарубежной фабрике по проектным нормам 65 нм, однако данная технология в настоящий момент уже проходит квалификацию на отечественном предприятии «Микрон» в Зеленограде. При этом по достигнутому уровню энергоэффективности NCore сравним с графическими ускорителями, производимыми по проектным нормам 28 нм и менее. По словам руководителя проектной группы ФПИ Алексея Заблоцкого, масштабирование разработанной архитектуры при разработке отечественных нейросетевых процессоров с «тонкими» проектными нормами позволит обеспечить научно-технический паритет в области разработки специализированных тензорных процессоров для алгоритмов машинного обучения.
Заведующий лабораторией нейровычислительных систем МФТИ Дмитрий Негров: «К настоящему моменту мы разработали основные элементы: процессорные ядра, интерфейсы и основное программное обеспечение. В частности, наше программное обеспечение для трансляции алгоритмов позволяет отконвертировать нейросеть для запуска ее на системе непосредственно из популярных фреймворков машинного обучения. Сейчас у нас есть прототип системы, изготовленный в кремнии по довольно грубой, по современным меркам, технологии — 65 нм. В дальнейшем мы планируем использовать наши ядра в качестве составных элементов систем на кристалле».
Важная часть проекта — создание автоматического транслятора алгоритмов машинного обучения, разработанных в популярных пакетах TensorFlow, Caffe, Keras. Такая унификация позволит пользователям работать в привычных для них средах.
Весной 2019 года запланировано проведение апробации разработанного нейросетевого процессора NCore при участии потенциальных потребителей. По результатам тестов планируется изготовить улучшенную версию процессора.
|