NVIDIA представила новую высокопроизводительную графическую платформу – Volta

10:31, 11 мая. Автор:

На проходящей сейчас в Сан-Хосе ежегодной конференции NVIDIA по GPU-технологиям, американская компания представила свою новую графическую платформу Volta, которую она позиционирует в качестве самой мощной в мире архитектуры GPU, призванной стать катализатором новой волны достижений в области искусственного интеллекта и высокопроизводительных вычислений. Первый процессор на базе Volta – это GPU для дата-центров Tesla V100, который обеспечивает сверхвысокую скорость и масштабируемость обучения и инференса глубоких нейронных сетей, а также ускоряет высокопроизводительные и графические вычисления.

NVIDIA-Telsa-V100

В основе Volta, седьмого поколения графических архитектур NVIDIA, находится 21 миллиард транзисторов, обеспечивающих производительность задачах в глубокого обучения, эквивалентную 100 CPU. Пиковая производительность Volta в 5 раз выше архитектуры Pascal – текущей графической архитектуры NVIDIA, и в 15 раз выше Maxwell, представленной два года назад.

Благодаря объединению ядер CUDA и нового ядра Volta Tensor в унифицированной архитектуре, один сервер на базе GPU Tesla V100 сможет заменить сотни центральных процессоров в высокопроизводительных вычислениях.

Ключевые технологии GPU Tesla V100:

  • Специализированные ядра Tensor, созданные для ускорения работы искусственного интеллекта. Оснащенный 640 ядрами Tensor, процессор V100 обеспечивает производительность 120 терафлопс в глубоком обучении, что эквивалентно производительности 100 CPU.
  • Новая архитектура GPU с более чем 21 миллиард транзисторов. Она объединяет ядра CUDA и Tensor в рамках унифицированной архитектуры, обеспечивая производительность суперкомпьютера для ИИ в одном GPU.
  • NVLink поднимает на новый уровень высокоскоростной интерфейс между графическими процессорами и между графическим и центральным процессорами, вдвое увеличивая пропускную способность по сравнению с предыдущим поколением NVLink.
  • Память 900 ГБ/с HBM2 DRAM, разработанная совместно с Samsung, увеличивает полосу пропускания на 50% по сравнению с предыдущим поколением.
  • Оптимизированное под Volta программное обеспечение, включая CUDA, cuDNN и TensorRT, которое ведущие фреймворки и приложения для ускорения ИИ и исследований могут взять на вооружение.