Почта для заявок: info@linkas.ru
NVIDIA A100 40Гб Tensor Core GPU – это флагманский серверный графический ускоритель компании Nvidia, созданный на основе новой архитектуры Nvidia Ampere, которая использует тензорные ядра нового поколения. В первую очередь ускоритель предназначен для акселерации задач, связанных с глубоким машинным обучением, работы обученных моделей глубокого машинного обучения (DL) в продуктивном режиме (инференс), высокопроизводительных научных вычислений (HPC) и виртуализированных корпоративных нагрузок широкого спектра. Акселератор обеспечивает повышение производительности инференса ИИ до 245 раз по сравнению с вычислениями, производимыми на серверном процессоре. При анализе данных рост производительности по сравнению с процессорными вычислениями оценивается в 44 раза. Подобный рост производительности фиксируется и для других типов нагрузки. Карта выпущена 22 июня 2020 года.
Компания Линкас успешно прошла все необходимые сертификационные тесты для продажи данного продукта и оказания технической поддержки. Обращаясь к нам, Вы можете получить высококвалифицированную помощь и задать интересующие Вас вопросы - в том числе, о грамотном применении ускорителей NVIDIA в рамках Вашего бизнеса.
Карта оснащена 6912 потоковыми (CUDA) процессорами и 432 тензорными ядрами. Объем память 40 Гб при рекордной пропускной способности памяти 1555 Гбит/сек.
Nvidia A100 поддерживает фреймворки OpenCL и CUDA.
Благодаря технологии, именуемой как "Structural sparsity", NVIDIA A100 может значительно повысить производительность алгоритмов искусственного интеллекта в производственном режиме (логический вывод) и машинном обучении (ML), используя экономию данных в задачах искусственного интеллекта. Поддержка технологии разреженности позволяет использовать специально структурированное распределение матричных данных в нейронных сетях для удвоения пропускной способности. Это специальный метод для удаления менее значимых весов сети без значительного снижения общей точности вывода.
Графический ускоритель Nvidia A100 производится в двух вариантах форм-факторов. Первый традиционный на основе шины PCEe V4.0 для стандартных серверов, второй в формате “SMX” для серверов собственной архитектуры NVIDIA HGX. Используя подобные сервера возможна, одновременная работа 16-и графических процессоров. Процессоры могут быть объедены в единое вычислительное пространство на основе технологии NVIDIA NVSwitch. HPE, Lenovo, NVIDIA и другие вендоры выпускают специализированные сервера соответствующие архитектуре NVIDIA HGX. На базе этих специализированных платформ используя технологии NVIDIA® NVLink®, NVIDIA NVSwitch™, NVIDIA® Mellanox® InfiniBand® и NVIDIA Magnum IO™ SDK NVIDIA Magnum IO™ производительность ускорителя A100 можно масштабировать в тысячи раз.
Графический ускоритель Nvidia A100 использующий технологию Multi-Instance GPU (MIG) обеспечивает удобную утилизацию инфраструктуры с ускорением на GPU. Технология MIG позволяет разделить графический ускоритель на семь отдельных разделов, которые смогут использовать различные приложения.
Технология MIG основана на виртуализации серверов и контейнеров (Kubernetes). MIG предоставляет возможность обеспечить программному продукту необходимую вычислительную мощность с гарантированным качеством обслуживания (QoS), что увеличивает загрузку процессора. Благодаря этому большее количество пользователей имеет доступ к ускоренным вычислениям.
С помощью высокопроизводительного интерфейса NVIDIA® NVLink® можно объединить две карты A100 для повышения производительности системы практически в два раза.
Оптимальное решение для обновления систем на базе V100/V100S с тензорными ядрами.
Карта не имеет графических выводов. Занимает два лота PCI. Имеет интерфейс PCIe 4.0 x16. Форм-фактор – FHFL (полная высота, полная длина). Охлаждение пассивное, поэтому карта должна использоваться в специализированных серверных корпусах, оснащенных вентиляторами, продувающими крыльчатку акселератора. Карта потребляет 300 Вт.Артикул производителя NVIDIA | 900-21001-0000-000 |
Артикул поставщика PNY | TCSA100M-PB |
Артикул поставщика SuperMicro | GPU-NVTA100-40 |
Артикул поставщика HPE | R6B53A, R6B53C |
Артикул поставщика Dell | 490-BGFV, V73TR |
Артикул поставщика Lenovo | 4X67A13135 |
Область применения | Глубокое машинное обучение.Работа ИИ приложений в продуктивном режиме, Машинное обучение, Виртуализированные вычислительные задачи, включая ИИ, HPC и обработку данных. Вычисления со смешанными типами нагрузок. Оптимальное решение для обновления систем на базе V100/V100S с тензорными ядрами. |
Специализация | Серверные приложения требующие высокой производительности |
Архитектура | Nvidia Ampere |
Процессор | GA 100 |
Количество потоковых(CUDA) процессоров (shading units) | 6912 |
Количество блоков текстурирования (TMU) | 432 |
Количество блоков растеризации (ROP) | 160 |
Количество тензорных ядер | 432 |
Потоковые мультипроцессоры (SM count) | 108 |
Ядра аппаратной трассировки лучей (RT) | |
Размер памяти, Гб | 40 |
Тип памяти | HBM2e |
ECC | Да |
Пропускная способность памяти, Гбит/c | 1555 |
Производительность | |
FP64, TFLOPS | 9,7 |
Тензорные ядра для FP64, TFLOPS | 19,5 |
FP32, TFLOPS | 19,5 |
Тензорные ядра для FP32, TFLOPS | 156 |
Тензорные ядра для FP32 при использовании h structural sparsity, TFLOPS | 312 |
Тензорные ядра для BFLOAT16, TFLOPS | 312 |
Тензорные ядра для BFLOAT16 при использовании h structural sparsity, TFLOPS | 624 |
Тензорные ядра для FP16, TFLOPS | 312 |
Тензорные ядра для FP16 при использовании h structural sparsity, TFLOPS | 624 |
Тензорные ядра для INT8, TOPS | 624 |
Тензорные ядра для INT8 при использовании h structural sparsity, TOPS | 1248 |
Тензорные ядра для INT4, TOPS | 1249 |
Тензорные ядра для INT4 при использовании h structural sparsity, TOPS | 2496 |
RT ядра, TFLOPS | |
Поддержка NVIDIA NVLink™ | Да/объединяются две карты |
Multi-Instance GPU (MIG) | Да/До 7-и инстансов |
Аппаратные декодеры | |
NEBS Ready | |
Поддержка CUDA Toolkit | Да |
Поддержка OpenCL | Да |
Поддержка DirectX | Нет |
Поддержка OpenGL | Нет |
Поддержка Vulkan | Нет |
Поддержка виртуализации | NVIDIA AI Enterprise для Vmware/NVIDIA Virtual Compute Server |
Тип PCI | PCIe Gen 4, x16 |
Форм-фактор | Карта полной высоты/полной длинны, двойной ширины (FHFL) |
Максимальная потребляемая мощность, Вт | 300 |
Разъем питания | 8-pin CPU |
Охлаждение | Пассивное |
Внешние порты | нет |