Почта для заявок: info@linkas.ru
NVIDIA A30 Tensor Core GPU – новый универсальный серверный вычислительный графический ускоритель, используемый для повышения производительности программных систем генерирующих различные типы вычислительных нагрузок. Карта была выпущена 12 апреля 2021 года. Её основные области применения — это использование алгоритмов ИИ в продуктивном режиме (inference) при обеспечении возможности обучения моделей (ML), сложный анализ данных и высокопроизводительные научные вычисления. Оснащенный технологией Tensor Core с архитектурой NVIDIA Ampere, он поддерживает широкий спектр математических вычислений, предоставляя единое устройство для ускорения различных видов рабочих нагрузок.
Графический ускоритель NVIDIA A30 в первую очередь был создан для обеспечения работы систем ИИ в продуктивном режиме, но он прекрасно справляется с задачами тренировки алгоритмов глубокого обучения с помощью тензорных ядер с поддержкой Tensor Float (TF32). Благодаря тензорным ядрам для вычислений с двойной точностью FP64 в сочетании с пропускной способностью памяти 933 Гб/с графический ускоритель отлично справляется с задачами высокопроизводительных научных вычислений (HPC).
Nvidia A30 поддерживает фреймворки OpenCL и CUDA.
Благодаря технологии структурной разреженности NVIDIA A30 может значительно повысить производительность алгоритмов искусственного интеллекта в продуктивном режиме (логический вывод) и машинном обучении (ML), используя экономию данных в задачах искусственного интеллекта. Поддержка технологии разреженности позволяет использовать специально структурированное распределение матричных данных в нейронных сетях для удвоения пропускной способности. Подобный функционал используется для удаления менее значимых весов сети без значительного снижения общей точности вывода.
Графический ускоритель Nvidia A30 использует технологию многоэкземплярного графического процессора (MIG) для обеспечения беспрепятственного использования инфраструктуры с ускорением графического процессора. Технология MIG позволяет разделить графический ускоритель на четыре отдельных раздела, которые могут использоваться различными приложениями.
Для получения подробной технической информации о том, как реализовать этот функционал в Вашем бизнесе, Вы можете обратиться к нашим специалистам по адресу электронной почты, указанной в разделе "Контакты". Наши инженеры обладают всеми ресурсами и знаниями для оказания помощи клиентам.
Технология MIG основана на виртуализации серверов и контейнеров (Kubernetes). MIG предоставляет возможность программному продукту необходимую вычислительную мощность с гарантированным качеством обслуживания (QoS), что увеличивает загрузку процессора, предоставляя большему количеству пользователей доступ к ресурсам для ускоренных вычислений.
С помощью высокопроизводительного интерфейса NVIDIA® NVLink® можно объединить две карты A30 для повышения производительности системы практически в два раза.
Карта не имеет графических выводов. Занимает два лота PCI. Имеет интерфейс PCIe 4.0 x16. Форм-фактор – FHFL (полная высота, полная длина). Охлаждение пассивное, поэтому карта должна использоваться в специализированных серверных корпусах, оснащенных вентиляторами, продувающими крыльчатку акселератора. Карта потребляет 165 Вт.Артикул производителя NVIDIA | 900-21001-0040-000 |
Артикул поставщика PNY | TCSA30M-PB |
Артикул поставщика SuperMicro | GPU-NVTA30 |
Артикул поставщика HPE | R7G39C |
Артикул поставщика Dell | 490-BGUT, |
Артикул поставщика Lenovo | 4X67A76581 |
Область применения | Работа ИИ приложений в продуктивном режиме, Машинное обучение, Высокопроизводительные научные вычисления и Корпоративные вычисления со смешанными типами нагрузок |
Специализация | Серверные корпоративные приложения |
Архитектура | Nvidia Ampere |
Процессор | GA 100 |
Количество потоковых(CUDA) процессоров (shading units) | 3584 |
Количество блоков текстурирования (TMU) | 224 |
Количество блоков растеризации (ROP) | 96 |
Количество тензорных ядер | 224 |
Потоковые мультипроцессоры (SM count) | 84 |
Ядра аппаратной трассировки лучей (RT) | |
Размер памяти, Гб | 24 |
Тип памяти | HBM2 |
ECC | Да (возможно отключить програмно) |
Пропускная способность памяти, Гбит/c | 933 |
Производительность | |
FP64, TFLOPS | 5,2 |
Тензорные ядра для FP64, TFLOPS | 10,3 |
FP32, TFLOPS | 10,3 |
Тензорные ядра для FP32, TFLOPS | 82 |
Тензорные ядра для FP32 при использовании h structural sparsity, TFLOPS | 165 |
Тензорные ядра для BFLOAT16, TFLOPS | 165 |
Тензорные ядра для BFLOAT16 при использовании h structural sparsity, TFLOPS | 330 |
Тензорные ядра для FP16, TFLOPS | 165 |
Тензорные ядра для FP16 при использовании h structural sparsity, TFLOPS | 330 |
Тензорные ядра для INT8, TOPS | 330 |
Тензорные ядра для INT8 при использовании h structural sparsity, TOPS | 661 |
Тензорные ядра для INT4, TOPS | 661 |
Тензорные ядра для INT4 при использовании h structural sparsity, TOPS | 1321 |
RT ядра, TFLOPS | |
Поддержка NVIDIA NVLink™ | Да/объединяются две карты |
Multi-Instance GPU (MIG) | Да/До 4-х инстансов |
Аппаратные декодеры | |
NEBS Ready | |
Поддержка CUDA Toolkit | Да |
Поддержка OpenCL | Да |
Поддержка DirectX | Нет |
Поддержка OpenGL | Нет |
Поддержка Vulkan | Нет |
Поддержка виртуализации | NVIDIA AI Enterprise для Vmware/NVIDIA Virtual Compute Server |
Тип PCI | PCIe Gen 4, x16 |
Форм-фактор | Карта полной высоты/полной длинны, двойной ширины (FHFL) |
Максимальная потребляемая мощность, Вт | 165 |
Разъем питания | 8-pin CPU |
Охлаждение | Пассивное |
Внешние порты | Нет |