Почта для заявок: info@linkas.ru
NVIDIA A40 Tensor Core GPU – новый серверный графический ускоритель, созданный на базе архитектуры NVIDIA Ampere и предназначенный для работы с 3D и 2D графикой в приложениях, требующих наивысшей производительности. Ускоритель поддерживает широкий спектр технологий виртуализации, обеспечивающих возможности использования его ресурсов большому количеству пользователей. NVIDIA A40 поддерживается: NVIDIA RTX vWS, NVIDIA Virtual PC (vPC), NVIDIA Virtual Apps (vApps), vCS, NVIDIA Virtual GPU (vGPU). Данное устройство было произведено 5 октября 2020 года.
Наличие 10752 потоковых процессоров (CUDA), которые позволяют выполнять операции с плавающей запятой одиночной точности (FP32), и повышенная энергоэффективность ускорителя обеспечивают высокоскоростную графику и видеоданные. Это гарантирует высокий уровень комфорта и эффективности при работе со сложными 3D-моделями в программах автоматизированного проектирования (CAD - CAD / CAM / CAE).
Сегодня многие системы работы с графикой используют алгоритмы ИИ для операций сглаживания (NVIDIA DLSS сглаживание с алгоритмами глубокого обучения), шумоподавления, редактирования фотографий и пр. Для поддержки таких операций ускоритель имеет 336 тензорных ядер третьего поколения, которые работают по технологии Tensor Float 32 (TF32), что делает обучение модели ИИ и обработку данных в пять раз быстрее, чем в предыдущем поколении, и не требует изменения кода. А благодаря технологии structural sparsity — NVIDIA A40 может значительно увеличить производительность при работе алгоритмов ИИ в продуктивном режиме(inference) и машинном обучении (ML), используя разреженность данных в задачах ИИ. Поддержка технологии разреженности позволяет использовать специально структурированное распределение матричных данных в нейронных сетях для удвоения пропускной способности. Это специальный метод для удаления менее значимых весов сети без значительного снижения общей точности вывода.
Выбирая в качестве партнера компанию Линкас, заказчикам обеспечивается не только поддержка от квалифицированных технических специалистов, но и возможность получить ответы на часто задаваемые вопросы непосредственно от вендора.
Аппаратные ядра с трассировкой лучей (RT – Ray Tracing) 84 второго поколения обеспечивают трассировку лучей и затенение или уменьшение шума для значительного ускорения таких задач, как фотореалистичный рендеринг отснятого материала, оценка архитектуры и виртуальное прототипирование продуктов. Эта технология также ускоряет воспроизведение движения, поэтому вы можете быстрее создавать более точные изображения.
Благодаря 48 ГБ высокоскоростной памяти GDDR6 с пропускной способностью 696 ГБ / с, масштабируемой до 96 ГБ с помощью NVLink, ученые, инженеры и специалисты по обработке данных имеют память, необходимую для работы с большими наборами данных и такими задачами, как вычисления и моделирование.
Ускоритель поддерживает следующие фреймворки: DirectX 12 Ultimate, OpenGL 4.6, OpenCL 3.0, Vulkan 1.2, CUDA 8,6.
Ускоритель оснащен NVENC - аппаратным многопоточным кодировщиком (энкодер) видео в формате Full HD и выше, работающим в реальном времени и NVDEC — аппаратным декодером, который обеспечивает ускоренное аппаратное декодирование видео.
С помощью высокопроизводительного интерфейса NVIDIA® NVLink® можно объединить две карты A40 для повышения производительности системы практически в два раза.
Оптимальное решение для обновления систем на базе Quadro RTX™ 8000 и RTX 6000.
Карта имеет три DisplayPort. По умолчанию они отключены. Занимает два лота PCI. Имеет интерфейс PCIe 4.0 x16. Форм-фактор – FHFL (полная высота, полная длина). Охлаждение пассивное, поэтому карта должна использоваться в специализированных серверных корпусах, оснащенных вентиляторами, продувающими крыльчатку акселератора. Карта потребляет 300 Вт.
Артикул производителя NVIDIA | 900-2G133-0000-000 |
Артикул поставщика PNY | TCSA40M-PB |
Артикул поставщика SuperMicro | GPU-NVTA40 |
Артикул поставщика HPE | R7E31A, R7E31C |
Артикул поставщика Dell | 490-BGKE, V82R7 |
Артикул поставщика Lenovo | 4X67A72593 |
Область применения | Обработка 3D графики на корпоративном уровне, рендерные фермы, обработка видео поддержка графики виртуальных рабочих станций. |
Специализация | Серверные графические приложения требующие наивысшей производительности |
Архитектура | Nvidia Ampere |
Процессор | GA102 |
Количество потоковых(CUDA) процессоров (shading units) | 10752 |
Количество блоков текстурирования (TMU) | 336 |
Количество блоков растеризации (ROP) | 112 |
Количество тензорных ядер | 336 |
Потоковые мультипроцессоры (SM count) | 84 |
Ядра аппаратной трассировки лучей (RT) | 84 |
Размер памяти, Гб | 48 |
Тип памяти | GDDR6 |
ECC | Да |
Пропускная способность памяти, Гбит/c | 696 |
Производительность | |
FP64, TFLOPS | |
Тензорные ядра для FP64, TFLOPS | |
FP32, TFLOPS | 37,4 |
Тензорные ядра для FP32, TFLOPS | 74,8 |
Тензорные ядра для FP32 при использовании h structural sparsity, TFLOPS | 149,6 |
Тензорные ядра для BFLOAT16, TFLOPS | 149,7 |
Тензорные ядра для BFLOAT16 при использовании h structural sparsity, TFLOPS | 299,4 |
Тензорные ядра для FP16, TFLOPS | 149,7 |
Тензорные ядра для FP16 при использовании h structural sparsity, TFLOPS | 299,4 |
Тензорные ядра для INT8, TOPS | 299,3 |
Тензорные ядра для INT8 при использовании h structural sparsity, TOPS | 598,6 |
Тензорные ядра для INT4, TOPS | 598,7 |
Тензорные ядра для INT4 при использовании h structural sparsity, TOPS | 1197,4 |
RT ядра, TFLOPS | 73,1 |
Поддержка NVIDIA NVLink™ | Да/объединяются две карты |
Multi-Instance GPU (MIG) | Нет |
Аппаратные декодеры | NVENC (x1), NVDEC (x2) (включает декодирование AV1) |
NEBS Ready | Level 3 |
Поддержка CUDA Toolkit | Да |
Поддержка OpenCL | Да |
Поддержка DirectX | Да |
Поддержка OpenGL | Да |
Поддержка Vulkan | Да |
Поддержка виртуализации |
NVIDIA vPC/vApps, NVIDIA RTX Virtual Workstation, NVIDIA Virtual Compute Server |
Тип PCI | PCIe Gen 4, x16 |
Форм-фактор | Карта полной высоты/полной длинны, двойной ширины (FHFL) |
Максимальная потребляемая мощность, Вт | 300 |
Разъем питания | 8-pin CPU |
Охлаждение | Пассивное |
Внешние порты | 3x DisplayPort 1.4; Поддержка NVIDIA Mosaic и Quadro® Sync4 |