категории | RSS

Intel представила ускорители вычислений Data Center GPU Max, которые оказались быстрее NVIDIA A100 в несколько раз

Компания Intel представила ускорители для вычислений на графических процессорах Data Center GPU Max. Новинки вошли в линейку продуктов серии Intel Max, в которую вошли также входят процессоры Xeon Max — серверные процессоры Xeon Sapphire Rapids с предустановленной памятью HBM2e, про которые мы уже рассказывали.

Графические процессоры Intel Data Center GPU Max объединяют на одной подложке 100 млн транзисторов в составе 47 чиплетов, сделанных с применением разных техпроцессов — Intel 7, TSMC N7 и TSMC N5. Чиплеты объединяются между собой интерфейсами EMIB и технологией упаковки Foveros.

Ускоритель Intel Data Center GPU Max содержит в себе 128 ядер Xe и 128 RT-ядер, а также до 64 Мбайт кеш-памяти L1 и до 408 Мбайт кеш-памяти L2. Таким образом, мы имеем дело с единственными на сегодняшний день ускорителями с аппаратной поддержкой трассировки лучей.

Производитель заверил, что серверные ускорители вычислений Intel Data Center GPU Max будут доступны в самых разных форм-факторах, предназначенных для разных задач. Например, Intel готовит продукты в виде карт-расширения PCI Express серии Max 1100, снабжённые 48 Гбайт памяти HBM2e, 56 ядрами Xe и теплопакетом 300 Вт. Можно будет объединить до четырёх таких карт с помощью специальных перемычек Intel Xe Link в единый кластер.

А вот ускорители Max 1350 представлены в виде OAM-модулей с теплопакетом 450 Вт. Их снабдят 112 ядрами Xe и 96 Гбайт памяти HBM2e.

Новая архитектура Xe-HPC анонсированных ускорителей вычислений позволяет объединить до восьми модулей OAM. В рамках анонса были представлены следующие конфигурации: один OAM-модуль: 128 Гбайт HBM2e, 128 ядер Xe, TDP 600 Вт, производительность 52 Тфлопс, пропускная способность памяти 3,2 Тбайт/с; два OAM-модуля: 256 Гбайт HBM2e, 256 ядер Xe, TDP 1200 Вт, производительность 104 Тфлопс, пропускная способность памяти 6,4 Тбайт/с; четыре OAM-модуля: 512 Гбайт HBM2e, 512 ядер Xe, TDP 2400 Вт, производительность 208 Тфлопс, пропускная способность памяти 12,8 Тбайт/с.

И вот здесь мы подходим к самому важному — сравнению производительности. Intel уверяет, что один такой OAM-модуль до двух раз быстрее одного ускорителя вычислений NVIDIA A100 в задачах ExaSMR OpenMC и MiniBUDE. Задачи ExaSMR NekRS у представленного Data Center GPU Max получается выполнять в 1,5 раза выше конкурента, в Riskfuel производительность выше в 2,4 раза.



Источник новости: overclockers.ru

DimonVideo
2022-11-12T17:32:02Z

Здесь находятся
всего 0. За сутки здесь было 0 человек
Яндекс.Метрика