После критики по поводу ограниченных успехов во время недавнего всплеска спроса на AI компания AMD переходит к более прямой конкуренции с Nvidia на рынке ускорителей AI. Согласно подробному анализу SemiAnalysis, инициатива возглавляется генеральным директором Лизой Су и охватывает несколько областей, включая усовершенствования программного обеспечения, индивидуальное оборудование для центров обработки данных и агрессивные ценовые стратегии. Аналитик SemiAnalysis Дилан Патель описал сдвиг как «AMD 2.0» и назвал новую позицию компании переходом в «режим военного времени».
Изменения последовали за отчетом SemiAnalysis от декабря 2024 года , в котором программный стек AI AMD описывался как «изобилующий ошибками, которые делают обучение моделей AI практически невозможным без значительной отладки». Хотя на бумаге оборудование считалось конкурентоспособным, в отчете говорилось, что ROCm по-прежнему «очень сложен в работе».
Сообщается, что Лиза Су связалась с руководством инженеров SemiAnalysis и AMD в течение нескольких часов после публикации отчета. По данным фирмы, она признала наличие проблем и инициировала более масштабную внутреннюю перестройку. SemiAnalysis охарактеризовала результат как общекорпоративный переход в «режим военного времени».
Одним из главных приоритетов является укрепление программного стека ROCm от AMD. Компания инвестирует в улучшение удобства использования, стабильности и производительности. SemiAnalysis сообщает, что AMD фокусируется на лучшей интеграции Python и поддержке широко используемых фреймворков AI, таких как PyTorch. Дополнительные усилия включают обновление инструментов разработчика для использования в центрах обработки данных, при этом ведется работа над совместимостью с Docker, функциями мониторинга и поддержкой конфигураций с несколькими GPU.
В январе 2025 года AMD запустила специальную программу по связям с разработчиками под руководством Ануша Элангована, чтобы устранить давние пробелы в поддержке экосистемы. По данным SemiAnalysis, Элангован напрямую взаимодействует с разработчиками через онлайн-платформы и личные мероприятия.
AMD также готовит бесплатное облако для разработчиков, чтобы обеспечить более широкий доступ к своим графическим процессорам. Платформа призвана упростить внедрение и отражает элементы исследовательского облака TPU от Google, которое помогло стимулировать раннее вовлечение сообщества в TPU.
План развития оборудования AMD сосредоточен на серии MI450X, выход которой ожидается в конце 2026 года. Чипы предназначены для конкуренции с готовящейся к выпуску системой Nvidia VR200 NVL144. AMD планирует создать собственные стоечные системы с использованием 64 или 128 графических процессоров, подключенных через Infinity Fabric через Ethernet.
Подход к проектированию имеет сходство с системой Nvidia GB200 NVL72, но MI450X нацелена непосредственно на следующее поколение Nvidia. Для поддержки развертывания AMD приобрела ZT Systems в марте 2025 года. Ожидается, что сборщик систем предоставит ключевые возможности в архитектуре и производстве стоечного масштаба.
Из-за сохраняющихся пробелов в программном обеспечении ROCm AMD отчасти полагается на ценообразование, чтобы привлечь клиентов. MI300X в настоящее время позиционируется как более дешевая альтернатива, но ее привлекательность ограничена по сравнению с новыми предложениями Nvidia. Между тем, серия MI355X позиционируется ближе к платформам HGX с воздушным охлаждением от Nvidia, чем к ее высокопроизводительным стоечным системам.
SemiAnalysis определяет удержание и набор талантов как основные препятствия на пути к прогрессу AMD. Фирма отмечает, что «AMD до сих пор платила слишком мало, чтобы удерживать или привлекать лучших талантов», а структуры компенсаций больше соответствовали традиционным полупроводниковым фирмам, чем ведущим компаниям по производству оборудования для искусственного интеллекта.
В отчете AMD рекомендуется увеличить компенсацию на основе акций для улучшения долгосрочных стимулов. «Мы твердо убеждены, что если AMD существенно не увеличит оплату труда инженеров-программистов AI, AMD продолжит проигрывать Nvidia», — пишет SemiAnalysis.
Внутренняя инфраструктура также является ограничивающим фактором. Согласно отчету, AMD имеет доступ к «менее чем одной двадцатой от числа графических процессоров Nvidia». В отличие от Nvidia, которая управляет долгосрочными выделенными кластерами графических процессоров, разработка AMD в значительной степени опирается на краткосрочную арендуемую мощность. SemiAnalysis утверждает, что эта «близорукая ориентация на квартальные доходы ставит под угрозу ее способность к долгосрочной конкурентоспособности».
Источник
Источник новости: habr.com