категории | RSS

Глава NVIDIA Дженсен Хуанг выступил на CES 2026 с презентацией, сосредоточенной на технологиях искусственного интеллекта для автономного вождения и новой архитектуре Rubin, призванной решить проблему дефицита памяти в индустрии ИИ. Хотя анонсов потребительских видеокарт не последовало, компания раскрыла детали платформы, которая может изменить подход к обучению и инференсу ИИ-моделей.

NVIDIA анонсировала Alpamayo – семейство открытых моделей с рассуждением, предназначенных для управления автономными транспортными средствами в сложных ситуациях. Центральный элемент релиза – Alpamayo 1, система цепочки рассуждений с 10 миллиардами параметров, способная подходить к вождению подобно человеку. Модель разбивает неожиданные дорожные ситуации на меньший набор проблем, находя наиболее безопасный путь вперед, при этом объясняя свои рассуждения на каждом шаге.

Еще одна модель AlpaSim позволяет разработчикам проводить обучение в закрытом цикле для редко встречающихся в реальной жизни сценариев вождения. Хуанг заявил, что Mercedes Benz CLA 2025 года станет первым автомобилем с полным AV-стеком NVIDIA, включая Alpamayo.

Наше видение – однажды каждая машина, каждый грузовик будут автономными.

После анонсов Alpamayo к Хуангу на сцену присоединились два дроида BD-1 из Star Wars Jedi: Fallen Order. Один из них уже появлялся на CES в прошлом году, демонстрируя партнерство NVIDIA с индустрией развлечений и робототехники.

Основное внимание презентации было уделено платформе Rubin. NVIDIA впервые анонсировала GPU-архитектуру в 2024 году, а теперь компания начала производство суперкомпьютера на базе новой технологии. Один CPU Vera содержит 88 кастомных ядер Olympus и 1,5 ТБ системной памяти – в общей сложности 227 миллиардов транзисторов. GPU Rubin насчитывает 336 миллиардов транзисторов. Каждый суперкомпьютер Vera Rubin включает пару обоих компонентов.

Платформа Rubin состоит из шести чипов, объединенных в один ИИ-суперкомпьютер, который эффективнее моделей Blackwell и обеспечивает увеличение вычислительной мощности и пропускной способности памяти.

Rubin прибывает в идеальный момент, когда спрос на ИИ-вычисления для обучения и инференса взлетает до небес.

Продукты на базе Rubin будут доступны от партнеров NVIDIA во второй половине 2026 года. Среди компаний, планирующих внедрение платформы – все крупные ИИ-компании, которые потратят десятки миллиардов долларов на новое железо для поддержания кругооборота денег в секторе.

Глава Anthropic отметил:

Прирост эффективности в платформе NVIDIA Rubin представляет тот тип инфраструктурного прогресса, который обеспечивает более продолжительную память, лучшие рассуждения и надежные результаты.

GPU превратились в дорогой и дефицитный товар, так как стремительно масштабирующиеся проекты дата-центров истощают мировые запасы чипов памяти. По данным Tom's Hardware, гигантские проекты дата-центров потребляют около 40% мирового производства DRAM. Дефицит достиг точки, когда вызывает рост цен на потребительскую электронику и, предположительно, повлияет на стоимость видеокарт. По данным южнокорейского агентства Newsis, AMD повысит цены на некоторые GPU в этом месяце, а NVIDIA последует примеру в феврале.

NVIDIA сфокусировалась на обходе этого узкого места с чипами. В прошлом месяце компания совершила крупнейшую покупку за всю историю, приобретя Groq – производителя чипов, специализирующегося на инференсе. Платформа Rubin обеспечивает до 10-кратное снижение стоимости токенов инференса и 4-кратное сокращение количества GPU для обучения моделей на архитектуре mixture of experts (MoE), такой как DeepSeek.

Компания также представила новый класс ИИ-нативной инфраструктуры хранения, специально разработанной для инференса – Inference Context Memory Storage Platform. Агентный ИИ, горячий тренд последнего года, повысил важность памяти искусственного интеллекта. Вместо простых ответов на отдельные вопросы ИИ-системы теперь должны запоминать гораздо больше информации о предыдущих взаимодействиях для автономного выполнения задач, что означает больше данных для управления на стадии инференса.

Время покажет, сможет ли эффективность успешно решить узкие места, вызванные интенсивным спросом на чипы. Однако даже при решении проблемы памяти индустрия ИИ продолжит сталкиваться с другими ограничениями в беспрецедентном росте – прежде всего с огромной нагрузкой на энергосеть со стороны дата-центров.



Источник новости: shazoo.ru

Bot
2026-01-06T14:43:04Z

Здесь находятся
всего 0. За сутки здесь было 0 человек