категории | RSS

Китай обучает новую ИИ-модель на 100 миллиардов параметров

Китайский институт искусственного интеллекта China Telecom объявил, что успешно обучил модель с 100 миллиардами параметров, используя используя только вычислительные мощности, произведённые внутри страны. Это свидетельствует о том, что китайские компании, несмотря на санкции, ограничивающие поставки западных технологий, продолжают активно развивать свои возможности в сфере ИИ.Модель TeleChat2-115B

Модель, получившая название TeleChat2-115B, была представлена на GitHub 20 сентября. Согласно опубликованным данным, она была обучена с использованием 10 триллионов токенов, состоящих из китайского и английского текста. Важным моментом является то, что обучение велось на отечественной вычислительной инфраструктуре, без использования зарубежного оборудования.Технологическая база

В проекте упоминается использование серверов для обучения Ascend Atlas 800T A2, которые производит Huawei. Эти серверы работают на процессорах Kunpeng 920, созданных на архитектуре Arm 8.2 с применением 7-нанометрового техпроцесса. Хотя эта инфраструктура уступает по мощности западным аналогам, она продемонстрировала свою достаточность для выполнения задачи обучения модели с 100 миллиардами параметров.Сравнение с другими моделями

TeleChat2-115B содержит меньше параметров, чем ведущие модели, такие как Llama 2 с более чем 400 миллиардами параметров или OpenAI с её GPT-4 (приблизительно 200 миллиардов параметров). Тем не менее, несмотря на относительно небольшой объём параметров, эта модель способна решать задачи высокого уровня сложности, что доказывает эффективность китайской инфраструктуры даже без новейших GPU и других мощных вычислительных средств.Стратегия Китая в условиях санкций

Несмотря на ограничения в доступе к передовым западным технологиям, Китай демонстрирует способность адаптироваться и развивать собственные решения. China Telecom, как одна из крупнейших телекоммуникационных компаний с доходом более 70 миллиардов долларов, обладает огромными ресурсами и способностью развертывать масштабные вычислительные мощности. Это позволяет стране продолжать конкурировать в области искусственного интеллекта, даже несмотря на дефицит новейшего западного оборудования.

Источник



Источник новости: habr.com

DimonVideo
2024-10-02T22:50:02Z

Здесь находятся
всего 0. За сутки здесь было 0 человек
Яндекс.Метрика