Stability AI представила StableCode — нейросеть на базе LLM, предназначенную для генерации кода. В компании считают, что решение поможет программистам в их повседневной работе и будет полезно для освоения новых технологий.
В пресс-релизе рассказали, что в StableCode доступны несколько моделей, которые генерируют код. Базовую модель обучили на открытом наборе данных от BigCode, включающем в себя 6,4 ТБ исходного кода на 358 языках программирования. После этого базовую модель дополнительно обучили на популярных языках программирования, включая Python, Go, Java, javascript, C, C++ и Markdown.
Уже обученную базовую модель использовали для обучения модели, предназначенной для решения практических задач. Для этого использовали набор из 120 тыс. пар в формате
код/ответ.
В компании отмечают, что StableCode выдаёт самые большие фрагменты кода, по сравнению с другими открытыми моделям. Так в окне ответа можно просматривать код, который сопоставим по длине с пятью файлами на языке Python. Именно поэтому одним из сценариев использования значится обучение. Пользователь может сразу получить развёрнутый ответ на свой вопрос.
Источник новости: habr.com