Стартап Mistral AI из Франции выпустил Codestral — свою первую модель машинного обучения для генерации кода. Нейросеть обучили на 80 языках программирования, включая javascript, Python и Java.
У Codestral 22 млрд параметров, что обеспечивает достаточную производительность для быстро генерации. Нейросеть справляется с созданием программного кода с нуля и заполнения пробелов. Кроме того, Codestral может отвечать на вопросы по кодовой базе проекта и писать тесты.
В датасет входили как популярные языки программирования, так и менее распространённые, к примеру, Swift и Fortran. Команда стартапа изначально пыталась охватить как можно больше технологий, чтобы нейросетью могли пользоваться разные разработчики. Также Codestral может составлять SQL-запросы и генерировать Bash-скрипты.
Модель частично открыта и надо соблюдать определённые условия. Нейросеть нельзя использовать в коммерческой деятельности. В пользовательском соглашении это прямо прописано. Вероятно, что модель частично обучали на данных, защищённых авторским правом.
Codestral с весами опубликована на платформе Hugging Face. Также бесплатно пользоваться моделью можно на портале Le Chat.
Источник новости: habr.com