Этой весной сообщество Open Data Science и компания MTS AI делают новый запуск курса по обработке естественного языка. Вот страница нашего курса. Для того, чтобы его пройти, нужно зарегистрироваться.
Всем привет! Мы делаем новый запуск курса Natural Language Processing. В этом семестре решили существенно переделать курс. Теперь он состоит из основных 8 занятий, посвященных разным ключевым темам NLP. Если кратко:
Закон Ципфа;
TF-IDF;
RNN;
CNN;
Transformer;
LLM.
Это набор инструментов, но конечно мы рассмотрим и задачи - классификации текста, тэггирования, генерации, которая сейчас является наверное основной задачей всего NLP. Каждое занятие будет состоять из лекции и семинара. Полный список тем можно посмотреть на странице курса.
В этом запуске мы посвятим больше времени большим языковым моделям (LLM). Про ChatGPT в наше время не слышал только ленивый, но про него можно рассказать только слухи, поэтому я расскажу об открытых моделях, таких как Llama и Mistral, а на семинаре можно будет поработать с этими моделями.
Также в курсе традиционно будет два задания, одно на вышеупомянутый Word2Vec, одно в виде соревнования наподобие тех, что проводят на платформе Kaggle. Оба задания были недавно обновлены и, надеюсь, стали более интересными.
Помимо 8 основных занятий, будет 5 дополнительных лекций по разным темам NLP, в частности про диалоговые системы и NLP для кода. Скорее всего получится сделать гостевую лекцию про обработку речи.
Лекции и семинары будут онлайн. После каждой лекции будет квиз. Сдача заданий и квизов будет происходить на платформе ODS. Самое важное, на мой взгляд, что большую часть курса составляет создание собственного проекта. Проект - это произведение одного или нескольких людей, которые делают одну программу, модель машинного обучения либо корпус текстов. Проекты прошлых запусков можно найти на сайте ODS.
Пару слов о ведущих курса. Я буду читать лекции, в области NLP я работаю последние 10 лет, успел поработать в Яндексе и ВКонтакте, защитить кандидатскую диссертацию. Больше информации про меня здесь. В этом семестре семинары опять будет вести Салават, за что ему большое спасибо. В этом запуске мы сотрудничаем с двумя вузами: ИТМО и Бауманкой. Если вы студент одного из этих вузов, то можно попробовать зачесть курс, как учебный.
В этом запуске все общение по курсу будет концентрировать в группе в Telegram.
Лекции будут проходить по четвергам в 19:00. Ссылка будет в группе и на странице курса. Первое занятие - 12 сентября, присоединяйтесь!
Надеюсь, я вас заинтересовал, еще раз ссылка на курс.
Источник новости: habr.com