OpenAI запустила партнёрскую программу Data Partnerships по сбору наборов данных от клиентов. Эти датасеты будут использоваться для обучения моделей ИИ компании.
Инициатива OpenAI Data Partnerships направлена на сбор массивов частных и публичных данных, которые нельзя найти в Интернете. Компания заявляет, что ей требуется не только текстовая информация, но и изображения, аудио или видео.
OpenAI подчёркивает, что ищет данные по любой теме и на любом языке, если они «выражают человеческие намерения». Ожидается, что информация, ориентированная на человека, поможет компании улучшить такие инструменты, как технология автоматического распознавания речи для расшифровки произнесённых слов. Кроме того, она позволит улучшить модель GPT-4 Turbo, которая будет предоставлять пользователям более сложные и содержательные ответы.
OpenAI заявляет, что уже начала работать с заинтересованными организациями, включая правительство Исландии. Так, компания уже обучает модели лучше понимать запросы на исландском языке.
Чтобы принять участие в программе, нужно отправить форму на веб-сайте компании и поделиться информацией о типе и размере данных. Это может быть архив с открытым исходным кодом, но материалы в нём станут общедоступными. В качестве альтернативы OpenAI предлагает отправлять информацию через свой собственный канал, который будет ориентирован на обучение «точно настроенных пользовательских моделей». Однако компания подчёркивает, что ей не требуются наборы данных, содержащие конфиденциальную или личную информацию.
Ранее OpenAI представила конструктор чат-ботов GPTs, с помощью которого пользователи могут включать в ChatGPT специальные возможности, специфические знания и навыки.
Источник новости: habr.com