Новость от Техкранч поймана и пересказана на русский ботом summix_bot
Неделя для OpenAI была бурной — много новостей о компании. Но OpenAI не останавливается и уже на DevDay 2024 хочет привлечь ещё больше разработчиков, чтобы они создавали инструменты на базе их моделей ИИ.
OpenAI представили Realtime API — это бета-версия для создания приложений с низкой задержкой и ИИ-генерируемыми голосовыми ответами. Это не совсем как Advanced Voice Mode в ChatGPT, но близко к нему.
На брифинге для журналистов глава по продуктам OpenAI Кевин Вейл сказал, что недавние уходы технического директора Миры Мурати и главного исследователя Боба МакГрю не повлияют на развитие компании. Он отметил, что эти люди были отличными лидерами и помогли OpenAI достичь сегодняшних результатов, и добавил, что компания не собирается замедляться.
OpenAI всё ещё стремится быть лучшей платформой для разработки AI-приложений. У них уже более 3 миллионов разработчиков. Но конкуренция растёт.
OpenAI снизили стоимость доступа к API на 99% за последние два года. Возможно, это было сделано из-за снижения цен со стороны Meta* и Google.
Одна из новых функций OpenAI — Realtime API. Она позволяет разработчикам создавать приложения с почти реальным временем взаимодействия и выбирать из шести голосов от OpenAI. Эти голоса отличаются от тех, что используются в ChatGPT. Разработчики не могут использовать сторонние голоса, чтобы избежать проблем с авторскими правами.
На демонстрации глава OpenAI по работе с разработчиками Ромен Хью показал приложение для планирования поездки в Лондон с использованием Realtime API. Оно позволяло пользователям получать ответы с минимальной задержкой. Также API имеет доступ к ряду инструментов, которые позволяют приложению аннотировать карту с расположением ресторанов.
Хью также продемонстрировал, как Realtime API может говорить по телефону с человеком, чтобы узнать о заказе еды на мероприятие. Однако OpenAI API не может напрямую звонить в рестораны или магазины, а только интегрироваться с такими сервисами, как Twilio.
OpenAI также представили функцию тонкой настройки зрения в своём API. Это должно помочь разработчикам улучшить работу GPT-4o в задачах, связанных с визуальным восприятием.
Телеграм-канал автора блога.
* Meta Platforms признана в России компанией, осуществляющей экстремистскую деятельность. Работа Meta и ее социальных сетей Facebook и Instagram в России запрещена.
Источник новости: habr.com