OpenAI представила инструмент для оценки возможностей ИИ в инженерии

Разное

10:13 16-10-2024

DimonVideo

OpenAI представила инструмент для оценки возможностей ИИ в инженерии

Команда исследователей из OpenAI разработала новый инструмент для оценки возможностей в области машинного обучения — MLE-bench. Документ с описанием этого бенчмарка опубликован на предпечатном сервере arXiv.

С ростом применения машинного обучения и искусственного интеллекта появились новые задачи, требующие инженерного подхода. MLE-bench включает 75 тестов, взятых с платформы Kaggle, которые позволяют оценить, насколько хорошо ИИ может решать реальные проблемы, такие как расшифровка древних свитков или разработка новых типов вакцин на основе мРНК.

Хотя инструмент не рассматривает вопросы безопасности ИИ, он открывает возможности для разработки средств, направленных на предотвращение потенциальных негативных последствий. Результаты тестирования помогут команде OpenAI отслеживать прогресс в исследованиях ИИ и оценивать его способность к автономной инженерной деятельности и инновациям.

Источник новости: www.ferra.ru

Чат в Telegram

Регистрация

Войти

Главная

Опросы

Форум

Обзор новинок

Обменник

Android

Трекер

PC

Видео

Картинки

Новости

Разные новости

Статьи

Блоги

Комментарии

ПОДДЕРЖИ сайт

OpenAI представила инструмент для оценки возможностей ИИ в инженерии

Разное

Похожие файлы

Microsoft представила инструмент для веб-разработки Babylon.js 7.0 с новыми опциями процедурной геометрии

OpenAI представит инструмент Media Manager для информирования о нарушении копирайта создателями контента

OpenAI добавила инструменты для комплаенса и администрирования в ChatGPT Enterprise

НИУ ВШЭ представил нейросеть для оценки уровня владения английским языком

Не знаю - 25 (6%)

16 - 22 (5%)

15 - 147 (37%)

14 - 62 (15%)

13 - 37 (9%)

12 - 27 (6%)

11 - 15 (3%)

10 - 18 (4%)

9 - 4 (1%)

8 - 3 (0%)

7 и ниже - 7 (1%)

А у меня айфон! - 20 (5%)

Иное - 4 (1%)

Не знаю - 25 (6%)

16 - 22 (5%)

15 - 147 (37%)

14 - 62 (15%)

13 - 37 (9%)

12 - 27 (6%)

11 - 15 (3%)

10 - 18 (4%)

9 - 4 (1%)

8 - 3 (0%)

7 и ниже - 7 (1%)

А у меня айфон! - 20 (5%)

Иное - 4 (1%)