Фей-Фей Ли, ведущий исследователь в области искусственного интеллекта, привлекла 230 миллионов долларов для стартапа World Labs, который она и трое ее коллег основали для создания технологии искусственного интеллекта, способной понять, как устроен трехмерный физический мир.
Ли, входящая в список 100 самых влиятельных людей в области ИИ в 2023 году по версии журнала Time, с 2017 по 2018 год возглавляла отдел ИИ в Google Cloud, входила в совет директоров Twitter и консультировала политиков, в том числе в Белом доме.
Профессор Стэнфордского университета широко известна как «крестная мать ИИ» — это прозвище относится к трем «крестным отцам», получившим в 2018 году премию Тьюринга, главную награду в мире компьютерных технологий, за их прорывы в области ИИ.
Ли сделала себе имя в области ИИ, разработав ImageNet, крупномасштабный набор данных изображений, благодаря которому появилось целое поколение технологий компьютерного зрения, позволяющих впервые достоверно идентифицировать объекты.
Ранее агентство Reuters сообщало, что Ли в скрытом режиме работает над стартапом в области ИИ, который может визуализировать идеи в 3D-среде. Другими основателями World Labs являются исследователи компьютерного зрения Джастин Джонсон, Кристоф Ласснер и Бен Милденхолл.
В то время как коммерчески доступные генеративные модели ИИ могут создавать ослепительные текстовые и фото_результаты, Worlds Labs фокусируется на «пространственном интеллекте», или способности понимать, как устроен 3D-мир, как отмечает Ли. По ее словам, модели пространственного интеллекта могут быть использованы в будущем для дополненной и виртуальной реальности (AR/VR) или робототехники.
«Изображения и видео, которые вы видели до сих пор, созданные с помощью генеративных моделей ИИ, не дают вам полного представления о том, как устроен 3D-мир».
Она отметила, что это ощущение является основополагающим для раскрытия более широких возможностей рассуждений в системах ИИ. Это позволит избежать появления «галлюцинаций» вроде рук с неправильным количеством пальцев.
«То, как мы понимаем структуру мира, воображаемого или реального, станет одним из основных элементов головоломки ИИ», — сказала Ли.
Стартап из Сан-Франциско, в котором работают 20 человек, будет обучать базовые модели, которые его основатели называют «большими моделями мира» или «LWM». По словам Ли, для обучения моделей будет использоваться сочетание синтетических и реальных данных.
По словам Ли, в моделях будет использоваться та же архитектура на основе трансформатора, которая лежит в основе ChatGPT от OpenAI. Однако, по ее словам, трансформатор не будет «всем и вся» в их моделях, предполагая, что они будут включать в себя и другие элементы.
Источник новости: habr.com