На фоне критики по поводу неудовлетворительной производительности своих продуктов на базе искусственного интеллекта, особенно в таких областях, как сводки уведомлений, Apple в понедельник подробно рассказала о том, как она пытается улучшить свои модели искусственного интеллекта, анализируя пользовательские данные в частном порядке с помощью синтетических данных.
Компания заявила, что, используя подход под названием «дифференциальная конфиденциальность», она сначала сгенерирует синтетические данные, а затем будет опрашивать устройства пользователей (при условии, что они дали согласие на предоставление аналитики устройств Apple) с помощью фрагментов сгенерированных синтетических данных, чтобы сравнить точность своих моделей и впоследствии улучшить их.
«Синтетические данные создаются для имитации формата и важных свойств пользовательских данных, но не содержат никакого фактического пользовательского контента», — написала компания в своем блоге. «Чтобы создать репрезентативный набор синтетических писем, мы начинаем с создания большого набора синтетических сообщений по различным темам. Затем мы выводим представление, называемое встраиванием, каждого синтетического сообщения, которое охватывает некоторые ключевые параметры сообщения, такие как язык, тема и длина».
Компания заявила, что эти встраивания затем отправляются на небольшое количество пользовательских устройств, которые согласились на использование Device Analytics, а затем устройства сравнивают их с выборкой электронных писем, чтобы сообщить Apple, какие встраивания являются наиболее точными.
Компания заявила, что использует этот подход для улучшения своих моделей Genmoji и в будущем будет использовать синтетические данные для Image Playground, Image Wand, Memories Creation and Writing Tools, а также Visual Intelligence. Apple заявила, что также будет опрашивать пользователей, которые соглашаются делиться аналитикой устройств с синтетическими данными, чтобы улучшить сводки электронной почты.
Источник
Источник новости: habr.com