Ученые российской компании Smart Engines создали новое поколение нейросетей для распознавания паспорта РФ. Теперь ИИ может считать любую страницу документа – в том числе штамп с пропиской – так же легко и быстро, как это происходит при сканировании QR-кода во время оплаты покупок.
Благодаря новому ИИ удалось реализовать уникальную фичу – автоматическое распознавание рукописного адреса в штампе о месте регистрации. Данные из него требуются, например, при оформлении ипотечных продуктов в банках или получении сим-карт у операторов сотовой связи. Для этого на датасете, содержащем 1,3 млн синтетически сгенерированных изображений рукописных строк, были обучены рекуррентные сверточные нейросети. Они способны на лету распознавать символы с учетом контекста. Разработанная система за 0,4 секунды обнаруживает штамп с пропиской на изображении, отделяет рукописный текст от печатного и распознает его.
С новым поколением нейросетей еще больше выросла точность распознавания всех полей главного разворота паспорта РФ. Речь идет как о цифровых полях вроде номера паспорта, даты выдачи и кода подразделения, так и текстовых. Улучшения коснулись даже самых сложных для ручного ввода значений – поля “кем выдано”, обычно растягивающегося на несколько строк, и поля “место рождения”. Повышена точность распознавания паспортов с рукописным основным разворотом, которое доступно всем клиентам Smart Engines с конца 2019 года.
“Мы больше 8 лет непрерывно работаем над усовершенствованием технологии распознавания общегражданского паспорта РФ. С ее помощью пользователи могут распознавать паспорта на фотографиях, сканах и в видеопотоке, когда человек показывает документ камере своего телефона. Качество ввода паспортных данных человеком и так называемые 99% точности распознавания были достигнуты нами давно. Сейчас усилия наших ученых сосредоточены по сути на этом 1% сложных для алгоритмов ИИ и человека случаях, чтобы с выходом каждой новой версии количество “нераспознаваний” стремилось к нулю”, – комментирует генеральный директор Smart Engines д.т.н. Владимир Арлазаров.
Автоматическое распознавание паспорта РФ существенно снижает риски бизнеса: вызванные человеческим фактором ошибки, утечки данных через операторов и мошеннические действия сотрудников. Технологии Smart Engines используют 10 из 13 системно образующих кредитных организаций – Газпромбанк, ВТБ, Альфа-Банк, МКБ, «Открытие», Росбанк, Тинькофф, Промсвязьбанк, Райффайзен Банк, Совкомбанк. Системы анализа и распознавания документов Smart Engines применяют МТС, Билайн, МегаФон, РЕСО-гарантия, Альфастрахование, РЖД при продаже билетов в кассах, на автоматическом паспортном контроле в Шереметьево, при регистрации самозанятых в приложении ФНС “Мой налог”.
Источник новости: habr.com