Ученые компании Smart Engines создали нейросеть, которая распознает сложные рукописные слова, такие как «шиншилла», без словарей и контекста. Технология может используоваться в системах распознавания паспортов РФ.
Компания Smart Engines совершила прорыв в области искусственного интеллекта, разработав нейросеть, способную распознавать сложные рукописные слова без использования языкового контекста.
Слово «шиншилла» стало своеобразным тестом Тьюринга для систем распознавания рукописного текста на кириллице. При быстром и неаккуратном письме строчные буквы «ш», «и» и «л» часто становятся практически неразличимыми. Это делает слово особенно сложным для распознавания, что и породило множество мемов о сложности русского курсива. Ученые Smart Engines создали нейросеть, которая способна справляться с такими задачами без опоры на словари или лингвистические модели.
Нейросетевая архитектура, получившая название «Да Винчи» не использует рекуррентные схемы, триграммы или словари, что делает ее более быстрой и компактной. Вместо этого система анализирует только особенности соединения букв на изображении. Это позволяет избежать «галлюцинаций» ИИ — ситуаций, когда система ошибочно распознает редкие слова или имена собственные.
Для обучения «Да Винчи» ученые использовали 1,2 миллиона строк рукописного текста, синтезированного с равномерным распределением сочетаний букв. Такой подход минимизирует риск переобучения модели на языковом контексте и повышает точность распознавания даже в сложных случаях.
«Основной целью было создать метод ИИ, который умел бы читать такие сложные для прочтения рукописные слова, как «шиншила», но без использования языкового контекста. Это необходимо для распознавания документов — паспортов, штампов о регистрации и других. В них надо читать ровно то, что написано, а не то, что правильно с точки зрения языка».
Владимир Арлазаров, генеральный директор Smart Engines
Разработка Smart Engines уже нашла применение в системах распознавания паспортов РФ. Эти системы используются банками и сотовыми операторами для быстрой и точной обработки документов.