Parascript создает продукты, сама суть которых, на наш взгляд, — цифровая трансформация.
Эти решения позволяют клиентам компании экономить миллиарды долларов каждый год. Арифметика здесь достаточно проста – как говорит Александр, достаточно умножить количество документов (конверты, посылки, банковские чеки, медицинские и бухгалтерские формы и т.д.), которые обработаны автоматически технологией Parascript и не требуют ручного ввода данных, на стоимость ручного ввода данных одного документа. Ежегодно программы Parascript автоматически обрабатывают десятки миллиардов почтовых отправлений, десятки миллиардов банковских чеков, медицинских, страховых, бухгалтерских форм во многих странах мира. Ручная обработка каждого такого документа стоит обычно несколько центов. Результат – миллиарды долларов ежегодной экономии.
— Александр, каковы, на ваш взгляд, 3-5 важнейших событий, которые произошли в бизнесе компании за всю ее историю?
— Первое событие в жизни компании, которое я считаю важным, не привело ни к какому успеху с точки зрения бизнеса. Мы приняли участие в соревновании на лучшее решение по автоматизации переписи населения в США. Это были рукописные формы, где надо было автоматически распознать много элементов данных – имя и фамилию, адрес, цвет глаз и волос, возраст, расовую принадлежность и так далее. Мы не просто выиграли это соревнование, мы разгромили всех остальных. Наш результат был 94% распознанных полей с ошибкой менее 1%, а компания, которая заняла второе место, проиграла нам более 10%, что означало, что с их решением нужно было примерно в три раза больше расходов на ручной ввод данных. Но у нашей компании все разработчики в то время находились в Москве. Я вполне понимаю, что американское Бюро Переписи Населения не рискнуло заключить контракт на подсчет результатов национальной переписи с компанией, где все разработчики базировались в Москве (холодная война к тому времени давно закончилась, но все же...). Однако для нас результат означал, что, по крайней мере в этой узкой области распознавания образов мы – лучшие в мире.
Вторая веха в истории нашей компании – это автоматизация USPS – американской почтовой службы. Когда мы начинали эту деятельность, 80% конвертов с рукописными адресами обрабатывались вручную. Более 200 предприятий, раскиданных по всей территории США, содержали огромное количество сотрудников, которые занимались вводом этой информации. За несколько лет мы увеличили процент автоматического распознавания конвертов с рукописными адресами с 20% до 96%. На сегодня, из более, чем 200 американских почтовых предприятий по вводу данных, существовавших до того, как мы начали разработку и внедрение нашей технологии, осталось всего одно. Честно говоря, мы побаивались, что сотрудники, уволенные с этих двухсот предприятий узнают, кому они обязаны этим, но, вроде бы, обошлось. Сегодня наши программы по распознаванию адресов работают не только в США, но и в Германии, Англии, Италии, и т.д.
Еще одно важное направление, которым мы занимаемся – это распознавание информации на банковских чеках – и машинопечатных, и рукописных. Когда мы только начинали, лучшим в мире было программное решение от знаменитой Белл Лабс (Bell Labs). Они могли автоматически распознать аж 40% чеков. После того, как мы этим занялись, им пришлось переквалифицироваться, ну не в управдомы, но уйти в другие сферы деятельности. Наш сегодняшний результат – больше 90% автоматического распознавания с ошибкой менее 1%. Эта задача интересна тем, что для предотвращения подделок банковские чеки часто печатаются на фоне весьма замысловатых картинок – кошечки, собачки и прочее искусство. Все это проявляется при бинаризации картинок, так что приходится учиться отделять, так сказать, мух от борща.
— Что для вас понятие диджитализации, цифровой трансформации? Каков залог успешной реализации этой стратегии?
— Изначально под диджитализацией понимали, в основном, перевод информации из бумажной формы в цифровую, для того, чтобы добиться экономии в обработке информации и в архивации документов. Позднее все осознали, что это не самое главное. Электронная форма хранения информации позволяет осуществлять эффективный доступ к информации, а также способствует эффективному извлечению аналитической информации, необходимой для оптимизации и автоматизации процессов управления.
— Каким образом вы реализуете диджитализацию в компании? Что самое сложное в этом процессе? И каковы его выгоды?
— Мы относительно небольшая компания, так что нам несложно достичь высокой степени диджитализации. Мы стараемся обходиться без бумажных документов с самого начала. Практически любой документ в нашей компании рождается, редактируется, распространяется и хранится в электронной форме. Таким же образом мы общаемся и с партнерами, и с клиентами. Если кто-то из наших партнеров и поставляет нам бумажные документы, мы тут же переводим их в электронную форму.
Основные выгоды от такого подхода для нас состоят в том, что процесс поиска необходимой информации, распространения ее внутри компании, совместной работы над документами, извлечения и переработки исходной информации в более абстрактные формы (например, в нейронные сети, являющиеся важной частью наших продуктов) становится более простым и эффективным.
— Каким вы видите будущее рынка, на котором работаете?
— Взгляд на будущее зависит от масштаба времени. Если мы смотрим вперед на 5-10 лет, то изменения сегодняшней ситуации будут достаточно плавными. Жизнь государств и компаний весьма инерционна. То, что бумага вскоре уйдет в прошлое, предсказывали последние, как минимум, двадцать лет. Жизнь показывает, что процесс этот займет не одно десятилетие. Он, безусловно, идет. Количество почтовых отправлений в США уменьшилось, грубо говоря, вдвое относительно пика. Количество банковских чеков уменьшилось примерно втрое. Все большая часть документооборота в медицине, финансах, и т.д. ведется в электронной форме. Однако существуют значительные ниши рынков, где бумажные документы все еще удерживают позиции. В то же время, возникают задачи автоматической обработки документов, которые не так давно были уделом исключительно ручной обработки. Таковыми, в частности, являются задачи проверки целостности пакета документов (проверить, что все документы, которые должны быть в пакете документов на получение ипотечного кредита, там присутствуют). Ну и, естественно, значительно растут запросы к извлечению аналитической информации из документов.
Еще одна вещь, которую хотелось бы отметить, — это текущий разворот ИТ-рынка в сторону искуственного интеллекта. Сейчас в США и в других странах в это направление вкладываются огромные ресурсы. Я знаю, что ряд компаний в России серьезно инвестируют в это направление, например, такие компании, как Яндекс и Сколковский институт технологии.
Назовите 1-2 наиболее уникальных решения, созданных вашей компанией, которыми вы лично гордитесь.
— У нас есть много решений, которыми мы гордимся. Мне лично очень нравится наша технология верификации подписей. Наш алгоритм может отличить настоящую подпись даже от профессиональной подделки. Этот продукт используется для верификации подписей на банковских чеках, а также для верификации подписей людей во время выборов. В ряде стран люди могут голосовать по почте, в этом случае требуется верификация того, что подпись на бюллетене голосования совпадает с подписью данного избирателя в базе данных. Мы внутри нашей компании попытались соревноваться с нашей программой в качестве верификации подписей — наши сотрудники проиграли алгоритму с разгромным счетом.
Мне также очень нравится наша технология классификации документов. Представьте себе, что вам на вход поступает сплошным потоком набор документов безо всяких разделителей между документами. Ваша задача – отделить документы друг от друга, и классифицировать документы в предопределенные типы. Что делает эту задачу особенно интересной – это то, что в реальном потоке помимо нескольких сотен заранее определенных типов документов может быть неограниченное количество документов, тип которых просто неизвестен. Очень «вкусная» задача, есть где развернуться воображению.
— Ваши решения построены на технологии искусственного интеллекта. А как ИИ применяете лично вы в работе и личной жизни?
— Вы знаете, когда ты погружен в ИИ-технологии практически каждый рабочий день, хочется хотя бы дома отдохнуть от этого. А если серьезно, то на сегодня ИИ приносит наибольшую пользу тогда, когда его применяют для специализированных приложений, например, таких приложений для обработки документов, которые разрабатывает наша компания. Другая бизнес-область, которая успешно использует ИИ — это поддержка пользователей (customer support). Когда вы, например, пытаетесь позвонить в авиакомпанию, чтобы решить какую-то вашу проблему, связанную с предстоящим полетом, вы далеко не сразу можете быть допущены к разговору с живым человеком. Вы потратите, как минимум, несколько минут на общение с системой распознавания речи. Должен сказать, что для меня это всегда несколько очень неприятных минут, поскольку сегодняшний ИИ очень плохо распознает акценты. Мой русский акцент чаще всего полностью выводит из строя моего искусственного собеседника и доводит градус моего кипения до состояния кипящего чайника. Так что вне работы я на сегодня предпочитаю минимум общения с ИИ. Естественно, в недалеком будущем эта ситуация, скорее всего, изменится.
— Как руководитель, что вы делаете, если вас покидает вдохновение или вы сталкиваетесь с безвыходной ситуацией?
— Мне повезло в жизни. Когда после защиты диссертации я выбирал куда пойти работать, и меня приняли в оба места, куда я пытался поступить. В банке Менатеп, который возглавлял тот самый Ходорковский, мне предлагали зарплату в три раза больше, чем в компании Параграф (от которой впоследствии отпочковался Параскрипт). Но Параграф занимался распознаванием рукописного текста, что меня очень заинтересовало, так что выбор был очевиден. С тех пор меня на работе никогда не покидало вдохновение — мне очень нравится то, чем я занимаюсь.
Безвыходные ситуации – не знаю, пока не сталкивался. У нас в компании своеобразный народ, мы подбираем людей, каждый из которых – личность, для них не существует нерешаемых задач. Вот вам реальная история создания нашей родительской компании – Параграф. На семинаре академика Гельфанда Степан Пачиков (основатель Параграфа) получил записку от двух молодых ученых, присутствовавших на семинаре. Записка гласила – «Можем решить любую задачу». Так и был основан Параграф, и под этим девизом продолжает жить Parascript. Неудачи в бизнесе, конечно, случаются. Потенциальные заказчики могут нам сказать, что у них и так все хорошо. Но потенциальных заказчиков много, а когда вы можете решить любую задачу (непременное условие — задача должна быть нам интересна), то безвыходных ситуаций просто не возникает.
— Что бы вы никогда не сделали в бизнесе? А в жизни?
— У меня есть одна личная проблема – если я дал слово, я не могу его нарушить. Чего я не могу сделать ни в бизнесе, ни в жизни – это не сдержать данное обещание.
— Чему вас научила конкурентная борьба? Как вы относитесь к достижениям конкурентов?
— Никогда нельзя недооценивать конкурентов. Мы уважаем наших конкурентов и знаем, что никогда нельзя расслабляться, иначе нас догонят и перегонят. Мир полон сильных людей и сильных компаний.
— Над чем компания и лично вы работаете прямо сейчас? Чего клиентам ждать от компании в ближайшем будущем?
— Мы очень активно работаем над технологиями глубоких нейронных сетей (deep learning), и над улучшением качества наших продуктов на основе этих технологий. Одна из ближайших новинок, которую мы собираемся выпустить в этом году – это технология автоматического непрекращающегося обучения. Наши продукты будут продолжать обучаться в автоматическом режиме после того, как они будут поставлены заказчику. Весьма часто потоки документов, которые заказчик обрабатывает, меняются со временем, и наши продукты будут на лету учиться, адаптироваться и подстраиваться к этим изменениям, без какого бы то ни было участия человека. С нашей точки зрения, эта задача посложнее, чем самоуправляемые машины (где все необходимые данные для обучения алгоритма вождению в разнообразных условиях могут быть собраны до начала эксплуатации), но это только делает задачу интереснее