`

СПЕЦІАЛЬНІ
ПАРТНЕРИ
ПРОЕКТУ

Чи використовує ваша компанія ChatGPT в роботі?

BEST CIO

Определение наиболее профессиональных ИТ-управленцев, лидеров и экспертов в своих отраслях

Человек года

Кто внес наибольший вклад в развитие украинского ИТ-рынка.

Продукт года

Награды «Продукт года» еженедельника «Компьютерное обозрение» за наиболее выдающиеся ИТ-товары

 

Интеллектуальная обработка документов. Tesseract, Google Vision API и elDoc: сравним решения

Быстро и эффективно обработать огромный поток документов, содержащих зачастую неструктурированные данные, — с такой потребностью сталкивается сегодня любой бизнес в любом уголке мира. Обрабатывать вручную — долго, затратно и невыгодно. Автоматизировать этот процесс позволяет интеллектуальная обработка документов (Intelligent Document Processing, IDP). Какие же возможные решения могут применяться для этого? Каковы их основные преимущества и недостатки?

Для примера возьмём три решения, с помощью которых попробуем на практике верифицировать различные возможности обработки документов, — Tesseract, Google Vision API и elDoc.

Для решения типичных повседневных бизнес-задач по обработке документов с неструктурированными данными обычно требуется:

  • идентифицировать отдельные необходимые поля в документе;

  • извлечь и распознать их целевые значения;

  • структурировать полученные данные для дальнейшего использования в рамках автоматизации бизнес-процесса.

Задача может быть значительно усложнена, если документ является многостраничным, с большим объёмом данных, а требуется распознать и извлечь только определённый тип данных (например, значение отдельных целевых колонок таблиц). Или же когда требуется обработать файл, содержащий несколько совершенно разных типов документов с разной структурой полей и данных, которые должны быть извлечены и в дальнейшем обработаны согласно определённой логике в разрезе каждого типа документа.

Рассмотрим в качестве тестовой задачи извлечение конкретных данных из сертификата об образовании и сервис-отчёта. Со сканированного сертификата необходимо извлечь следующие поля: номер, имя и фамилию обладателя, перечень предметов и оценки. В свою очередь, из сервис-отчёта — название и код компании, дату, номер счета, ID оборудования, тип и модель оборудования. Задачу усложним тем, что файл с сертификатом будет содержать также многостраничный сервис-отчёт.

Итак, начнём с Tesseract, который представляет собой ПО для OCR и сегодня считается одним из самых мощных open-source решений для распознавания данных со сканированных документов. Он поддерживает более 100 различных языков, что делает его универсальным и широко распространённым решением во всём мире. Многие технологические компании используют Tesseract в основе для построения комплексных решений по интеллектуальной обработке данных.

Последняя версия Tesseract основана на моделях машинного обучения, что позволяет достигать высоких результатов по качеству распознавания. Однако Tesseract позиционируется только как решение для распознавания всех данных (plain OCR) и не заточен под возможности идентифицировать и извлекать из документа конкретные поля / данные, а также обрабатывать многостраничные документы либо файлы, содержащие несколько документов, классифицировать последние по типу и отбирать из них нужные данные.

Для начала отправим на обработку с помощью Tesseract многостраничный PDF-документ, одностраничный отчёт в формате JPG (пример No1), а также одностраничный сертификат об образовании в формате JPG (пример No2).

Пример работы Tesseract No1:

Как видим, Tesseract не поддерживает обработку документов формата PDF и, как следствие, не смог обработать наш многостраничный PDF-документ. Одностраничный документ в формате JPG Tesseract обработал, однако не все поля распознаны корректно: Tesseract распознал и извлёк все значения, а не целевые.

Пример работы Tesseract No2:

В этом примере Tesseract распознал данные довольно неплохо. Однако учитывая сложность изображения (если посмотреть при увеличении, фон сертификата также содержит текст), Tesseract извлёк и распознал фон как часть текста, а также извлёк все без исключения данные, а не требуемые в исходных условиях.

Преимущества Tesseract:

  • мощный OCR-движок, способный с высокой точностью распознавать данные со сканированных / сфотографированных документов, предоставляющий довольно высокий уровень качества распознанных данных;

  • open-source решение, не требующее никаких финансовых вложений.

Ограничения Tesseract:

  • обработка документов формата PDF не поддерживается;

  • результаты распознавания представлены набором текста без уникальной связи между названиями требуемых полей и их значениями;

  • нет возможности задавать и получать из документа только интересующие значения, игнорируя остальные данные;

  • нет возможности улучшать качество исходного документа и очищать текстовый фон документов;

  • нет возможности передавать Tesseract файл, содержащий несколько документов разного типа и формата для дальнейшей классификации документов;

  • нет возможности обрабатывать многостраничные документы с последующим извлечением конкретных данных;

  • нет возможности проверять правильность данных в случае, если уровень (%) доверия к распознанному тексту ниже ожидаемого / установленного;

  • нет возможности отслеживать очередь загруженных документов при массовой обработке документов;

  • нет возможности просматривать результаты распознавания, статус обработки, очередь в удобном для бизнес-пользователя формате.

Google Vision API — облачный сервис, специально разработанный для глубокого анализа и извлечения данных из изображений, обладающий высокой точностью распознавания. Инструмент основан на мощных моделях машинного обучения.

Пример работы Google Vision API No1:

Как видим, Google Vision API (в рамках demo-доступа) не поддерживает обработку документов формата PDF, поэтому нам пришлось разбить документ на одностраничные файлы в формате JPG.

Пример работы Google Vision API No2:

Здесь Google Vision API, как и Tesseract, распознал фон документа как часть текста, что значительно усложняет его дальнейшую обработку. Данные получились структурированы немного лучше, чем через обработку Tesseract, но всё ещё не в целевом формате.

Примечание: анализ основывается на использовании общедоступной (trial) версии Google Vision API.

Преимущества Google Vision API:

  • мощный инструментарий, построенный с использованием технологии машинного обучения для глубокого анализа изображений;

  • доcтаточно высокий уровень распознанных данных.

Ограничения Google Vision API:

  • если необходимо обработать многостраничный PDF-документ, размещённый на локальном диске, потребуется разбить его на отдельные страницы, конвертировать их в формат .PNG/.JPEG и отправлять на обработку одну за другой;

  • результаты распознавания представлены без связи между названиями целевых полей и их значениями. Распознанные данные расположены в разных блоках как независимые текстовые значения либо представлены одной строкой совместно с другими, не существенными данными. Это значительно усложняет процесс извлечения целевых значений и дальнейшую автоматизацию бизнес-процессов в целом;

  • нет возможности обрабатывать многостраничные документы с последующим извлечением конкретных данных;

  • нет возможности проверять правильность данных в случае, если уровень (%) доверия к распознанному тексту ниже ожидаемого / установленного;

  • нет возможности отслеживать очередь загруженных документов при массовой обработке документов;

  • нет возможности просматривать результаты распознавания, статус обработки, очередь в удобном для бизнес-пользователя формате.

elDoc — интегрированная интеллектуальная платформа для автоматизации процессов документооборота и обработки документов, которая включает elDoc IDP — высокотехнологический модуль для интеллектуальной обработки документов, разработанный с применением когнитивных технологий и комплексных математических моделей (AI based). В основе elDoc для распознавания данных также используется Tesseract последней версии, основанной на нейронных сетях и машинном обучении.

Пример работы elDoc:

В elDoc мы загружаем файл, содержащий несколько документов разных форматов (сертификат и многостраничный сервис-отчёт), — задача, которая, собственно, и была поставлена изначально. Как видим, платформа elDoc выполнила следующие операции:

  • автоматически произвела очистку изображения, улучшив качество документа, где это возможно (выравнивание, нормализация фона);

  • автоматически классифицировала документы по типу (сертификат, многостраничный сервис-отчёт);

  • извлекла и распознала нужные поля в документе с определением уровня доверия к данным (confidence level).

Итак, какие выводы можно сделать? Для решения задач, где требуется распознавание всего текста, содержащегося в отсканированных / сфотографированных документах, и конвертация его в редактируемый / структурированный формат, наиболее подходящими будут такие решения, как Google Vision API, Tesseract и другие подобные. Эти решения также могут служить идеальным базисом для построения комплексных систем обработки данных.

В тех же случаях, когда целью является полная автоматизация процесса обработки документов с неструктурированными данными (в частности, где требуется извлечение отдельных целевых данных для дальнейшей конвертации в определённый формат, их структурирование для последующего использования и обработки согласно установленной бизнес-логики с возможностью проведения верификации, хранения документа и управления всем жизненным циклом документа), — применяются более комплексные автоматизированные решения — интегрированные интеллектуальные платформы для обработки документов (Intelligent Integrated Platform for Document Processing) и когнитивного машинного чтения (Cognitive Machine Reading, CMR).

Чтобы справиться со всеми этими задачами, одной технологии OCR недостаточно. Равно, как и в случаях, когда нужно провести нормализацию (предобработку) картинки с низким качеством изображения, очистить её от фона и ненужных артефактов с целью лучшего распознавания текста. Здесь нужны комплексные решения, которые включают в себя такие когнитивные технологии, как Intelligent OCR, OMR, ICR, Computer Vision и позволяют не только выполнить вышеуказанные задачи, но и дают возможности полной, комплексной автоматизации процессов обработки документов — от начала инициации процесса до размещения документа в электронном архиве.

Выгоден ли аутсорсинг роботизации бизнес-процессов?

Всякий раз когда организация решается на реинжиниринг своих бизнес-процессов за счет внедрения технологии роботизации бизнес-процессов (Robotic Process Automation, RPA), возникает дилемма: строить свой собственный центр компетенции RPA или, возможно, передать функцию разработки и поддержки программных роботов специализированным организациям?

На первый взгляд, может показаться, что экономически выгоднее самостоятельно автоматизировать свои бизнес-процессы, полагаясь на собственные человеческие ресурсы, — бизнес-аналитиков и ИТ-специалистов компании, без привлечения сторонних организаций. Однако является ли это рациональным в долгосрочной перспективе?

Отвечая на этот вопрос, следует рассмотреть следующие компоненты, которые потребуют инвестиций предприятия для успешного развёртывания проектов по роботизации бизнес-процессов:

  • Специалисты. Прежде всего компаниям нужно будет инвестировать в поиск, наём и содержание соответствующих специалистов. Как показывает опыт, для подготовки квалифицированного RPA-инженера понадобится не менее полугода, а зрелого RPA-аналитика — более 2 лет. Учитывая тот факт, что технология является новой для рынка, готовых специалистов соответствующего профиля на рынке труда найти довольно трудно, а их содержание будет стоить организации значительно больше по сравнению с другими специалистами со смежных областей.

  • Наличие и развитие базы знаний. Мировой рынок RPA-технологий непрерывно развивается, а техники и методы роботизации постоянно совершенствуются. Поставщики RPA-платформ в последнее время активно работают над усилением когнитивных функций своих программных продуктов, в частности использованием технологий машинного обучения (Machine Learning) и искусственного интеллекта (Artificial Intelligence). А это, в свою очередь, потребует постоянного повышения уровня компетенции сотрудников, что повлечёт дополнительные затраты для организации. В этом смысле профильные организации всегда будут на несколько шагов впереди, поскольку для них это является основным бизнесом, в развитие и поддержку которого вкладывается много усилий и инвестиций.

  • Наличие и развитие поддержки управления программными роботами. В долгосрочной перспективе организации нужно будет также инвестировать в управление программными роботами и в техническую поддержку уже внедрённых и постоянно развивающихся RPA-технологий.

Поэтому целесообразно ли организации выделять специальные ресурсы для создания собственного центра компетенции RPA, если роботизация бизнес-процессов не является профильным видом её деятельности? Не уместней ли направить это время и усилия на улучшение собственных продуктов и услуг, поручив RPA-проект профессионалам, которые выполнят его быстрее, эффективнее и с гарантированно наилучшим результатом?

Основными преимуществами аутсорсинга решений по роботизации бизнес-процессов являются, в частности, следующие:

  • Доступ к высококвалифицированной команде RPA-специалистов. Аутсорсинг RPA-решений позволяет получить немедленный доступ к высококвалифицированным ресурсам для запуска проекта по роботизации бизнес-процессов — команде сертифицированных RPA-аналитиков и RPA-разработчиков, которые уже получили соответствующие навыки работы с технологией роботизации и имеют в своём портфолио немало примеров успешно реализованных проектов.

  • Быстрое и эффективное внедрение роботизации бизнес-процессов. Обращение к поставщику аутсорсинга по роботизации, ориентированного прежде всего на конечный результат, позволит гарантированно достичь максимальной эффективности от её внедрения, сделать быстрый старт RPA-проекта и своевременное и успешное его завершение.

  • Возможность сконцентрироваться на своём основном бизнесе. Отдав RPA-проект на аутсорсинг, организация имеет возможность направить свои имеющиеся трудовые ресурсы на решение собственных профильных стратегических задач — совершенствование продукции, услуг и т. под., что, безусловно, принесёт бизнесу гораздо больше пользы.

  • Экономия средств. Передача RPA-проекта на аутсорсинг позволит избежать длительного блуждания окольными путями в поиске нужного RPA-решения, лишних ошибочных шагов при внедрении роботизации, а, соответственно, убережет компанию от лишних затрат.

  • Прозрачность расходов. Аутсорсинг позволяет компаниям избегать неконтролируемых нецелевых затрат. Организация высвобождает свой капитал, чтобы инвестировать его в другую часть своего бизнеса и платит только за то, что использует, когда в этом есть непосредственная необходимость. Таким образом аутсорсинг обеспечивает бóльшую гибкость проектам по роботизации бизнес-процессов и более эффективное использование ресурсов при её внедрении.

Несомненно, аутсорсинг является лучшим и проверенным путём к внедрению инноваций в организациях любого масштаба. Особенно, когда речь идёт о таких серьёзных и ответственных проектах, как роботизация бизнес-процессов, — проектах, требующих профессионального подхода и привлечения опытных и компетентных профильных специалистов.

Чем выгодна роботизация бизнес-процессов банковскому сектору?

Насколько оправдано использование технологии роботизации бизнес-процессов (Robotic Process Automation, RPA) в банковской сфере и можно ли без предостережений ее использовать в этой сфере?

Ведь банковский сектор, пожалуй, относится к едва ли не наиболее уязвимым с точки зрения рисков, учитывая специфику банковской деятельности. В этом сегменте довольно осторожно относятся к всевозможным техническим инновациям, которые могли бы как-то нарушить бесперебойную работу банковских систем и уже интегрированных корпоративных приложений.

Из-за такой высокой степени финансовых и нефинансовых рисков может даже возникнуть сомнение, целесообразно ли вообще «пускать роботов в банк». Но, несмотря на вполне справедливые предостережения, технология роботизации бизнес-процессов не только подходит для внедрения в банковском секторе, но и уже успела успешно себя там зарекомендовать и показать первые обнадёживающие для всех скептиков результаты. Начали её внедрение такие всемирно известные банки, как HSBC, Credit Suisse, Citi, Deutsche Bank и даже более знакомые нам международные группы Raiffeisen Bank International и BNP Paribas. Много других банковских учреждений по всему миру стоят на пороге роботизации и рассматривают её как мощный и действительно революционный инструмент положительных изменений в банковском бизнесе.

Какие же преимущества технология роботизации бизнес-процессов может дать банковскому сектору? Как показывает опыт, роботизация наилучшим образом проявляет себя в тех бизнес-сферах, где существует много ручных и повторяющихся действий и процессов. С этой точки зрения банковский сектор, в котором подобные процессы – осуществления транзакций, ввода/сверки данных, оплаты счетов и т. д. являются заурядной обыденностью, – относится к одному из наиболее подходящих для RPA. А если представить масштабность упомянутых процессов в разрезе разветвлённой банковской сети региональных отделений, то необходимость их роботизации со временем будет становится просто настоятельно необходимой.

В качестве наглядной иллюстрации, насколько можно оптимизировать с помощью программной роботизации один из типовых банковских процессов – сверки баланса банкомата, предлагаем ознакомиться с демо-видео. Здесь программный робот без вмешательства человека осуществляет загрузку данных, их считывание (собственно говоря, сверку баланса) и формирование отчёта. На уровне интерфейса пользователя робот исполняет процесс за 45 сек., а на программном уровне – всего за 3 сек. Излишне говорить, что этот же рутинный процесс, осуществляемый человеком вручную, отнимает в разы больше времени, не говоря уже о значительно бóльшем коэффициенте возникновения ошибок. К тому же, эта операция (как и многие другие подобные) повторяется каждый банковский день, что позволит значительно сэкономить во времени при её роботизации в разрезе банковского года.
Правильно внедрённая и корректно управляемая роботизация позволит значительно улучшить скорость обработки банковских операций, эффективность бэк-офисных и фронт-офисных процессов в банке, уменьшит продолжительность обработки клиентских запросов, а, следовательно, высвободит фронт-офисным сотрудникам время, необходимое для лучшего обслуживания клиентов. Вопреки опасениям относительно надёжности, технология роботизации позволяет не только значительно повысить производительность бизнес-процессов, но и минимизировать количество чисто механических ошибок, которые может допустить человек из-за влияния т. н. «человеческого фактора» (усталости, состояния здоровья и т. д.). Таким образом роботизация обеспечивает высшее качество и высший уровень точности бизнес-процессов. К тому же, рабочее время программных роботов не ограничено. Они способны выполнять заданные операции 24/7, что для операционной деятельности современного банка с таким же нелимитированным 24/7 доступом к широкому спектру банковских услуг (в частности, через интернет-банкинг, платёжные терминалы) очень важно. Кроме того, RPA достаточно успешно интегрируется с уже имеющимися в банке корпоративными приложениями, не меняя ИТ-ландшафт, что ничем не угрожает бесперебойной работе банковских систем, даже наоборот, – многократно улучшает их работу.

Очевидно, что по мере роста спектра банковских услуг, клиентской базы и требований к улучшению банковского сервиса потребность в роботизации будет лишь расти. А интеллектуальная роботизация, над разработкой которой сейчас активно работают производители программного обеспечения по RPA, сделает её в банковском секторе просто незаменимой.

Как машинное обучение повлияет на роботизацию бизнес-процессов

Технология роботизации бизнес-процессов (Robotic Process Automation, RPA) обладает огромным потенциалом, раскрытие которого может обеспечить повышения операционной производительности и снижения затрат на ведение бизнеса. Все рутинные и повторяющиеся изо дня в день процессы, которых существует множество в каждой организации, благодаря внедрению RPA  могут быть существенно усовершенствованы.

Однако, будем откровенны, при всех преимуществах роботизации технология всё-таки имеет свои ограничения. Они появляются, когда процессы происходят по нетривиальным сценариям и требуют принятия решений или анализа. На данном этапе развития технологии программный робот способен воспринимать только шаблонные структурированные данные и осуществлять операции, основанные на чётко определённых параметрах. Распознавать неструктурированные или полуструктурированные массивы данных и делать на их основе аналитические выводы является только прерогативой человека. Однако будет ли эта ситуация оставаться и в дальнейшем неизменной?

Никто из нас не рождается с априори сложившимся мировоззрением и опытом. Человек становится тем, кем себя создаёт в процессе обучения и развития. Похожая идея ‒ способности машин самостоятельно «обучаться» ‒ заложена и в технологию машинного обучения (Machine Learning, ML). Как оказывается, машины также могут учиться на основе собственного опыта, в процессе анализа и обработки больших массивов данных находить в них закономерности и прогнозировать результаты.

Сама идея машинного обучения не нова и уже широко апробирована такими технологическими гигантами, как IBM (Watson, 2011), Google (AlphaGo, 2015). Но только сейчас ‒ с развитием современных технологий и усовершенствованием уже разработанных прототипов ‒ появляются предпосылки для её полноценной технической реализации. Машинное обучение уже стало органической частью нашей повседневной жизни. На основе наших предыдущих предпочтений специально настроенные алгоритмы подбирают нам ленту новостей в соцсетях и товары в интернет-магазинах, осуществляют фильтрацию почтовых сообщений от спама; всё совершеннее становится машинный перевод (например, Google Translate) благодаря доступной ручной функции «улучшить перевод» и т. п. По мнению специалистов, направление машинного обучения станет одним из определяющих в развитии компьютерных технологий в XXI веке.

Поэтому с появлением и активным внедрением машинного обучения осуществление программными роботами исключительно рутинных задач становится далеко не верхней границей их потенциальных возможностей. Применение технологий машинного обучения в роботизации бизнес-процессов позволит значительно расширить её функциональность. Благодаря когнитивным технологиям программные роботы будут становиться всё умнее, в состоянии выполнять ещё более сложные задачи, чем на это способны сегодня, развивать и совершенствовать свои навыки, которые не были в них заложены с самого начала. Поэтому сочетание возможностей этих технологий позволит достичь ещё большей операционной эффективности.

Для более наглядного понимания, как может быть реализована технология машинного обучения на элементарном уровне, предложу вашему вниманию короткое видео. Н нем программный робот в соответствие с настроенным алгоритмам уже «обучен» идентифицировать, классифицировать (соответственно, распознавать) и обрабатывать полуструктурированные данные в виде разных типов документов, в частности сканы счетов различного типа и формата.

Где именно может применяться технология машинного обучения в сфере роботизации бизнес-процессов? Без лишних - прежде всего в области совершенствования распознаваемых объектов и данных. Поскольку программный робот может сейчас качественно и без ошибок считывать только структурированный печатный текст, следующим шагом для него должно стать качественное распознавание нестандартных шрифтов, неструктурированных данных, рукописного текста, человеческих лиц и естественного языка. Вместе с расширением распознавательных возможностей параллельно будет совершенствоваться и потенциал роботизации по эффективной обработке бизнес-процессов. А это всё в конечном итоге позволит их еще лучше оптимизировать и как следствие - сократить операционные расходы на их содержание.

Однако всё-таки не следует забывать и о существовании определённых рисков при интеграции машинного обучения и роботизации бизнес-процессов. В случае если, робот будет корректно запрограммирован на выполнение нужных действий при помощи апробированных методов RPA, можно быть абсолютно уверенным в точности выполнения роботизированного процесса. Однако если вы всё же рассчитываете на более широкие возможности программного робота, но объём предоставленных ему для анализа и «принятия решения» данных будет неполным, некорректным или недостаточно продуманным, то здесь нельзя полностью исключить возможность возникновения ошибок. Более того, при таких условиях они будут вполне закономерны. Впрочем, если в вашей команде разработчиков есть специалисты с соответствующими навыками, способные тщательно продумать и корректно применять учебные алгоритмы программирования, то таких рисков, бесспорно, можно избежать.

Поэтому выбор, несомненно, будет оставаться за вами: классическая роботизация бизнес-процессов или классическая роботизация, умноженная на возможности когнитивных технологий машинного обучения. Оба варианта способны открыть несравненно лучшие возможности для оптимизации бизнеса. Однако уже и сегодня совершенно очевидно, что будущее всё-таки будет за последней.

Человек vs робот: основные преимущества роботизации процессов

Современные технологии открывают всё новые возможности для оптимизации бизнес-процессов. Одним из таких мощных инструментов является их роботизация (Robotic Process Automation, RPA).

Перспективы её применения чрезвычайно широки ‒ в банковском секторе, финансах и аудите, страховании, сфере услуг, фармацевтике и др. Везде, где сотрудники вынуждены тратить значительную часть своего рабочего времени на осуществление кропотливых “механических” действий в то время, как могли его посвятить более творческой и интеллектуальной работе.

Роботизация станет просто находкой там, где существует много ручных, рутинных, прогнозируемых и повторяемых изо дня в день задач и процессов. И чем больше таких процессов в организации, чем обоснованнее решение их роботизации, тем больше у программных роботов шансов продемонстрировать свою эффективность, тем меньше будет рисков, связанных с возникновением ошибок, и тем скорейшей окупаемости (ROI) можно ожидать от RPA.

При качественном внедрении роботизации программные роботы органически интегрируются с уже существующими корпоративными системами, в том числе и с системами электронного документооборота. В предыдущем блоге именно эта темы и была затронута. Сегодня же детальнее рассмотрим основные особенности роботизации бизнес-процессов в их сопоставлении с процессами, которые человек совершает вручную. Попробуем сформулировать несколько основных характеристик, которые отличают технологию роботизации и дают ей значительные конкурентные преимущества.

Для более наглядного понимания небольшое видео, где на уровне интерфейса пользователя видны в сравнении действия человека и программного робота, которые осуществляют тот же процесс, часто встречающийся во многих организациях, которые имеют дело с обработкой счетов-фактур (загрузка данных, их считывание и внесение в корпоративные системы, формирование отчёта о выполненных операциях):

Скорость
Первая характеристика, которая сразу же бросается в глаза, ‒ неоспоримое преимущество программного робота в скорости осуществления процессов. Как видим, те же операции, которые человек осуществляет вручную за 12 мин. 5 сек., программный робот выполняет почти в 6 раз быстрее ‒ всего за 2 мин. 16 сек. И тут речь идёт только об одном небольшом процессе с ограниченным количеством входных данных, а таких процессов может быть в организации множество, и объём их будет значительно бóльшим. К тому же, программного робота можно запрограммировать на осуществление подобных операций на протяжении 24 часов в сутки и 7 дней в неделю. И тут мы переходим к следующему, не менее важному преимуществу программного робота ‒ его способности выполнять заданные операции непрерывно.

Непрерывность
Вне сомнений, человек ‒ не робот. Физиология диктует потребность сна, отдыха и банального обеденного перерыва. Сотруднику также социально гарантируются лимитированный рабочий день, отпуск, выходные и праздничные дни. Программный же робот может осуществлять свои функции непрерывно ‒ 24/7 в соответствии с теми операциями, на которые запрограммирован. И в этом его несомненное преимущество для обеспечения эффективности и непрерывности бизнес-процессов с целью более оперативной обработки запросов и улучшения обслуживания клиентов.

Минимизация ошибок
Согласитесь, человеку свойственно ошибаться. Человеческий фактор никто никогда не сбрасывал со счетов: усталость, психологическое состояние, состояние здоровья так или иначе влияли и будут влиять на качество человеческой работы. А если к этому добавить ещё и множественные отвлекающие производственные факторы, такие как работа в open space офисах, телефонные звонки, срочные совещания, проверка электронной почты и соцсети, то вопрос «откуда берутся ошибки?» будет не таким уже и риторическим.

Исследования психологов также дополнительно подтверждают тот печальный факт, что вероятность ошибки значительно возрастает, когда человек исполняет однообразную, механическую и неинтересную работу. И тут у программного робота, у которого полностью отсутствуют эти ситуативные характеристики, представляется случай ещё раз засвидетельствовать свой приоритет: он абсолютно равнодушен к перепадам настроения или погоды, времени суток или потребности отдыха после насыщенной трудовой недели. Он не будет отвлекаться на проверку многочисленных мессенджеров или телефонные звонки, а сосредоточенно будет исполнять свою работу, на которую, собственно говоря, и запрограммирован. Таким образом, ещё одним преимуществом программных роботов является отсутствие либо сведение к минимуму ошибок, которых невозможно избежать, когда в действие вступает человеческий фактор.

Человек vs робот: конкуренция или слаженное сотрудничество?
Если брать сугубо статистические сравнения, может сложиться впечатление, что человек неизбежно проигрывает роботам в оперативности и эффективности. Однако означает ли это, что роботы полностью заменят человека (в контексте рассматриваемой темы), вытеснят его с рабочего места или и вовсе лишат работы?

Отнюдь нет. На практике редко бывает, что все 100% рабочего времени сотрудника заняты с описанными выше процессами. Намного важнее то, что роботизация высвободит для человека время и усилия, необходимые для решения более сложных, нестандартных и креативных задач, связанных с анализом ситуации и принятием решений. А это в целом принесёт бóльшие выгоды для организации, поднимет удовлетворенность сотрудников и снизит текучесть кадров по причине перегруженности скучной и неинтересной механической работой.

Поэтому не стоит противопоставлять человека и программного робота по принципу «либо-либо»: каждый из них сможет лучше себя проявить в своем: рутинная однообразная работа для роботов, творчество ‒ для человека. Эффективность роботизации бизнес-процессов наилучшим образом покажет себя там, где будут обеспечены благоприятные условия для их слаженного и результативного сотрудничества.

Роботизация процессов документооборота: новый взгляд на борьбу с рутиной в офисе

Автоматизация бизнес-процессов и внедрение систем электронного документооборота уже давно стали обычной повседневностью. Утихли даже дискуссии на тему целесообразно или нецелесообразно их внедрять, особенно когда речь идет о крупных предприятиях, где документы продуцируются в больших количествах ежедневно.

Компании, которые ввели у себя электронный документооборот, уже имели возможность ощутить все неоспоримые преимущества и удобства этого способа обмена документами и вряд ли согласились бы сегодня вернуться к традиционным бумажным носителям. В тех же организациях, которые еще только решаются перейти на СЭД, колебания появляются преимущественно на этапе выбора наиболее подходящей для них системы среди имеющихся на рынке.

Функционал многих современных СЭД выверен многолетней практикой шлифовки и совершенствования в соответствии с конкретными потребностями конечных потребителей. Практически все системы имеют свою устоявшуюся структуру, набор шаблонов и функциональных возможностей, равно как и свои преимущества и недостатки. Казалось бы, сейчас СЭД достигли верхней границы своих возможностей и обречены только на совершенствование удобства и простоты для пользователей.

Однако с появлением в информационном мире таких новых технологий, как роботизация бизнес-процессов (Robotic Process Automation, RPA), машинное обучение (Machine Learning, ML), применения в программировании элементов искусственного интеллекта (Artificial Intelligence, AI) и совершенствования технологий OCR (Optical Character Recognition) даже старый добрый электронный документооборот имеет все шансы получить «второе дыхание» и кардинально новый виток развития. Современные технологии уже позволяют интегрировать программного работа в СЭД с тем, чтобы последний принял на себя часть рутинных механических действий с документом, которые до этого выполнял человек.

Для более наглядного понимания, как технология роботизации бизнес-процессов может усилить и улучшить имеющуюся функциональность систем электронного документооборота, предлагаем рассмотреть следующий пример (бизнес-кейс) — обработка входящей документации, ее утверждение и архивирование.

Как выглядит процесс использования человеческого ресурса в классической схеме СЭД?

Действия сотрудника-человека:

  • Сотрудник соответствующего структурного подразделения (далее — сотрудник) получает по электронной почте данные в виде сканированного документа.

  • Сотрудник обрабатывает входящие электронные сообщения, сохраняя документы в соответствующих (временных) электронных каталогах.

  • Сотрудник по очереди открывает документы и вносит из них данные во внутренние системы для дальнейшей обработки документов или данных из них в СЭД.

Автоматизированные действия в СЭД:

  • Инициированные сотрудником документы автоматически рассылаются на согласование, утверждение и проверку соответствующим уполномоченным лицам с наложением необходимых резолюций.

  • После обработки и утверждения документы размещаются в соответствии с заданными регламентами в архиве.

Во время обработки документов, как правило, возникают случаи, когда в документах отсутствуют данные или любая другая ключевая информация, без которой невозможна их дальнейшая обработка. Поэтому на этом этапе сотрудник идентифицирует, какой информации не хватает, и выполняет соответствующий запрос путем направления электронного почтового сообщения на контрагента / клиента / партнера с целью получения необходимой информации, чтобы завершить инициированный процесс.

Как же может выглядеть такой процесс без привлечения человеческого ресурса, только с использованием технологии роботизации бизнес-процессов и СЭД?

Все очень просто! Конфигурируется программный робот, интегрированный в СЭД, который способен выполнить вышеперечисленные действия, совершаемые работником за пределами системы электронного документооборота.

С наглядным, очень подобным к приведенному сценарию, примером работы программного робота в СЭД можно ознакомиться здесь:

Таким образом, вопрос заключается не столько в том внедрять или не внедрять автоматизированные решения для организации документооборота. Речь идет о получении наибольших инновационных выгод от этого процесса, которые сегодня открывают современные технологии роботизации. На СЭД нужно взглянуть сейчас под несколько иным ракурсом — с точки зрения неоспоримых и даже двойных выгод от их интеграции с возможностями программных роботов. По сравнению с классическими версиями электронного документооборота такие роботизированные СЭД имеют сегодня неоспоримые конкурентные преимущества.

Роботизация бизнес-процессов: технологические ловушки в проектах

Можно найти множество стратегических рекомендаций к вопросу о том, как структурировать программы по роботизации бизнес-процессов для достижения наибольшей эффективности.

В частности, как строить структуру функционирования RPA, формировать и развивать компетенции по роботизации, определять и устанавливать роли и обязательства в рамках RPA-проектов, усиливать функцию управления изменениями при развертывании проектов по роботизации бизнес-процессов, применять Lean- и Agile-подходы в RPA и др. Однако не так часто приходится слышать про технологические ловушки в RPA-проектах, в которые может попасть любая проектная команда, и подходы, которые помогли бы направить RPA-проект в правильное русло.

Именно поэтому очень важно обозначить ключевые технологические моменты, с которыми может столкнуться команда разработчиков во время развертывания RPA. Приведенный ниже перечень, конечно же, далеко не полный, поскольку много вопросов появится в процессе работы — в зависимости от специфики среды, в которой вы будете работать, а также технологий и платформ, использованных в RPA-проекте. Самые распространенные технологические моменты, на которые следует обратить внимание, можно свести к следующим пяти позициям:

  • Стандарты и принципы кодирования RPA. Независимо от того, какую RPA-платформу вы будете использовать или насколько велика ваша команда разработчиков, очень важно изначально согласовать в рамках последней стандарты и принципы кодирования для обеспечения точности кода вашего программного робота. Здесь мы не сделаем открытие в мире программирования, поскольку это довольно стандартный подход, который достаточно давно используется в мировой практике автоматизации процессов и инжиниринга. Учитывая тот факт, что создание программного робота является также частью автоматизации, соответственно, все базовые принципы, которые применяются для классической автоматизации, также должны использоваться для роботизации процессов. А именно: принцип «не повторяй себя» (Don’t Repeat Yourself, DRY), общие соглашения о наименовании (naming conventions), наименовании переменных (naming variables), комментирование (commenting), портативность (portability) и др.

  • Методы программирования RPA. Существует два ключевых метода для создания робота бизнес-процессов: метод программирования на уровне интерфейса пользователя (UI) и программный метод (background). Прежде чем создавать структуру и карту процесса робота, следует определиться, какой метод программирования будет применяться для конкретного процесса. Выбор наиболее подходящего метода будет зависеть от RPA-платформы и возможностей используемых сторонних приложений, от процессов и особенностей среды, а также от видения конечным потребителем способа обработки данных программным роботом: на программном уровне или же на уровне интерфейса пользователя.

  • Непрерывность процесса RPA. Что может быть хуже, чем потерять все ваши наработки по созданию кода именно тогда, когда нужно перенести роботизированный процесс из тестовой среды в продуктивную? Действительно, очень досадно сознавать, что созданный код потерян из-за неэффективной настройки резервного копирования данных. Среда разработки RPA должна быть настроена таким образом, чтобы гарантировать 100% доступность и целостность данных исходного кода для обеспечения непрерывности процессов в течение всего RPA-проекта. Буквально говоря, когда ваша проектная команда разрабатывает программного робота, весь исходный код, который был помещен в репозиторий, должен сохраняться в дополнительном хранилище данных, которое резервируется в определенные отрезки времени (например, каждый час).

  • Система управления и контроля кода RPA. Система управления версиями (Version Control System, VCS), в частности SVN или Git, является основой любого проекта по разработке программного обеспечения, включая разработку программных роботов. Отсутствие этой системы, правильно интегрированной в ваш проект и в среду разработки RPA, может привести к нецелостности кода и, соответственно, низкому качеству результатов, а также потребует дополнительных усилий со стороны главного разработчика RPA по сведению промежуточных результатов работ разработчиков в единое целое. Поэтому, прежде чем начинать работы по разработке, во время настройки среды разработки RPA обязательно следует предусмотреть, чтобы в вашем центре управления RPA была надлежащим образом установлена система управления версиями.

  • Принципы переходного кода RPA. Не будет ничего удивительного в том, если клиент скажет вам на определенном этапе, что ваши среды — разработки, тестовая и продуктивная — являются разными. Для решения этой проблемы и с целью эффективного управления средами следует использовать конфигурационные файлы, где будут сохранены все необходимые отличия.

Перечисленные технологические моменты являются лишь частью айсберга, с которой один на один может столкнуться любой разработчик RPA. Чтобы быть уверенным, что ваш результат роботизации бизнес-процессов управляем, выполнен вовремя и качественно, в вашей проектной команде должны быть люди с соответствующими техническими навыками для обеспечения полноценного воплощения всех возможностей RPA.

Какой метод программирования выбрать для роботизации бизнес-процессов?

Разве не увлекательно наблюдать, как программный робот подражает действиям пользователей, в частности как осуществляет операции на уровне интерфейса пользователя так же, как это делает человек?

Бесспорно. Однако является ли это самым эффективным способом использования возможностей программных роботов? На этот вопрос нет однозначного ответа, особенно когда он адресуется разработчикам, которые привыкли применять программный метод автоматизации при создании ПО.

Что же в общих чертах означают упомянутые методы роботизации бизнес-процессов.

Программный метод автоматизации (background programming method): ваш программный робот способен обрабатывать операции / получать необходимые данные, используя прикладной программный интерфейс (Application Programming Interface, API) целевых приложений.

Автоматизация на уровне интерфейса (UI programming method): ваш программный робот может выполнять операции, считывать и обрабатывать массивы данных любых целевых приложений без фактического программного доступа к ним и осуществлять такие операции на уровне интерфейса пользователя.

Поскольку вопрос выбора метода программирования роботов является довольно актуальным для проектных команд, работающих над созданием программных роботов (TaskBot), думаю, будет полезно рассмотреть некоторые «за» и «против» этих двух методов, прежде чем садиться за алгоритмы работы такого робота.

Обработка процессов / данных на программном уровне

Преимущества:

  • эффективное использование возможностей программного робота: осуществление операций на программном уровне будет происходить намного быстрее (в 5-10 раз) по сравнению с теми же операциями, которые выполнялись бы роботом на уровне интерфейса пользователя;

  • меньшая вероятность ошибки / отказа программного робота, поскольку робот будет осуществлять операции, используя API, и в случае внесения незначительных изменений в интерфейс пользователя это не повлияет на его работоспособность;

  • программный метод предоставляет бóльшие возможности для разработчиков RPA предусматривать и, соответственно, минимизировать случаи возможных ошибок.

Недостатки:

  • ограниченная визуализация для бизнес-пользователей, так как программный робот осуществляет операции на программном уровне и, соответственно, некоторые операции / шаги процесса не видимы для них. К тому же пользователю понадобится некоторое время, чтобы понять причины остановки или отказа программного робота и перевести логику программирования на доступный для человеческого понимания язык;

  • дополнительные затраты времени и трудоемкость: разработчику RPA, безусловно, понадобится больше времени, чтобы понять логику бизнес-процесса (сложные расчеты, принципы калькуляции и сверки данных) с целью корректного программирования алгоритмов.

Ключевые моменты:

  • чтобы применить программный метод автоматизации для создания роботов, вам потребуется API целевых приложений;

  • преимуществом будет ваш предыдущий опыт по автоматизации бизнес-процессов / написанию скриптов;

  • для единичных целей вам на самом деле не потребуется использовать платформу RPA уровня enterprise для создания программного робота, поскольку это стандартный метод автоматизации бизнес-процессов / написания скриптов.

Обработка процессов / данных на уровне интерфейса пользователя Преимущества:

  • бóльшая визуализация для бизнес-пользователей, поскольку они могут видеть, как и что выполняет / обрабатывает программный робот на каждом шаге процесса. Соответственно, этот метод предоставляет бóльшие возможности оперативно отключить / свернуть программного робота и вернуть операции (действия) пользователю, когда это необходимо / в нештатных ситуациях;

  • экономия времени и усилий: как разработчику RPA вам не понадобится вникать во всех деталях в логику бизнес-процесса для программирования робота; достаточно будет просто имитировать действия пользователя.

Недостатки:

  • неэффективное использование возможностей программного робота: осуществление операций на уровне интерфейса пользователя будет длиться намного дольше по сравнению с осуществлением роботом тех же операций на программном уровне;

  • более высокая вероятность ошибок / отказов программного робота: в случае незначительных изменений на уровне интерфейса пользователя (расположение кнопки, изменение шрифта, дизайна и др.) программный робот, вероятно, не сможет осуществить необходимые операции.

Ключевые моменты:

  • если программный робот требует взаимодействия с некоторыми приложениями, встроенными в ваши целевые приложения, или же если нужно передать результаты в определенный шаблон приложения, в котором робот работал, следует применить программирование на уровне интерфейса пользователя, чтобы упростить передачу;

  • метод программирования на уровне интерфейса пользователя полезен, когда у вас возникают трудности с доступом к вашим целевым приложениям через API или API не доступен как таковой;

  • некоторые платформы по RPA уровня enterprise не поддерживают метод программирования на background’е, поэтому UI-метод является в данном случае единственно возможным.

Соответственно, если возникнет вопрос, какой метод выбрать для создания программного робота в контексте вашего RPA-проекта, выбор полностью будет зависеть от ваших процессов и особенностей вашей среды, равно как и от навыков разработчиков RPA.

Роботизация бизнес-процессов: Как программные роботы будут выглядеть через 3-5 лет?

Еще не так давно мы спрашивали себя, что такое роботизация бизнес-процессов (Robotic Process Automation, RPA) и какую пользу может получить бизнес от внедрения этой технологии? Мало кто ожидал, что RPA будет развиваться столь стремительно, проникая в разные сферы бизнеса. И при этом многие из нас будут иметь опыт использования возможностей RPA наряду с искусственным интеллектом (Artificial Intelligence, AI).

После успешных пилотов и развертывания RPA, возникли вполне ожидаемые вопросы: какое будущее ждет эту технологию, и как программные роботы будут выглядеть через 3-5 лет? Будет ли эта технология развиваться в дальнейшем или же это лишь временное явление?

Как и в случае с любой новой технологией, много проектов по RPA потерпели неудачу, а ожидания относительно уменьшения затрат после внедрения удачных решений не всегда оправдывались. В результате этого некоторые компании, кто подключился к процессу на ранней фазе, отказались от активного использования RPA. Почему не все преуспели в этом направлении — это отдельная довольно объёмная тема, которой можно посвятить отдельную публикацию.

Тот же, кто имел позитивный опыт использования RPA, бесспорно подтвердит, что эта мощная технология существенно повышает операционную эффективность, если она применена с соблюдением всех необходимых правил. Не ошибусь, если скажу, что искусственный интеллект (Artificial Intelligence, AI), машинное обучение (Machine Learning, ML) и бизнес-аналитика (Business Intelligence, BI) станут составными частями RPA в ближайшем будущем, что позволит бизнесу достичь еще большей операционной эффективности.

В частности уже совершенно очевидно, что использование АІ:

  • позволит структурировать неструктурированные массивы информации, которые будут служить входными данными для программных роботов, обрабатывающих транзакции;

  • поможет роботам принимать решения, чтобы те были способны обрабатывать процессы от начала и до конца без вмешательства человека;

  • упростит поиск оптимальных вариантов, когда речь идет о более сложных задачах с необходимостью принятия решения и требуется оценка различных критериев, которые обрабатываются другим типом АІ (например работа с текстом на естественном языке).

Вопрос лишь в том, как быстро все это станет реальностью и какие навыки роботов нужно развивать в первую очередь, чтобы сделать их более интеллектуальными и способными действовать так же, как люди. Ниже приведу достаточно гипотетическое, осторожное в оценках, но вместе с тем вполне реалистичное видение эволюции программных роботов в некоторой перспективе. Однако все мы понимаем, что преобразования программного обеспечения в машину с когнитивными навыками и возможностями может произойти даже раньше прогнозируемых сроков, поскольку технологии AI, ML и BI сегодня развиваются очень быстро.

Временные рамки эволюции программного робота:

  • Через 1 год: роботы смогут распознавать изображения с высокой точностью (рукописный текст, лица, фотографии) и обрабатывать задачи, требующие самостоятельного принятия несложных решений;

  • Через 2 года: роботы будут в состоянии распознавать человеческую речь и решать простые задачи, основываясь на голосовых инструкциях со стороны человека; получать возможность обрабатывать задачи, требующие самостоятельного принятия решений на основе анализа различных критериев;

  • Через 3 года: роботы смогут делать прогнозы, основываясь на шаблонных данных, обрабатывать непредвиденные алгоритмом исключения из правил, принимать решения и совершать действия, основанные на неизвестных им сценариях.

Очевидно, что имеющийся потенциал АІ, надлежащим образом интегрированный с программными работами, делает будущее RPA очень многообещающим и бесспорно выведет бизнес на новый уровень операционной эффективности. АІ, ML и BI позволят автоматизировать с помощью роботизации еще много процессов, включая и те, которые требуют принятия решений, суждений, обработки нетривиальных сценариев и неструктурированных данных. Для компаний, которые хотят достичь значительного эффекта от RPA, очень важно уже сейчас распознать выгоды комбинирования этой технологи с различными типами АІ, ML, BI и когнитивных вычислений. Плюс к этому необходимо начать внедрять когнитивные технологии на ранней стадии развертывания RPA, чтобы достичь успеха и быть лидером на рынке.

 

Ukraine

 

  •  Home  •  Ринок  •  IТ-директор  •  CloudComputing  •  Hard  •  Soft  •  Мережі  •  Безпека  •  Наука  •  IoT