А у нас опять течёт документооборот...
Тринадцатая международная конференция-выставка Docflow-2007
Как объять необъятное?
Российская компания ABBYY уже 13-й год в конце мая проводит в Москве международную конференцию-выставку Docflow, посвящённую электронному документообороту и автоматизации управления. Состоялась она в конце мая в деловом центре гостиницы "Рэдиссон-Славянская" в Москве.
За 12 лет своего существования конференция-выставка Docflow стала крупнейшим событием на российском рынке электронного документооборота и автоматизации управления, традиционным местом встречи специалистов в сфере информационных технологий. Именно здесь можно узнать всё о новых продуктах, услышать доклады ведущих экспертов, лично пообщаться с авторитетными представителями отрасли и конкретного направления. Каждый год Docflow собирает наиболее заметных участников данного сегмента ИТ-рынка, а также тысячи ИТ-менеджеров, представителей крупнейших коммерческих компаний и государственных учреждений.
Вообще, 12 лет - солидный возраст для подобного мероприятия, тем более что организует и проводит его не специализированный выставочный оператор, а одна из российских ИТ-компаний. Если другие выставки за такой продолжительный период по большей части уже прекращают своё существование, то данный форум с каждым годом лишь набирает обороты.
Заметим, что посещение конференции-выставки Docflow-2007 бесплатное. Устроители выдвигают единственное условие: необходимо заранее зарегистрироваться на сайте компании ABBYY, чтобы организаторы могли знать примерное ожидаемое количество посетителей и подготовить соответствующий тираж информационных материалов (сборников и каталогов и пр.).
Традиционный формат Docflow - конференция плюс выставка. Это даёт возможность посетителям "из первых уст" узнать о новинках в подходах, последних достижениях в технике, системах и технологиях документооборота и тут же увидеть реализованные решения в действии на стендах компаний-участниц.
Все мероприятия, как и в последние 12 лет, проходили по очень жёсткому графику однодневного форума, в строгом соответствии с планом. Напряжённый сценарий конференции включал в себя все направления: секции, доклады, "круглый стол", выставку и консультации экспонентов, разместившихся теперь уже в трёх выставочных залах. И всё это необходимо было втиснуть в рамки лишь восьми рабочих часов. И опять же времени на часть разнообразных интересных мероприятий катастрофически не хватало. Приходилось разрываться между желанием "рысью обежать" по возможности б`ольшую часть стендов, посмотреть новинки, побеседовать с участниками и послушать интересующие нас доклады, проходившие параллельно в нескольких залах и секциях, либо присутствовать в пресс-центре, где проводились пресс-конференции ведущих фирм для представителей СМИ. Таким образом, понятно: одному человеку, скажем, представителю какой-либо организации, фирмы, да ещё пришедшему сюда в первый раз, получить более или менее адекватное представление было просто нереально, не говоря уже о том, чтобы охватить всё. Благо, организаторы всегда стараются снабдить пришедших основными сопроводительными материалами.
В плане плотности разнообразных мероприятий на единицу времени данный форум, по всей видимости, намного превосходит подобные. Компания ABBYY в этот раз признала, что такая ситуация не совсем нормальна. Поэтому, идя навстречу пожеланиям участников российского рынка документооборота, она планирует увеличить продолжительность Docflow-2008, продлив её до двух дней. И действительно, ограниченность выставочных и конференц-площадей уже не позволяет с комфортом разместить возросшее количество желающих посетить данный форум. В этом году Docflow уже заняла всё возможное пространство делового центра гостиницы "Рэдиссон-Славянская", тем не менее удовлетворить все заявки участников так и не удалось.
Секции по ИТ-интересам
Доклады, сообщения и выступления участников были распределены по тематическим секциям, проходившим параллельно в нескольких залах.
В секции "Комплексные платформы" были представлены доклады (10 выступлений), рассказывающие о функциональности комплексных платформ автоматизации, критериях выбора этих продуктов, о предлагаемых на их основе решениях и проектах по внедрению, осуществлённых на предприятиях различных отраслей.
Тематика выступлений (их было пять) и материалы секции "Потоковый ввод документов" призваны осветить все аспекты потокового ввода документов: функциональность и особенности эксплуатации высокопроизводительных сканеров и специализированных программных систем, опыт проектирования и реализации прикладных программно-аппаратных комплексов и т. п.
Наиболее обширная с точки зрения тематики секция - "Системы электронного документооборота (СЭД)". В ней были представлены доклады (21 выступление) разработчиков, дистрибьюторов и внедренцев СЭД, выступления и материалы о способах выбора, внедрения, эксплуатации и оценки эффективности функционирования СЭД.
"Средства управления бизнес-процессами (BPM)". Здесь были представлены обзорные и аналитические материалы (13 выступлений), посвящённые средствам описания и моделирования, а также инструментам автоматизации бизнес-процессов, системам класса workflow и т. д.
Доклады и сообщения секции "Электронные хранилища данных" были посвящены рассмотрению как готовых решений, предназначенных для организации хранилищ данных, так и отдельных компонентов хранилищ, различных накопителей и пр.
Кроме того, работали секции общего профиля: секция "Новости рынка" (18 выступлений), аналитическая секция "Документооборот от А до Я" (10 выступлений).
Наибольшую активность по количеству выступлений в разных секциях в этот раз продемонстрировали представители компании EMC Documentum (8 выступлений), второе место поделили Directum и "Летограф" - по 6 выступлений, а третье заняли ABBYY и DocsVision - по 5 выступлений.
Кроме этого был проведён "круглый стол" "Перспективы развития рынка управления документами в России в условиях глобализации мировой экономики", в котором приняли участие представители Мининформсвязи России, руководители некоторых ведущих компаний - участников форума и эксперты. Обсуждались изменение потребностей, исследование состояния и тенденций развития рынка, различие подходов в автоматизации документооборота в России и на Западе, взаимоотношения и позиционирование российских разработчиков и западных поставщиков в связи со вступлением России в ВТО, стандарты и законодательное регулирование в сфере управления документооборотом.
Спонсорами Docflow в 2007 году стали такие компании, как Directum (генеральный спонсор), TerraLink, "Летограф", "Промышленные информационные системы" и группа компаний "Радиус". Одним из постоянных информационных спонсоров данного форума является и наш журнал "Бухгалтер и компьютер".
Портрет посетителя
Общее количество посетителей в этот раз составило более 3200 человек. В рамках форума был проведён опрос среди посетителей выставки-конференции Docflow-2007. Как собирались и обрабатывались данные? В опросе приняли участие 743 респондента, заполнивших бумажные анкеты, которые затем были отсканированы с помощью потокового документного сканера (со скоростью около 20 страниц в минуту) и распознаны с помощью программы ABBYY FormReader. Весь процесс обработки анкет занял чуть менее 2 часов у одного оператора.
Как и ожидалось, основная доля (свыше 60 %) посетителей Docflow представляли компании среднего и крупного бизнеса. Это понятно: большинство субъектов малого предпринимательства сейчас волнуют более насущные проблемы, чем автоматизация своего документооборота. Довольно высок был процент посетителей из государственного сектора - 18 %, что, в общем-то, отражает изменения последнего времени в части реализации федеральной программы по автоматизации государственного сектора российской экономики, благо экономическая ситуация пока позволяет это делать.
Аудитория Docflow постоянно пополняется новыми слушателями, что свидетельствует о растущем интересе рынка к тематике СЭД и автоматизации управления. Так, в этом году ровно половина всех респондентов впервые посетили Docflow. Около четверти приходят на выставку во второй или третий раз. Старожилы Docflow, посетившие мероприятие более пяти раз, составляют около 12 %.
Сфера деятельности и положение на карьерной лестнице
К сфере ИТ-бизнеса себя причисляют 21 % респондентов, к госструктурам - 19 %, 13 % - к промышленному сектору, представителей прессы было около 11 % от всего числа опрошенных.
Большинство респондентов - непосредственные заказчики решений, представленных на выставке компаниями-участниками.
Что же до занимаемых "кресел" и позиций, то 36 % относятся к ИТ-департаментам (из них 23 % - сотрудники, а 13 % - руководители ИТ-департаментов). При этом более 42% респондентов - руководители разного ранга: организаций (4 %), отделов (26 %), ИТ-департаментов (около 13 %). Ещё 23 % называют себя специалистами в различных отраслях.
Как показывает статистика, на Docflow почти в равных долях представлены все категории бизнеса - малый, средний и крупный. Так, треть респондентов (34 %) - представители крупных компаний, где установлено свыше 500 компьютеров. По трети респондентов приходится на компании среднего масштаба (с парком ПК от 100 до 500 штук - 33 %) и малого бизнеса. Последняя треть подразделяется на компании, имеющие до 50 ПК (17 %), и на более крупные, где установлены от 50 до 100 ПК (16 %).
Профессиональные интересы
Подавляющее большинство посетителей Docflow-2007 (90%) интересуются темой документооборота и электронных архивов. На втором месте по популярности - автоматизация управления и ERP-систем (42 % опрошенных). Примерно так же популярны темы информационной безопасности и хранилищ данных и OLAP - за них высказались по 38 % опрошенных. Потоковый ввод данных интересует 30 % респондентов. Около 10 - 13 % назвали в числе интересующих их тем аппаратные средства и периферию, CRM и call-центры, а также продукты для бухгалтерии и финансового учёта.
Возраст и пол
Самая распространённая возрастная группа - 40 - 50 лет, на неё приходится почти треть всех посетителей конференции. Далее с небольшим отрывом следует категория 30 - 39 лет (22 % респондентов). Примерно одинаковым (разница составляет всего 1 %) было количество посетителей в возрасте старше 50 лет, 25 - 29 лет и младше 25 лет.
Женщин - 35 % от общего числа посетителей Docflow, 57 % из них пришли впервые. Мужчин - 65 % среди всех респондентов, 46 % из них - впервые на выставке.
Документы - в цифру
Постоянное развитие информационных технологий, оборудования, программного обеспечения и законодательной базы в перспективе рано или поздно позволит практически отказаться от бумажных документов, перейдя на документы электронные. Они будут действовать наравне с бумажными в полном соответствии с законодательными актами и процедурами, подтверждающими их статус и юридическую силу в течение всего жизненного цикла, от создания до уничтожения. В конечном счёте в обороте должна будет остаться мизерная доля документов на бумажном носителе. Правда, при нынешнем расцвете российской бюрократии и непомерном размножении популяции "бумажных человечков", основной пищей и лакомством которой являются разного рода "бумажки", эта "беда" (т. е. полный переход на электронные документы) России в скором времени не грозит. Как говорил поэт, "жаль только, что в эту пору прекрасную жить не придётся ни мне, ни тебе".
Закон единства и борьбы противоположностей тут проявляется так. С одной стороны, в постоянном изобретении чиновным людом запросов и требований от граждан, учреждений, организаций, предприятий и прочих структур всё большего количества разнообразных бумаг по любому поводу, вовлекающих в этот "не бизнес-процесс" всё больше народа и занимающих всё большее жизненное пространство. Иными словами, налицо рост "макулатурфактора", а заодно катастрофическое истребление лесов и ухудшение экологии. С другой стороны - в попытках занять или подчинить себе каждый метр пространства, в том числе и то, где эти бумаги должны храниться (помещения, здания, территории, даже земли) для сиюминутного извлечения прибыли. Поэтому другим гражданам для увеличения скорости "ответов" ничего прочего не остаётся, как осваивать информационно-компьютерные технологии и освобождать территорию, переводя тонны бумажных документов в цифровой вид и на компактные электронные носители.
Сегодня мы наблюдаем весьма бурное развитие аппаратных и программных средств, которые служат как бы мостиком между миром бумажных и электронных документов. Они нужны для преобразования бумажных документов в электронные образы, обработки этих образов для улучшения их качества, удаления ненужных деталей и фрагментов, перевода текстовых материалов из графического представления в собственно текстовое, структурирования с приведением в форму, нужную для конкретной целевой системы, и т. д.
Новинки оборудования
Как и в наших прошлых обзорах данного форума, посмотрим сначала на новинки под "техническим" углом.
Что касается оборудования, или "железа", то разработчики и производители достигли довольно высоких характеристик, позволяющих выполнять работы по переводу бумажных документов в электронные образы для весьма широкого спектра требований и условий применения. Поэтому приходится только сожалеть, что столь прекрасные воплощения конструкторской и инженерной мысли (к сожалению, заметим, не нашей) могут остаться не у дел в некоторой среднесрочной временн`ой перспективе, при переходе на электронную форму документов. Хотя научно-технический прогресс знал и не такие потери. Но, как мы поняли, эта эра у нас наступит ещё не скоро и приобретённое сегодня оборудование вполне успеет себя окупить.
В разделе оборудования на Docflow-2007 обратили на себя внимание компании, уже не первый раз участвующие в этой выставке и представившие лучшие образцы для оцифровки документов: ALEE Software, "ПИРИТ" и "Электронный архив (ЭЛАР)".
Сканеры от "ПИРИТ"
На выставочном стенде этой компании обычно бывает представлено много моделей сканеров. В этот раз были показаны новые модели поточных сканеров от ведущих мировых производителей: Canon, Fujitsu и Kodak.
Из сканеров начального уровня был продемонстрирован самый оптимальный по соотношению цена/качество односторонний планшетно-протяжной сканер Canon DR 1210C. Отличительной особенностью этой модели является скорость 12 страниц в минуту при цветном, сером и чёрно-белом режимах сканирования при разрешении 300 dpi. Максимальное разрешение сканера составляет 600 dpi, он может обрабатывать документы до формата А4 с рекомендуемой ежедневной нагрузкой до 400 листов. Автоподатчик сканера вмещает 50 листов.
Другая модель начального уровня от фирмы Fujitsu - ScanSnap S500, цветной двухсторонний сканер, который позволяет распознавать полученные изображения и сохранять их в виде индексированных файлов в формате Searchable PDF, позволяющем производить их дальнейший автоматический поиск. Ещё одной полезной функцией этого сканера является автоматическое определение цветности документов. Аппарат позволяет сканировать документы до формата А4, но при помощи специального прозрачного конверта можно сканировать и материалы большего формата, А3, предварительно сложив их пополам. Скорость сканирования в чёрно-белом и цветном режиме - 18 страниц в минуту, максимальное разрешение - 600 dpi. Рекомендуемая дневная нагрузка - до 1000 листов.
"ПИРИТ" также продемонстрировала новинку от компании Kodak - документный сканер Kodak i1320. Этот аппарат имеет абсолютно прямой путь прохода документов, что позволяет помимо обычных листов сканировать очень плотные оригиналы. Захват и отделение листов при подаче производится с помощью роликов, что обеспечивает работу с любыми типами документов разного качества и плотности. У сканера Kodak i1320 есть, кроме того, опциональный планшет, который подключается к нему с помощью двухметрового кабеля. Это позволяет разместить его в наиболее удобном для работы месте, причём на планшете документы можно сканировать с повышенным разрешением - до 1200 dpi. Аппарат оснащён регулируемыми податчиками, которые устанавливаются с удобным для оператора наклоном. Новый драйвер сканера дополнен такими функциями, как автоматическая ориентация текста, автоопределение цветности, сглаживание цветного фона документов, автоматическая настройка яркости и контрастности, выравнивание полученных изображений. Скорость сканирования документов формата А4 составляет 60 страниц в минуту. Максимальное разрешение при сканировании через протяжной тракт - 600 dpi. Рекомендуемая ежедневная нагрузка - до 3000 листов.
Из последних новинок от фирмы Canon был представлен документный двухсторонний сканер формата А4 Canon DR 4010C. Исключительная компактность этой модели в сочетании с отличным качеством изображения и высокой скоростью цветного сканирования - 42 страницы в минуту - делает этот сканер одним из наиболее привлекательных в своём классе. Встроенная функция автоматического определения цвета позволяет различать цветные и чёрно-белые страницы и сканировать их с соответствующими автоматическими настройками. Благодаря этому можно быстро и с высокой точностью сканировать за один раз документы, содержащие и цветные, и чёрно-белые страницы, без необходимости их предварительного разделения. Модель DR-4010C оснащена новым механизмом защиты от пыли, устраняющим случайное прилипание частиц бумажной пыли к защитной панели, проблему, с которой сталкиваются пользователи многих других систем. Это исключает возможность появления нежелательных тёмных линий (точек, пятен) на изображениях. Поэтому не требуется периодически очищать панель защиты от пыли для поддержания постоянного качества изображений.
Наличие различных удобных режимов работы в сканере Canon DR 4010C позволяет сделать сканируемый текст более удобочитаемым, используя разработанные Canon технологии повышения качества текста. Сканер может с успехом обрабатывать документы с фигурным фоном, светлым текстом (например, написанным карандашом) на светлом фоне или фоном с полутонами. При сканировании документов на тонкой бумаге, делающей заметным изображение на оборотной стороне листа, можно выбрать специальную функцию предотвращения просвечивания оборотной стороны на сканируемом изображении. Модель DR-4010C оснащена особой функцией, позволяющей сканировать документы длиной до 1000 мм. Возможность выбора между U-образным и прямым путём прохода документов позволяет использовать Canon DR 4010C для решения широкого спектра задач.
Максимальное разрешение модели Canon DR 4010C - 600 dpi, рекомендуемая ежедневная нагрузка - 5000 листов.
Модель Fujitsu fi-5750 формата А3 - двусторонний сканер оригинальной конструкции: его автоподатчик способен вращаться вокруг вертикальной оси на 180.. Оператор может повернуть его для удобства работы по своему усмотрению, обеспечив левую, правую или центральную подачу документов. Аппарат ориентирован на работу с большими объёмами документов: рекомендуемая нагрузка составляет 8000 листов в день. Скорость сканирования в цветном и монохромном режиме при разрешении 200 dpi высока - 72 страницы в минуту. Максимальное разрешение составляет 600 dpi, однако скорость сканирования при таком разрешении падает до 30 страниц в минуту.
Среди дополнительных возможностей сканера Fujitsu fi-5750 следует упомянуть автоматическое определение формата листа при сканировании пачки документов различных размеров, определение двойной подачи, автоматическое выравнивание перекосившихся листов. Мощный механизм автоподачи позволяет сканировать документы широкого диапазона плотностей, от 41 до 203 г/кв. м. Автоподатчик вмещает 200 листов.
Сканер Fujitsu fi-5900 - самый высокопроизводительный из всей линейки скоростных сканеров Fujitsu. Надёжная система захвата листа по всей ширине подающего лотка, исключающая замятие документов, система предотвращения скручивания отсканированных листов, система предупреждения застревания бумаги, многоуровневая система предотвращения двойного захвата с ультразвуковыми датчиками, подстройка размеров подающего лотка под размер пачки документов, увеличенный срок службы заменяемых элементов - вот основные черты этого аппарата. Сканер двухсторонний, позволяет обрабатывать документы до размера А3 со скоростью сканирования 120 страниц в минуту при разрешении 200 dpi. Максимальное разрешение составляет 400 dpi. Автоподатчик сканера вмещает 500 листов. Рекомендуемая ежедневная нагрузка составляет 100 000 листов (!). Интересно, каков общий ресурс этого японского чуда техники...
ЭЛАР. Серия "С"
На стенде корпорации "Электронный архив" был продемонстрирован новый мощный и универсальный сканер "ЭЛАР ПланСкан" серии "С". Эта новинка предназначена для сканирования любых сброшюрованных документов и папок (книг), в том числе сложных для сканирования: полупрозрачных, глянцевых оригиналов, документов с металлическим тиснением, крупноформатных оригиналов до формата А2, а также ветхих или повреждённых документов.
Сканер "ЭЛАР ПланСкан" серии "С" представляет собой высокотехнологичный комплекс последнего поколения. Это полнофункциональный центр сканирования в едином корпусе. Он сочетает в себе высокое разрешение, скорость сканирования и качество получаемых электронных образов, а также возможность легко интегрироваться в любую корпоративную информационную систему.
К конкурентным преимуществам этого полнофункционального центра сканирования относятся: бесконтактное сканирование со скоростью 2,5 секунды на разворот чёрно-белого документа формата А3, полное отсутствие воздействия инфракрасного и ультрафиолетового излучения на оригинал, контроль процесса сканирования в реальном времени, аппаратное улучшение качества изображений, а также наличие встроенной рабочей станции с русскоязычным программным управлением.
Сканер способен автоматически определять формат документа, помещённого на стол для сканирования, а также его расположение относительно стола. При оцифровке сшитых папок, книг, ветхих и архивных документов возможно сканирование оригиналов толщиной до 20 сантиметров при полном исключении возможности повреждения. Для лучшей сохранности обрабатываемых книг возможно их сканирование с неполным углом раскрытия.
Параметры сканера "ЭЛАР ПланСкан" серии "С" позволяют производить обработку конструкторской документации, характеризующейся большими форматами. При этом возможна оцифровка синек и калек. Не является препятствием для оцифровки и форма хранения документов: проектно-сметная документация может быть сшита, чертежи могут храниться в рулонах.
Оптическое разрешение сканера составляет 300 dpi при разных режимах сканирования: чёрно-белом, 256 градациях серого или цветном.
Сканер может комплектоваться прижимным стеклом с системой автоматического подъёма и фиксации.
ATIZ в ALEE
Компания ALEE Software представила на своём стенде сканер ATIZ BookDrive DIY, оригинальный по конструкции и весьма привлекательный по цене. Преобразователями графического изображения документа в цифровой вид в нём служат две одинаковые цифровые зеркальные фотокамеры Canon, имеющие объективы повышенной резкости с неизменяемым фокусным расстоянием.
Сброшюрованный документ, подлежащий оцифровке, помещается в колыбель, при этом каждый фотоаппарат, смонтированный на своём наклонном штативе, фотографирует свою страницу.
Известно, что при перелистывании книги или брошюры центр переплёта постепенно смещается. Чтобы избежать смещения и соответствующих перенастроек, колыбель выполнена на плавающем основании, что позволяет центрировать документ по мере переворачивания страниц. После очередного переворачивания страниц документ фиксируется в колыбели V-образным прижимным высококачественным стеклом, которое при смещении колыбели остаётся неподвижным, сохраняя неизменность положения центра переплёта.
Страницы на электронных образах выходят плоскими и не нуждаются в компенсации искривлений, обычно получающихся при сканировании изображения сброшюрованного документа в вертикальном направлении, как это делается на сканерах.
Заявленная производителем скорость сканирования может достигать 1800 листов в час при высоком качестве получаемого изображения.
В соответствии с решаемыми задачами пользователь выбирает для комплектации сканера ту или иную модель фотоаппарата из модельного ряда Canon, от старших моделей до младших. Выбор объектива для фотокамер - также в руках пользователя: от качества и стоимости сменного объектива зависит и качество получаемого изображения, в частности максимально достижимая резкость, глубина резкости, минимизация сферических и хроматических аберраций.
Сканер поставляется с программным обеспечением: BookDrive Capture, управляющим работой фотокамер, и BookDrive Editor, редактирующим полученные электронные образы документа. При редактировании выполняется автокоррекция цвета, вращение изображения, автокорекция яркости и контрастности, обрезка страниц, очистка изображения от "мусора", изменение размера.
Отсканированный материал может быть сохранён в форматах JPEG, TIFF и PDF.
Обработка от ABBYY
Продукт ABBYY FlexiCapture не первый год на слуху у специалистов по системам электронного документооборота. Он позволяет решать задачи обработки документов в секторе финансовых и банковских услуг, в страховании, образовании, здравоохранении, бухгалтерском учёте, юриспруденции и других отраслях экономики. Это универсальное решение для массового ввода и обработки счетов-фактур, накладных, резюме, договоров и других распространённых типов бумажных документов.
Компания ABBYY анонсировала новую версию этого продукта - ABBYY FlexiCapture 8.0 Professional, первая демонстрация которой состоялась здесь же, на Docflow-2007.
Новая версия продукта работает с различными типами документов в едином потоке, без предварительной ручной сортировки, и позволяет не вводить данные вручную.
Классификация документов и извлечение данных реализованы на основе технологии интеллектуального распознавания документов IDR (Intelligent Document Recognition). В процессе обработки задействованы заслужившие признание технологии ABBYY для распознавания печатного и рукопечатного текста, штрихкодов, а также меток и галочек, которые могут часто присутствовать в бланках и формулярах.
ABBYY FlexiCapture 8.0 Professional - это система потокового ввода документов и извлечения данных с единой точкой входа. Единая точка входа означает, что в общем потоке могут вводиться разнородные документы без предварительной сортировки: договоры, счета-фактуры, накладные и пр. При этом документы могут быть как на материальном носителе, так и в электронном виде.
В системе сначала производится сортировка по типу, потом выполняется атрибутирование и извлечение информации из каждого документа в соответствии с его типом. Если это счёт-фактура, то извлекается информация о контрагенте и поставляемом товаре; если договор, то извлекаются его реквизиты и реквизиты контрагентов и т. д.
В процессе обработки документы подвергаются сканированию, распознаванию, верификации и передаче в нужную подсистему хранения или документооборота.
Сканированию подлежат документы на материальном носителе - бумаге, плёнке и т. п. Для него системой могут использоваться практически любые типы сканеров. Если обрабатываемые документы одностраничные, то проблем при отделении одного электронного образа от другого не возникает. В случае многостраничных документов система может разделять их по белым листам, вкладываемым между ними, или по надпечатываемым штрихкодам.
Следует заметить, что в процессе обработки документов на материальном носителе есть ещё и такие ручные технологические операции, как расшивка сшитых многостраничных документов, прокладка разделителей между ними, надпечатка реквизитов или штрихкода, сшивание расшитых документов, контроль за правильностью комплектации и сшивания и т. п.
Если на обработку подаётся документ в электронном виде, сканирования не требуется и процесс значительно ускоряется и упрощается. Для импорта могут использоваться документы в форматах PDF, BMP, PCX, PNG, JPEG, JPEG 2000, DCX и TIFF.
Для приёма электронных документов от разных пользователей формируется сетевой ресурс - "Горячая папка". Параметры этой папки настраиваются таким образом, что через заданное время из неё на обработку забирается заданное количество документов (например, по 10 документов каждые 3 минуты). Темп передачи на обработку должен соответствовать технологическим возможностям процесса в целом.
Распознавание - это стадия, следующая за сканированием. На ней выполняются предварительная обработка, выделение и объединение листов многостраничных документов и их классификация. Для тех документов, которые предполагается хранить в текстовом или числовом виде, производится распознавание текста. Если документ будет храниться как электронный графический образ, что тоже бывает довольно часто, то стадии распознавания текста не требуется.
На стадии распознавания важно, к какой группе относится документ. Он может быть структурированным, слабоструктурированным или неструктурированным. В зависимости от этого производятся настройка шаблонов для обработки и их применение.
Структурированный документ, или документ с фиксированной разметкой, разбит на фиксированные поля с данными, причём эти поля имеют жёсткую структуру и месторасположение в документе. Примером могут служить опросники, экзаменационные бланки ЕГЭ, декларации и пр.
Слабоструктурированные документы - это по сути своей формализованные документы, содержащие одинаковый набор полей, но эти поля на документе могут располагаться по-разному, в разных местах. Яркий пример - счёт-фактура. Этот документ формализован, содержит определённое количество полей. Но в зависимости от организации, его создавшей, заполнение полей и их расположение на листе могут быть различными. Например, в одной организации счёт-фактуру принято печатать горизонтально на листе А4, в другой - вертикально.
Неструктурированные документы - самый неудобный вид для автоматизированной обработки. Чаще всего они содержат текст, но могут быть и с графическими элементами или рисунками. Самый простой пример - договор. В нём есть определённые поля: название договора, номер, дата, реквизиты сторон и т. д., однако располагаться эти поля могут совершенно произвольно.
В соответствии с шаблонами система производит извлечение из документа графики, текста и данных. Подсистема распознавания текста OCR располагает более чем 190 языками, подсистема интеллектуального распознавания ICR использует более 90 языков. Кроме того, в FlexiCapture 8.0 Professional работает система распознавания маркеров OMR на структурированных документах. При извлечении текста и данных применяется автоматический контроль формата полей, производится нормализация дат и сумм и т. д.
На стадии верификации обеспечивается идентичность содержания документа в бумажном и электронном виде. На этой стадии, например, выявляются и исправляются ошибки распознавания меток и цифр, текстовых полей и пр. Кроме того, тут же выявляются и устраняются возможные ошибки в сборке многостраничных документов.
Система имеет удобный интерфейс для проверки результатов автоматической сборки и классификации документов: на экране отображается сразу несколько страниц.
Экспорт полученных данных из системы ABBYY FlexiCapture 8.0 Professional может выполняться в файлы, в базы данных, а также в различные автоматизированные системы (ERP, CRM, DMS и др.). Форматы, в которых может производиться экспорт данных: XML, TXT, XLS, DBF, CSV, DOC, RTF и PDF. Изображения могут экспортироваться в форматах PDF, PDF-A, TIFF, JPEG, JPEG 2000, PCX, BMP, PNG и DCX.
Система позволяет создавать бланки форм. Они могут выполняться цветными, растровыми и чёрно-белыми, одностраничными и многостраничными. Система производит проверку их машиночитаемости. Готовые формы либо распечатываются на принтере, либо выдаются в форматах, пригодных для тиражирования в типографии.
Редактор шаблонов для распознавания документов очень удобен. Если в предыдущих версиях программного продукта каждое поле шаблона надо было создавать вручную, то в версии 8.0 производится анализ исходного документа с поиском и автоматическим формированием полей.
ABBYY FlexiCapture 8.0 позволяет выполнять весь спектр работ по потоковому вводу данных на одном компьютере. Можно сказать, что поддержка распредёленной обработки задач на нескольких компьютерах в сети также не является проблемой. Распознавание документов быстрее будет выполняться в фоновом режиме на многопроцессорных и многоядерных компьютерах - система это позволяет. Она легко масштабируется и поддерживает распределённый ввод документов в локальной сети. Взаимодействие FlexiCapture 8.0 со сканерами, серверами и базами данных можно автоматизировать с помощью стандартных языков сценариев.
Внедрение ABBYY FlexiCapture решит задачи обработки бумажных документов оптимальным образом, сокращая трудозатраты и время обработки.
Системы "ЭОС"
Компания "Электронные офисные системы" - постоянный участник конференции Docflow. Основанная в 1994 году, она и сегодня является одним из лидеров на отечественном рынке систем электронного документооборота и делопроизводства. Системы "ЭОС" достаточно хорошо сочетают традиции и культуру российской школы делопроизводства и передовые западные методики управления документами.
Компания постоянно совершенствует свои продукты, развивая функционал, повышая комфортность и удобство их использования, совершенствуя информационную безопасность, а также разрабатывает новые программные продукты в соответствии с требованиями рынка: использование "тонкого клиента", интеграция с другими программными продуктами, решение сложных задач учёта и контроля.
В этом году на стенде "ЭОС" была представлена вся линейка продуктов: "ДЕЛО", "АРХИВНОЕ ДЕЛО", "КАДРЫ" и новейшие разработки компании.
Наиболее известная система "ДЕЛО" представляет собой промышленную систему автоматизации делопроизводства и электронного документооборота, обеспечивающую поддержку полного жизненного цикла: от разработки и согласования проектов документов до их списания. Система обеспечивает поддержку и автоматизацию как классического (бумажного) делопроизводства, так и переход к бумажно-электронному и полностью к электронному документообороту.
Имеется функция "Поточного сканирования" для организации массового перевода бумажных документов в электронный вид, погружение их в хранилище системы. Для оцифровки документов используется новейшее оборудование - универсальный полнофункциональный центр "ЭЛАР План-Скан-С", о возможностях которого мы рассказывали выше. Для полноценной работы с документами через интернет имеется интернет-интерфейс "ДЕЛО-Web".
В рамках выставочной программы Docflow состоялись презентации возможностей системы "ДЕЛО", в том числе был представлен новый криптографический комплекс "Юридически значимый документооборот". С его помощью система "ДЕЛО" позволяет придать юридическую значимость электронному документообороту любого масштаба. Электронная цифровая подпись (ЭЦП) при соблюдении требований российского законодательства юридически является аналогом собственноручной подписи, и документ, подписанный ЭЦП, приобретает полную юридическую силу. В системе осуществляется подписание и проверка ЭЦП файлов, прикреплённых к регистрационным карточкам документов, шифрование и подписание сообщений, передаваемых по электронной почте с использованием средств криптографической защиты информации.
На стенде "ЭОС" прошла серия презентаций интеграционного решения системы "ДЕЛО" с программами "1С". Совместное решение позволяет проводить в электронном виде согласование и подписание договоров, а также отслеживать обмен первичными бухгалтерскими документами, созданными в системе программ "1С".
Развитие средств информационной безопасности систем привело к созданию опции "Защищённый документооборот" для систем "Дело 8.9" и "Архивное дело 3.0". Последняя версия системы "Архивное дело 3.0" позволяет загружать архивные документы как из системы "ДЕЛО", так и из любых других систем документооборота или самостоятельно.
Представленная версия системы кадрового делопроизводства "Кадры 3.1" значительно расширила свои функциональные возможности по сравнению с предыдущей.
Здесь также демонстрировалась новая версия библиотеки электронных документов - система eDocLib 2.0, предназначенная для хранения, систематизации и коллективного доступа к электронным документам (данным, знаниям) организации и её подразделений. Эта система позволяет создавать и хранить множество произвольно структурированных информационных объектов с атрибутным составом, определяемым и изменяемым самими пользователями.
Генеральный директор "ЭОС" Владимир Баласанян принял участие в качестве эксперта в работе "круглого стола". Специалисты компании "ЭОС" выступили с несколькими докладами в разных секциях о новых возможностях линейки продуктов "ЭОС" и о перспективах их использования для документационного обеспечения управления (ДОУ) коммерческих и государственных организаций.
Посетители выставки смогли детально ознакомиться с представляемыми решениями, получить подробные консультации специалистов и задать уточняющие вопросы по итогам выступлений.
Продолжение следует