Задание 1. Системы электронного документооборота в экономике
1.1. Методы и средства автоматизации учрежденческой деятельности
Долгое время автоматизация учреждений в России осуществлялась в виде различного рода подсистем АСУ, основанных на базах данных (кадры, канцелярия, бухгалтерия, зарплата, контроль исполнения и др.) Не умоляя значимости этих подсистем, заметим, что они охватывали лишь до 15-20% общего объема информации, циркулирующей в учреждении.
Нужды по электронной обработке документов удовлетворялись применением функциональных пакетов (редакторов текста и электронных таблиц) и интегрированных пакетов программ Microsoft Office, Perfect Office, Lotus Smart Suite. Эти средства оказались недостаточными для управления огромными потоками бумажных и электронных документов, циркулирующих как внутри одного предприятия, так и между ними. В целом такой подход грешил отсутствием комплексности в автоматизации делопроизводства и управления документооборотом.
В настоящее время развитие информационных технологий привело к появлению методов и средств, обеспечивающих интегрированные решения по автоматизации офиса, позволяющие автоматизировать ручные операции и поиск документов, автоматически передавать и отслеживать перемещение документов и контролировать выполнение поручений, связанных с документами .
1.2. Методы автоматизации учреждений
Рассмотрим основные методы автоматизации учрежденческой деятельности. Современные организации представляют собой совокупность подразделений, филиалов, отделов и офисов, обменивающихся между собой информацией и выполняющих отдельные части общей работы. Основными фазами жизни неструктурированной информации в офисе являются :
• ввод информации в систему,
• хранение, навигация, поиск и фильтрация документов,
• коллективного работа с документами,
• вывод информации из системы.
Существуют различные способы ввода информации в систему. Это прежде всего сканирование документов и сохранение их в виде графических образов. В системах первого поколения графические образы введенных документов идентифицируются с помощью ключевых слов для последующего поиска необходимой информации (например: система SoftSolutions). Позднее стала применяться технология оптического распознавания символов OCR (Optical Character Recognition). После сканирования и ввода документа в систему его графический образ “переводится” в текст, затем следует исправление ошибок распознавания.
При массовом ручном вводе однотипных документов используются электронные формы, которые обеспечивают структуризацию документа путем выделения частей текста и добавления полей (атрибутов), что позволяет упростить заполнение документов и выполнить необходимые вычисления. Информация в офис может поступать и путем импорта файлов с магнитных носителей или по телекоммуникациям (факсы, сообщения электронной почты и т.п.).
Ввод информации сопровождается классификацией документов путем задания атрибутов и ключевых слов, аннотированием их содержания. Для ускорения последующего контекстного поиска производится полнотекстовое индексирование документов.
Важное значение для организации эффективного управления неструктурированными документами имеют методы хранения информации, навигации, поиска и фильтрации документов.
Документы могут храниться просто в файловой системе, и при этом система каталогов служит средством группирования и навигации в хранилище документов. В современных ОС типа Windows 95 есть возможность задания длинных имен каталогов и файлов в качестве названий папок и документов, а также имеются соответствующие средства поиска файлов по их параметрам.
Ряд систем, основанных на электронной почте, хранят документы в почтовых ящиках в виде почтовых сообщений с присоединенными файлами. Навигация в хранилище упрощается с помощью вложенных папок личного и коллективного пользования. Однако в таких системах поиск и фильтрация ограничены лишь отбором и сортировкой документов по атрибутам и тексту почтового сообщения.
Специфический метод хранения реализован в пакете Lotus Notes в виде так называемой базы документов. База документов может хранить как однотипную так и разнотипную информацию в виде одного файла. Документы допускают внутреннюю структуризацию на основе формуляров путем выделения и добавления полей в документе. Навигацию в базе документов упрощает наличие страниц баз документов и категорий документов. Почтовые сообщения также хранятся в виде базы документов, файлы произвольного вида допускается присоединять к текстовым документам.
Многие современные системы электронных документов используют в дополнение к файловой системе так называемые библиотеки документов, содержащие в БД карточки документов с атрибутами и ключевыми словами. Для логической группировки документов применяются папки.
Поиск и фильтрация документов производится по запросам на основе контекстного поиска: по атрибутам, по ключевым словам и по полному содержанию текста на основе индекса. При использовании механизма четкого поиска (например, DOCS OPEN) в запросе не должно быть орфографических ошибок, а в тексте документа - ошибок распознавания. При этом может морфологический разбор позволяет упростить
Недавно на основе нейронных сетей и искусственного интеллекта реализована технология нечеткого поиска по полному содержанию документа (например, технология адаптивного распознавания образов APRP в пакете Excalibur EFS). Нечеткий поиск не требует полного соответствия искомых фраз с содержимым документов, кроме того, исключает потребность в исправлении ошибок после распознавания текста. Система поиска всегда выдает пользователю ответ, наилучшим образом согласованный с терминами или фразами запроса.
Фирмы-производители реляционных СУБД (в частности ORACLE) проповедуют другие схемы хранения - текстовые и универсальные БД. Тексты документов хранятся в символьных полях переменной длины, расширенные средства SQL-поиска позволяют формировать смешанные запросы для поиска по атрибутам и контекстного поиска, а дополнительные функции обеспечивают обработку текста Для хранения произвольной информации, в том числе мультимедиа, можно использовать поля бинарных объектов большой длины BLOB и/или гипертекст. СУБД, расширенные для поиска и обработки такой информации, образуют универсальные сервера БД. Другой способ хранения документов произвольного содержания реализуют объектно-ориентированные БД (например, Informix Illustra).
Феномен распределенного гипертекста составляет основу широко внедряемой Web- технологии. Хранилище информации представляет собой совокупность гипертекстовых страниц, распределенных по узлам сети Internet или корпоративной сети (Intranet). Каждая страница размещается в отдельном файле и представляет собой текст, размеченный с помощью языка HTML. Структуризация документа осуществляется путем форматирования, выделения полей, создания форм для диалогового заполнения документа и организацией внутренних гипертекстовых ссылок. Допускается создание гипермедиа включением любой мультимедиа-информации (растровая графика, аудио, видео). Навигация по хранилищу гипертекста осуществляется с помощью внешних гипертекстовых ссылок URL на документы, расположенные на различных узлах сети (Web-серверах). Кроме того, для определения местонахождения документов служит контекстный поиск. Для ускорения поиска информации в “паутине” применяются специальные программы-роботы, сканирующие Web- сервера и строящие некое подобие индекса. Использование гипертекста позволяет создать информационную инфраструктуру территориально распределенного учреждения и упростить диалоговый интерфейс пользователя, что наиболее важно при разработке информационных приложений для руководителей.
Организация и автоматизация в офисе коллективной работы с документами строятся на технологиях groupware и workflow.
Технологии groupware ориентированы на небольшие рабочие группы, характеризуются поддержкой выполнения одной коллективной задачи и отсутствием структуризации в организации работ. Поддержка ограничивается обеспечением коллективного доступа к информации с помощью различных методов доступа :
• сетевой доступ к файлам и базе данных;
• локальная и глобальная электронная почта (включая конференции и дискуссии);
• терминальный доступ, пересылка файлов и электронная доска объявлений;
• просмотр и интерпретация гипертекста (гипермедиа).
Нужно отметить, что Web-технологии помимо гипертекстового протокола HTTP включают в себя ряд других методов доступа.
При коллективной работе важно наличие блокировок для разрешения конфликтов при совместном использовании ресурсов, санкционирование доступа по идентификаторам и паролям, защита информации с помощью прав
|