1 Введение
1.1 Глоссарий
MDIP – Metadata Interchange Protocol, внутренний протокол системы.
АРМ – автоматизированное рабочее место.
ИСОП - информационная система общего пользования. Общедоступное хранилище разнообразной информации.
МД – метаданные, метаинформация – описание, данные, необходимые для уникальной идентификации конкретного источника НТИ. (например год, наименование, автор и т. п.)
НТИ - научно-техническая информация. Информация, имеющая теоретическое или прикладное значение для различных областей науки и/или техники.
СМД – сервер метаданных.
1.2 Описание предметной области
Программная система "Распределенная база метаданных научно-технической инфор-мации" разрабатывается по заказу лаборатории научно-технической информации (ЛНТИ) Тихоокеанского океанологического института ДВО РАН (ТОИ ДВО РАН). Организа-ция-заказчик занимается научно-исследовательской работой в области геологии, геофизики и геохимии Тихого океана, в частности проводятся различные исследования водных масс морей и океанов, их физических характеристик, взаимодействия с внешней средой и т.п. В процессе научной работы возникает необходимость в поиске информации, освещающей те или иные вопросы предметной области. В результате деятельности лаборатории НТИ и ряда сотруд-ников института накоплены массивы информации, имеющей научно-техническую ценность. Поиск и выделение необходимых данных часто бывают затруднительны как из-за большого объема имеющейся информации, так и вследствие децентрализованности ее хранения. Это отрицательно сказывается на общей эффективности работы сотрудников.
В настоящее время в ТОИ и в других подразделениях ДВО РАН существует целый ряд независимых и, зачастую, плохо структурированных хранилищ разнородной информации. Неструктурированность хранимой информации и отсутствие единообразного метода доступа к ней приводят к увеличению количества действий, необходимых для ее получения, вре-менных затрат и «перерасходу» пропускной способности интернет-канала. Для эффективного использования хранимой информации необходимо создать унифицированный пользователь-ский интерфейс и средства, обеспечивающие взаимодействие хранилищ. Для облегчения поиска информации и работы с ней следует использовать метаданные. (Как будет показано в п. 1.4, существующие системы, пригодные для решения указанной проблемы, не обеспечи-вают в полной мере необходимой для эффективной работы сотрудников организа-ции-заказчика функциональности).
Целью настоящего проекта является реализация авторской системы для распределен-ного хранения, поиска и обработки НТИ с использованием метаданных. Задачами первого этапа разработки являлись поиск и анализ вариантов решения поставленной проблемы, соз-дание общей архитектуры системы, разработка внутрисистемных интерфейсов и структур данных, создание прототипа системы.
Разработка системы ведется совместно со студентами 236 группы ИМиКН ДВГУ А. О. Терегуловым и С. А. Федоровым. Непосредственная задача представляемой части проекта – создание сервера-хранилища метаданных. Помимо этого, А. О. Терегуловым должна быть создана подсистема импорта и хранения информации [11], С. А. Федоровым – автоматизи-рованные рабочие места пользователей и операторов [12].
Несмотря на то, что данная система разрабатывается под вполне конкретные требования заказчика, подразумевается, что аналогичные и смежные задачи она сможет решать сразу после развертывания или после незначительного переконфигурирования.
1.3 Неформальная постановка задачи
Разрабатываемая система должна:
• обеспечивать распределенное хранение НТИ, позволять производить добавление и удаление документов;
• производить выделение, сбор и распределенное хранение метаданных имеющихся документов, позволять производить их просмотр, изменение и удаление;
• обладать средствами для поиска документов НТИ на серверах системы или в ИСОП, обеспечивать доступ пользователей к данным;
• производить сбор статистики по работе системы и построение отчетов на основе этих данных;
• содержать средства контроля работоспособности системы;
• обеспечивать одновременную работу большого числа пользователей, причем требо-вания к программному и аппаратному обеспечению их рабочих станций должны быть минимальны (процессор Intel Pentium 100 МГц, объем оперативной памяти – 32 Мб, объем жесткого диска – 500 Мб).
|