1 Введение
1.1 Глоссарий
MDIP –Metadata Interchange Protocol, внутренний протокол системы.
АРМ – автоматизированное место пользователя.
ИСОП – информационная система общего пользования. Общедоступное хранилище разнообразной информации.
Метаданные, метаинформация – описание, данные, необходимые для уникальной иден-тификации конкретного источника НТИ. (например год, наименование, автор и т. п.)
НТИ – научно-техническая информация. Информация, имеющая теоретическое или прикладное значение для различных областей науки и/или техники.
1.2 Описание предметной области
Программная система «Распределенная база метаданных научно-технической инфор-мации» разрабатывается по заказу лаборатории научно-технической информации (ЛНТИ) Тихоокеанского океанологического института ДВО РАН (ТОИ ДВО РАН). Организация-заказчик занимается научно-исследовательской работой в области геологии, геофизики и геохимии Тихого океана, в частности проводятся различные исследования водных масс мо-рей и океанов, их физических характеристик, взаимодействия с внешней средой и т.п. В про-цессе научной работы возникает необходимость в поиске информации, освещающей те или иные специфические вопросы. В результате деятельности лаборатории НТИ и ряда сотруд-ников института накоплены массивы информации, имеющей научно-техническую ценность. Поиск и выделение необходимых данных часто затруднительны как из-за большого объема имеющейся информации, так и вследствие децентрализованности ее хранения. Это отрица-тельно сказывается на общей эффективности работы сотрудников организации.
В настоящее время в ТОИ (далее - заказчик) и в других подразделениях ДВО РАН су-ществует целый ряд независимых и, зачастую, плохо структурированных хранилищ разно-родной информации. Неструктурированность хранимой информации и отсутствие единооб-разного метода доступа к ней приводят к увеличению количества действий, необходимых для ее получения, временных затрат и «перерасходу» пропускной способности интернет-канала. Для эффективного использования хранимой информации необходимо создать уни-фицированный пользовательский интерфейс и средства, обеспечивающие взаимодействие хранилищ. (Как будет показано в пункте 1.4, существующие системы, пригодные для реше-ния указанной проблемы, не обеспечивают в полной мере необходимой для эффективной ра-боты сотрудников организации-заказчика функциональности).
Целью настоящего проекта является реализация авторской системы для распределенно-го хранения, поиска и обработки НТИ с использованием метаданных. Его разработка ведется совместно со студентами 236 группы ИМиКН ДВГУ Машковским Д. А. [6] и Терегуловым А. О.[10]. Непосредственной подзадачей данной работы является разработка пользователь-ского интерфейса для администратора, оператора и конечного абонента системы. Соответст-венно, также будет спроектирована и реализована подсистема импорта и хранения информа-ции (А. О. Терегулов) и создано программное обеспечение сервера метаданных (Д. А. Маш-ковский).
Несмотря на то, что система разрабатывается под вполне конкретные требования заказ-чика, подразумевается, что аналогичные и смежные задачи она сможет решать сразу после развертывания или после незначительного переконфигурирования.
1.3 Неформальная постановка задачи
Разрабатываемая система должна:
• обеспечивать распределенное хранение НТИ, позволять производить добавление и удаление документов;
• производить выделение, сбор и распределенное хранение метаданных имеющихся документов, позволять производить их просмотр, изменение и удаление;
• обладать средствами для поиска документов НТИ на серверах системы или в ИСОП, обеспечивать доступ пользователей к данным;
• производить сбор статистики по работе системы и построение отчетов на основе этих данных;
• содержать средства контроля работоспособности системы;
• обеспечивать одновременную работу большого числа пользователей, причем тре-бования к программному и аппаратному обеспечению их рабочих станций должны быть минимальны (Процессор Intel Pentium 100 МГц, не более 16 Мб оперативной памяти, до 500 Кб на жестком диске).
В соответствии с этим можно выделить следующие требования к АРМ-м системы. А именно, интерфейс должен:
• производить идентификацию и авторизацию пользователей, разграничивать пол-номочия пользователей системы и ее обслуживающего персонала;
• поддерживать одновременную работу большого числа пользователей;
• реализовывать возможности поиска НТИ по известным метаданным, в том числе по таким как «название», «автор», «ключевые слова»;
• обеспечивать просмотр и модификацию метаданных для указанных документов;
• позволять добавлять и удалять документы НТИ, контролировать сбор их метадан-ных, обеспечивать доступ пользователей к ним;
• содержать средства удаленного конфигурирования компонентов системы, про-смотра их конфигурации, в том числе параметров сбора метаданных в автоматиче-ском
|