Обеспечение информационных систем

Обеспечение информационных систем подразделяется на: информационное, техническое, математическое и программное, методическое, лингвистиче-кое, правовое и организационное (Рис. ).

Рис.2.1. Подсистемы информационной системы.

Информационное обеспечение включает совокупность данных, методы построения БД, а также проектных решений по объёмам, размещению, формам организации информации, циркулирующей в ИС организации.

Техническое обеспечение - комплекс ТС, предназначенных для работы ИС, документация на эти средства и технологические процессы.

Математическое обеспечение - совокупность математических методов, моделей, алгоритмов обработки информации, используемых при решении функциональных и проектных задач в ИС.

Программное обеспечение - совокупность программ для реализации целей, задач ИС и нормального функционирования как отдельных, так комплекса ТС.

Методическое и организационное обеспечение - комплекс методов, средств и документов, регламентирующих взаимодействие персонала ИС с программно-техническими средствами (ПТС) и между собой в процессе разработки и эксплуатации ИС.

Лингвистическое обеспечение - совокупность языков общения персонала ИС и пользователей с программно-техническим и информационным обеспечением, а также сумму терминов, используемых в ИС.

Правовое обеспечение - правовые нормы, используемые для соблюдения законности (законы, указы, постановления государственных органов власти, приказы и инструкции вышестоящих органов и руководителей организации).


Анализ информации

С появлением первых электронных библиографических поисковых механизмов, входящих в состав автоматизированных информационно-поисковых систем и попыткой создания Электронных каталогов (ЭК) остро возникла проблема расширения поисковых элементов. Элементов библиографических описаний документов, хранящихся в полях «заглавия», «фамилии авторов» и «выходные данные» (вербальные данные) в большинстве случаев недостаточно для проведения релевантного поиска необходимых пользователям документов, если заранее неизвестны эти элементы. Заглавия всё чаще неинформативны, они не отражают ни тематики, ни содержаний документов. Наибольшие проблемы возникают при организации тематического поиска.

В качестве поисковых элементов в АИПС используется лингвистическое обеспечение, базирующееся на информационно-поисковых языках (ИПЯ), к которым относятся различные термины и словосочетания, входящие в состав классификационных систем (УДУ, ББК, ГРНТИ и др.), ключевых слов, тематических рубрик, алфавитно-предметных указателей (АПУ) и т.п. При формировании поискового запроса можно использовать классификаторы (УДК, ДДК, ББК, ГРНТИ и др.), но даже специалисты знают наизусть ограниченный набор классификационных индексов, как правило, лишь в какой-нибудь одной классификационной системе. Для пользователей это нереально по многим причинам. Одна из причин качественного поиска – отсутствие средств, способствующих осуществлению эффективных поисковых стратегий неподготовленным пользователем.

Так, например, ключевые слова, хотя и помогают при поиске документов, не позволяют во всех случаях обеспечить релевантный отбор необходимых документов. Ряд специалистов предложил решить эту проблему путём создания электрон-ных тезаурусов и рубрикаторов, ссылки на которые можно было бы организовать при росписи документов. В этом случае выделяют следующую последовательность работы: индексирование информации; составление тезауруса; организация и проведение поисков на основе широкого использования электронных рубрикаторов и тезаурусов. Этот достаточно трудоёмкий и неэффективный процесс всё равно в ряде случаев не позволяет решать данную проблему.

При этом эксперты считают, что функционирующие классификационные системы вряд ли сохранятся далее первых двух десятилетий грядущего века, если не найдут сил и возможности для коренных преобразований.

Может сложиться впечатление, что решить проблему релевантного и пертинентного поиска невозможно. Отчасти с этим приходится согласиться, особенно при проведении поисков в Интернете.

Однако ряд специалистов и организаций предлагают индексировать полные тексты и формировать объединённый СПА (справочно-поискового аппарата) для электронных и печатных ресурсов. Считается, что индексы в электронном (машиночитаемом) виде должны присутствовать вместе с их библиографическими описаниями (БО). Это направление получило название «вычислительная лингвистика». При этом пристальное внимание уделяется формированию метаданных.

Метаданные – информация об информации; информация, формируемая издателями электронных ресурсов, представляющая обязательный минимум сведений, позволяющий использовать их при каталогизации.

Важно отметить, что системы организации поиска в АБИС, а также в электронных полнотекстовых базах данных должны учитывать поведение пользователей при проведении данной процедуры.

Следующим направлением в данной области было создание систем, позволяющих из документов, тесно связанных между собой по некоторым статистическим параметрам, извлекать ключевые слова и словосочетания, которые считаются релевантными в данной предметной области. Такие системы способствуют решению проблемы релевантного автоматического индексирования и реферирования документов, принадлежащих к данному корпусу документов.

Программное обеспечение, использующее элементы вычислительной лингвистики, появилось на ряде сайтов в Интернете, например, «Анализатор текста» (textanalyst). Оно предназначено для анализа и составления из введённого пользователем текста списка ключевых слов, ранжируемых по весовому коэффициенту. Если из этого списка выбрать несколько словоформ, то по ним программа выполнит автоматическое реферирование и тематическую фиксацию анализируемого текста. В результате пользователь получает список наиболее значимых предложений исходного текста.

При этом возникает прецедент, когда, во-первых, отпадает потребность вводить ключевые слова и создавать специальные электронные рубрикаторы.

Во-вторых, автоматическое реферирование машиночитаемого текста способствует созданию рефератов документов, что само по себе весьма значимо особенно для научных, учебных, технических и иных профессиональных материалов.

В-третьих, такие рефераты можно включать в соответствующие поля библиографических записей в электронных базах и банках данных (в т.ч. Электронных каталогов), что будет способствовать максимальному раскрытию фондов библиотек и не перегрузит аппаратные средства большими объёмами машиночи-таемых данных. Более того, поиск будет естественно проходить быстрее, чем при извлечении необходимых сведений из полных текстов.

В-четвертых, при этом не возникают проблемы с авторским правом, так как на серверах в открытом доступе будут не полные тексты документов, а их рефераты.

В-пятых, поиск по ключевым словам, образующим такие рефераты в сочетании с включенными в тексты метаданными может значительно улучшить ситуацию с релевантностью.

В-шестых, можно, используя эти рефераты, отказаться от описания определённого количества полей (тэгов) метаданных в гипертекстовых документах.

И, наконец, в-седьмых, такое решение снимает значительный груз забот и работ систематизаторов и библиографов при описании документов и создании соответствующих библиографических записей в Электронных каталогах их библиотек.


Сайт создан в системе uCoz