Анализ документов в Интернете.
Практическая работа по курсу "Информационные системы"


Введение
Важной задачей специалистов является нахождение нужных им документов.

Особенно эта проблема возникает при проведении поиска в Интернете, так как на запрос пользователя он получает тысячи и десятки тысяч ссылок, из которых необходимыми обычно являются единицы.

Даже выбрав из представленного множества ссылок наиболее подходящие на первый взгляд документы, пользователю приходится заходить на соответствующие сайты, находить там эти документы, просматривать их и выявлять из них именно те, которые действительно ему нужны (пертинентные документы). При этом процесс выявления необходимых данных во время просмотра найденного документа также занимает много времени и других ресурсов.

Одним из способов оптимизации этого процесса является использование рефератов (сжатой информации). Широкое применение реферирования документов получило в научной среде. По реферату обычно легко и быстро можно установить необходимость для пользователя описанного в реферате документа.

Чтобы осуществить реферирование какого-нибудь документа нужно обладать определенными знаниями и практическими навыками. Для решения этой проблемы применяются методы релевантного автоматического индексирования и реферирования документов.

Автоматическое реферирование электронного текста способствует созданию рефератов документов, значимых особенно для научных, учебных, технических и иных профессиональных материалов.

С этой целью используется различное программное обеспечение, например, «Анализатор текста» (textanalyst). Оно предназначено для анализа введенного пользователем текста и составления списка присутствующих в нем ключевых слов. Этот список ранжируется по весовому коэффициенту.
Кроме списка ключевых слов, анализатор может произвести автоматическое реферирование текста. В результате пользователь получает список наиболее значимых предложений исходного текста, которые могут являться авторефератом или позволяют пользователю легко сформировать реферат.


Практическая часть
Анализ документа(ов) студент осуществляет по одной из тем (подтем) данного курса с помощью одной из специализированных программ, например, «Анализатор текста».

Студент выбирает тему для анализа документов из "тем Эссе". Если в данной дисциплине выполняются две практические работы, то Тема выбирается студентом при выполнении предыдущей (первой) практической работы «Поиск информации в Интернете».
В любом случае эта тема должна быть согласована с преподавателем. Необходимый для выполнения этой практической работы документ должен быть выявлен (найден) в процессе выполнения практической работы "Поиск в Интернете".
Для чего студент сначала по выбранной в предыдущей практической работе теме находит в Интернете один, наиболее полно соответствующий ей, пертинентный документ, который копирует в свой электронный почтовый ящик или в свой носитель информации (флэш-память).
Объем выбранного для работы с "Анализатором" документа должен быть от двух до трех страниц формата А4.

Затем студент находит в Интернете анализатор текстов (его объем примерно 2,5 МБ) и также копирует его на соответствующий носитель или отправляет его на свой адрес электронной почты.
Этот файл нужно скопировать на свой компьютер, затем развернуть (объем - примерно 5 МБ) и запустить программу.

Cледуя за рекомендациями программы, студент подгружает в нее скопированный текст и выполняет соответствующие действия (анализ и автореферирование текста).
В процессе выполнения данной работы студент копирует ("скриншотит") три вида работы программы с помощью клавиши "PrintScreen":
1. После загрузки текста в программу.
2. После расширения в длину (по высоте)левой колонки с полученным в ней списком ключевых слов.
3. После выполнения команды автореферирования.

Оформление выполненной работы

Примерный объем работы в формате А4 - около пяти страниц текста, включая изображения и т.п.
Работа выполняется в текстовом редакторе Word (шрифт TNR-14, одинарный межстрочный интервал).
В данной работе должны быть:
1. Титульный лист (аналогично тому, который создается при выполнение первой практической работы);
2. Краткое описание используемой программы (основные сведения о ней: что за программа, для чего она служит, достоинства).
3. Полный текст отобранного документа, с указанием в начале этого текста адреса ссылки, по которой был найден данный документ.
4. "Скриншот" программы после загрузки в нее исследуемого текста.
5. Результаты работы программы выполнения - "скриншот" с ранжированным списком ключевых слов.
6. Результаты автоматического "Автореферирования" загруженного текста - "скриншот" с полученным рефератом в правом верхнем окне программы, наиболее полно соответствующий основному тексту (запросу, по которому был получен данный текст). Для этого нужно выбирать соответствующие ключевые слова и с их помощью получить автореферат.
7. Выводы по работе с анализатором: описание выполненных действий и полученных результатов.

В печатном или электронном виде работа представляется преподавателю не позднее, чем за три дня до итогового мероприятия (зачета или экзамена) по изучаемой дисциплине.
Выполнение работы является обязательной компонентой изучения данной дисциплины.

Студенты, не сдавшие своевременно практические работы или получившие неудовлетворительную оценку по ним, не допускаются к зачёту или экзамену по данной дисциплине.

Сайт создан в системе uCoz