ТОР 5 статей: Методические подходы к анализу финансового состояния предприятия Проблема периодизации русской литературы ХХ века. Краткая характеристика второй половины ХХ века Характеристика шлифовальных кругов и ее маркировка Служебные части речи. Предлог. Союз. Частицы КАТЕГОРИИ:
|
Общая характеристика и виды документальных ИСДокументальная ИС - единое хранилище документов с инструментарием поиска и отбора необходимых документов. Отсюда еще одно их название - ИПС. В зависимости от особенностей реализации хранилища документов и механизмов поиска документальные ИПС можно разделить на две группы: - системы на основе индексирования; - семантически-навигационные системы. В семантических навигационных системах д окументы, помещаемые в хранилище документов, оснащаются специальными навигационными конструкциями, соответствующими смысловым связям между различными документами. Такие конструкции реализуют некоторую семантическую сеть в базе документов. Способ и механизм выражения информационных потребностей в таких системах заключается в явной навигации пользователя по смысловым отсылкам между документами. В настоящее время такой подход реализуется в гипертекстовых ИПС. В системах на основе индексирования исходные документы помещаются в базу без дополнительного преобразования, но при этом смысловое содержание каждого документа отображается в некоторое поисковое пространство. Этот процесс называется индексированием и заключается в присвоении документу индекса-координаты в поисковом пространстве. Формализованное представление индекса документа называется поисковым образом документа (ПОД). Когда пользователь обращается к такой системе, она на основе определенных критериев ищет документы, поисковые образы которых соответствуют или близки поисковым запросам пользователя. Соответствие найденных документов запросу пользователя называется релевантностью. Особенностью документальных ИПС является также то, что в их функции включаются задачи информационного оповещения пользователей по всем новым поступающим в систему документам, соответствующим информационным потребностям пользователя. Задачи информационного оповещения решаются На основе отображения в поисковое пространство информационных потребностей пользователя в виде так называемых поисковых профилей пользователя (ППП). ИС по мере поступления новых документов сравнивает их образцы с ППП пользователей и принимает решение об оповещении. Поисковое пространство, отображающее поисковые образы документов и реализующее информационный поиск документов строятся на основе языков документальных баз данных, которые называются информационно-поисковыми языками (ИПЯ). Информационно-поисковый язык представляет собой формализованную семантическую систему, предназначенную для выражения содержания документа и запросов по поиску документов. По аналогии с языками баз данных фактографических систем ИПЯ можно разделить на структурную и манипуляционную составляющие. 1. Структурная составляющая ИПЯ документальных ИПС на основе индексирования реализуется индексными указателями в форме информационно-поисковых каталогов, тезаурусов и генеральных указателей. Информационно-поисковые каталоги являются традиционными технологиями организации информационного поиска в документальных фондах библиотек, архивов и представляет собой классификационную систему знаний по определенной предметной области. Смысловое содержание документа отображается классом каталога, а индексирование заключается в присвоении каждому документу специального кода (индекса) внутри класса и создание специального индексного указателя. Тезаурус представляет собой специальным образом организованную совокупность основных лексических единиц предметной области (словарь терминов) и описание парадигматических отношений между ними. Парадигматические отношения выражаются семантическими отношениями между элементами словаря, не зависящими от контекста. Независимость от контекста означает абстрагированность смысловых отношений, например, “род-вид”, “предмет-целое”, “субъект-объект-средство-место-время действия”. Так же как и в информационно-поисковых каталогах, в системах не основе тезаурусов в информационно-поисковое пространство отображается не весь текст документа, а лишь смысловое содержание документа. Генеральный указатель (глобальный словарь-индекс) представляет собой перечисление всех слов (словоформ), имеющихся в документах хранилища, с указанием местонахождения каждого слова (N документа–N абзаца–N предложения – Nслова). Индексирование нового документа в таких системах через дополнение координатных отсылок тех словоформ генерального указателя, которые присутствуют в новом документе. Так как поисковое пространство в таких системах отражает полностью весь текст документа, то такие системы получили название полнотекстовых ИПС. 2. Структурная составляющая ИПЯ семантически-навигационных систем реализуется в виде техники смысловых отсылок в тестах документов и специальном навигационном интерфейсе по ним и в настоящее время представлена гипертекстовыми технологиями. Не нашли, что искали? Воспользуйтесь поиском:
|