Главная

Популярная публикация

Научная публикация

Случайная публикация

Обратная связь

ТОР 5 статей:

Методические подходы к анализу финансового состояния предприятия

Проблема периодизации русской литературы ХХ века. Краткая характеристика второй половины ХХ века

Ценовые и неценовые факторы

Характеристика шлифовальных кругов и ее маркировка

Служебные части речи. Предлог. Союз. Частицы

КАТЕГОРИИ:






Основные подходы в создании банков данных




Рассмотрим второе направление. Можно считать, что в части создания информационных систем и банков данных имеют место два основных подхода: Р. Ю. Кобрин обозначает их как а) построение языковых моделей предметных областей и б) построение алгебро-логических моделей баз данных (Кобрин, 1989). Можно сказать, что второе направление пре­обладает, поскольку современные базы данных создаются по-прежнему не лингвистами, а специалистами в предметных об­ластях и «информационщиками». Необязательно моделью информационной системы служат логико-алгебраические со­ображения, часто в основе систем лежат просто формализо­ванные инженерные представления, основанные на здравом смысле, но тем не менее (а, может быть, именно потому) дос­таточно глубокие. Лингвистические же модели предметных областей распространены гораздо реже, и, чаще всего, они не касаются внутренней структуры модели, а выявляют через распределение лексики и терминов важные черты функциони­рования системы, но такие, которые занимают относительно периферийное положение. Пожалуй, лишь в работе' Р. Ю. Кобрина лингвистическое моделирование поставлено в базис концептуального моделирования.

Более конкретно высказанные соображения можно проил­люстрировать разбором некоторых работ..

Наиболее важный вид научно-технической информации — это так называемая объектографическая информация, пред­ставляющая собой множество описаний технических объек­тов — комплектующих изделий, материалов, технологий — состоящих из перечней конкретных признаков технических объектов (Хомутов 1989). Создание таких систем связано с решением двух основных проблем: первая заключается в оп­ределении способа структурного представления объектогра-фической информации в виде, удобном для автоматизирован-


ной обработки, вторая — это разработка и внедрение про­граммно-технологических комплексов, обеспечивающих функ­ционирование систем.

Целью логического проектирования является создание об­щей схемы обработки информации, сохраняющей семантику информационных элементов при преобразовании данных в си­стеме. Предметом логического проектирования служит логи­ческая структура обработки информации, определяющая пра­вила формального представления информации в виде данных и правила построения алгоритмов манипулирования ими. Основ­ное условие построения систем такого типа заключается в том, что компоненты программно-технологического комплекса дол­жны «выращиваться» (развиваться эволюционно) в связи с расширением и изменением информационных потребностей пользователей. Суть логического проектирования состоит в отображении упомянутой выше структуры требований к про­граммно-технологическому комплексу на множество обеспе­чивающих средств системы.

Главной частью системы является модель предметной об­ласти, которая состоит из двух частей: прообраза предметной области и образа предметной области.

Прообраз предметной области составляют «знания об объ­ектах», которые в общем случае состоят из описания свойств (характеристик) объектов, описания конкретных (явных) объ­ектов и описания классов (неявных объектов). В свою очередь каждая характеристика представляет собой пару понятий: на­именование и значение характеристики, которые задаются на входе системы парой конкретных терминов и образуют харак­теристику входного факта. Некоторая совокупность характе­ристик факта, поименованная именем явного объекта, образует входное сообщение, которое в процессе ввода его в систему преобразуется в факты информационной базы.

Каждый неявный объект представляет собой структуриро­ванное описание целого класса реальных объектов, обладаю­щих одинаковой «номенклатурой» свойств и служит для зада­ния информационной системы, с помощью которой отобража­ются объекты в памяти системы. Любой явный объект есть ви­довое понятие от соответствующего неявного объекта, полу-



Компьютерная лингвистика


Слава 4. Терминология, терминоведение, терминографи



 


чаемое из последнего присвоением уникального имени и уточ­нением характеристик неявного объекта их значениями.

Образом предметной области служит информационная ба­за системы. Неявные объекты и входные сообщения непосред­ственно имеют соответствующие образы в структуре инфор­мационной базы.

Определяющим правилом выбора схемы образа предмет­ной области является следующее: чем сложнее семантическая структура элемента информационной базы, тем меньше дол­жен быть объем массива, реализующий его, и наоборот: чем больше может быть массив, реализующий некоторый элемент информационной базы, тем проще должна быть семантическая схема последнего.

Следствием этого является разделение всей информацион­ной базы на словарные, информационные и технологические массивы.

В состав словарных массивов входят массивы терминоло­гического, базового тематического и фактографического сло­варей, каждый из которых соответственно предназначен:

• терминологический — для отождествления внешнего представления лексических единиц с их внутренним пред­ставлением;

• базовый тематический — для фиксации, упорядочения и нормирования представления элементарных понятий, ко­торые используются для описания в системе более слож­ных понятий;

• фактографический словарь — для регламентации описания объектов в системе, для нормирования лексики, в которой представляются характеристики объектов, и для адресации фактов в информационных массивах системы.

Непосредственными образами неявных объектов и вход­ных сообщений соответственно являются тип объекта и факт информационной базы. Тип объекта — это элемент фактогра­фического словаря, представляющий собой иерархию характе­ристик соответствующего неявного объекта. В фактографиче­ском словаре возможно объединение типов объектов с помо­щью характеристик-отношений.


Факты информационной базы являются элементами ин­формационных массивов, которые организуются по следую­щим правилам:

• общий справочный массив включает все факты по всем

явным объектам, распознаваемым по словарям системы;

• специальные справочные массивы включают факты по всем явным объектам, но состав характеристик факта спе­циально определяется фактографическим словарем для каждого массива;

• рабочие фактографические массивы включают факты по специально отмеченным в фактографическом словаре объ­ектам и состав фактов каждого из них также определен в фактографическом словаре.

Эта структура в целом представляет собой, по мысли авто­ра, «статическую» составляющую логической структуры пред­метной области системы. А ее «динамическая» составляющая представлена системой правил создания и ведения информаци­онной базы и поиска фактов в массивах.

Правила поиска фактов задают способы реализации запро­сов к системе двух разных типов:

• тематический запрос — это запрос, в котором условия по­иска формируются в терминах базового тематического словаря, отражающих имя типа объекта и наименования характеристик;

• предметный запрос — это запрос (по имени объекта, по значениям характеристик и по рекурсии), в котором усло­вия поиска формулируются в терминах фактографического словаря. Таким образом, «статическая» и «динамическая» составляющие определяют все необходимые для работы системы аспекты формального представления информации в виде данных.

Из этого рассмотрения видно, что терминология, массивы терминов, словари терминологических областей представляют собой как бы вспомогательный материал, из которого строится система, а первичным являются информационно-логические и манипуляционные представления, исходя из которых строится общая структурная схема системы. Информационный процесс использует понятия «семантика», «логика», «понятие», на ко-



Компьютерная лингвистика


Глава 4. Терминология, терминоведение, терминография



 


торых строятся концепты предметного и проблемного поля. Безусловно, в системе уделяется большое внимание анализу работы словарей, их полноте, корректировке в ходе работы и пр. Однако фундаментальный принцип — от логической ин­формационной технологии к слову-выразителю понятий.






Не нашли, что искали? Воспользуйтесь поиском:

vikidalka.ru - 2015-2024 год. Все права принадлежат их авторам! Нарушение авторских прав | Нарушение персональных данных