ТОР 5 статей: Методические подходы к анализу финансового состояния предприятия Проблема периодизации русской литературы ХХ века. Краткая характеристика второй половины ХХ века Характеристика шлифовальных кругов и ее маркировка Служебные части речи. Предлог. Союз. Частицы КАТЕГОРИИ:
|
Основные подходы в создании банков данныхРассмотрим второе направление. Можно считать, что в части создания информационных систем и банков данных имеют место два основных подхода: Р. Ю. Кобрин обозначает их как а) построение языковых моделей предметных областей и б) построение алгебро-логических моделей баз данных (Кобрин, 1989). Можно сказать, что второе направление преобладает, поскольку современные базы данных создаются по-прежнему не лингвистами, а специалистами в предметных областях и «информационщиками». Необязательно моделью информационной системы служат логико-алгебраические соображения, часто в основе систем лежат просто формализованные инженерные представления, основанные на здравом смысле, но тем не менее (а, может быть, именно потому) достаточно глубокие. Лингвистические же модели предметных областей распространены гораздо реже, и, чаще всего, они не касаются внутренней структуры модели, а выявляют через распределение лексики и терминов важные черты функционирования системы, но такие, которые занимают относительно периферийное положение. Пожалуй, лишь в работе' Р. Ю. Кобрина лингвистическое моделирование поставлено в базис концептуального моделирования. Более конкретно высказанные соображения можно проиллюстрировать разбором некоторых работ.. Наиболее важный вид научно-технической информации — это так называемая объектографическая информация, представляющая собой множество описаний технических объектов — комплектующих изделий, материалов, технологий — состоящих из перечней конкретных признаков технических объектов (Хомутов 1989). Создание таких систем связано с решением двух основных проблем: первая заключается в определении способа структурного представления объектогра-фической информации в виде, удобном для автоматизирован- ной обработки, вторая — это разработка и внедрение программно-технологических комплексов, обеспечивающих функционирование систем. Целью логического проектирования является создание общей схемы обработки информации, сохраняющей семантику информационных элементов при преобразовании данных в системе. Предметом логического проектирования служит логическая структура обработки информации, определяющая правила формального представления информации в виде данных и правила построения алгоритмов манипулирования ими. Основное условие построения систем такого типа заключается в том, что компоненты программно-технологического комплекса должны «выращиваться» (развиваться эволюционно) в связи с расширением и изменением информационных потребностей пользователей. Суть логического проектирования состоит в отображении упомянутой выше структуры требований к программно-технологическому комплексу на множество обеспечивающих средств системы. Главной частью системы является модель предметной области, которая состоит из двух частей: прообраза предметной области и образа предметной области. Прообраз предметной области составляют «знания об объектах», которые в общем случае состоят из описания свойств (характеристик) объектов, описания конкретных (явных) объектов и описания классов (неявных объектов). В свою очередь каждая характеристика представляет собой пару понятий: наименование и значение характеристики, которые задаются на входе системы парой конкретных терминов и образуют характеристику входного факта. Некоторая совокупность характеристик факта, поименованная именем явного объекта, образует входное сообщение, которое в процессе ввода его в систему преобразуется в факты информационной базы. Каждый неявный объект представляет собой структурированное описание целого класса реальных объектов, обладающих одинаковой «номенклатурой» свойств и служит для задания информационной системы, с помощью которой отображаются объекты в памяти системы. Любой явный объект есть видовое понятие от соответствующего неявного объекта, полу- Компьютерная лингвистика Слава 4. Терминология, терминоведение, терминографи
чаемое из последнего присвоением уникального имени и уточнением характеристик неявного объекта их значениями. Образом предметной области служит информационная база системы. Неявные объекты и входные сообщения непосредственно имеют соответствующие образы в структуре информационной базы. Определяющим правилом выбора схемы образа предметной области является следующее: чем сложнее семантическая структура элемента информационной базы, тем меньше должен быть объем массива, реализующий его, и наоборот: чем больше может быть массив, реализующий некоторый элемент информационной базы, тем проще должна быть семантическая схема последнего. Следствием этого является разделение всей информационной базы на словарные, информационные и технологические массивы. В состав словарных массивов входят массивы терминологического, базового тематического и фактографического словарей, каждый из которых соответственно предназначен: • терминологический — для отождествления внешнего представления лексических единиц с их внутренним представлением; • базовый тематический — для фиксации, упорядочения и нормирования представления элементарных понятий, которые используются для описания в системе более сложных понятий; • фактографический словарь — для регламентации описания объектов в системе, для нормирования лексики, в которой представляются характеристики объектов, и для адресации фактов в информационных массивах системы. Непосредственными образами неявных объектов и входных сообщений соответственно являются тип объекта и факт информационной базы. Тип объекта — это элемент фактографического словаря, представляющий собой иерархию характеристик соответствующего неявного объекта. В фактографическом словаре возможно объединение типов объектов с помощью характеристик-отношений. Факты информационной базы являются элементами информационных массивов, которые организуются по следующим правилам: • общий справочный массив включает все факты по всем явным объектам, распознаваемым по словарям системы; • специальные справочные массивы включают факты по всем явным объектам, но состав характеристик факта специально определяется фактографическим словарем для каждого массива; • рабочие фактографические массивы включают факты по специально отмеченным в фактографическом словаре объектам и состав фактов каждого из них также определен в фактографическом словаре. Эта структура в целом представляет собой, по мысли автора, «статическую» составляющую логической структуры предметной области системы. А ее «динамическая» составляющая представлена системой правил создания и ведения информационной базы и поиска фактов в массивах. Правила поиска фактов задают способы реализации запросов к системе двух разных типов: • тематический запрос — это запрос, в котором условия поиска формируются в терминах базового тематического словаря, отражающих имя типа объекта и наименования характеристик; • предметный запрос — это запрос (по имени объекта, по значениям характеристик и по рекурсии), в котором условия поиска формулируются в терминах фактографического словаря. Таким образом, «статическая» и «динамическая» составляющие определяют все необходимые для работы системы аспекты формального представления информации в виде данных. Из этого рассмотрения видно, что терминология, массивы терминов, словари терминологических областей представляют собой как бы вспомогательный материал, из которого строится система, а первичным являются информационно-логические и манипуляционные представления, исходя из которых строится общая структурная схема системы. Информационный процесс использует понятия «семантика», «логика», «понятие», на ко- Компьютерная лингвистика Глава 4. Терминология, терминоведение, терминография
торых строятся концепты предметного и проблемного поля. Безусловно, в системе уделяется большое внимание анализу работы словарей, их полноте, корректировке в ходе работы и пр. Однако фундаментальный принцип — от логической информационной технологии к слову-выразителю понятий. Не нашли, что искали? Воспользуйтесь поиском:
|