Главная

Популярная публикация

Научная публикация

Случайная публикация

Обратная связь

ТОР 5 статей:

Методические подходы к анализу финансового состояния предприятия

Проблема периодизации русской литературы ХХ века. Краткая характеристика второй половины ХХ века

Ценовые и неценовые факторы

Характеристика шлифовальных кругов и ее маркировка

Служебные части речи. Предлог. Союз. Частицы

КАТЕГОРИИ:






Лингвистический анализ терминологии




В отличие от такого подхода Р. Ю. Кобрин предлагает ис­ходить при построении системы информационного типа из лингвистического анализа терминологии, от которого можно перейти к основам структуры предметного поля. Так, при соз­дании банков картографических данных вне зависимости от конкретного содержания карты на ней присутствуют три вида информации: смысловая (семантическая) информация об объ­ектах и характеристиках, выражаемая терминами естественно­го языка и системой условных знаков карты; метрическая ин­формация, передающая пространственное положение объектов при помощи принятой системы координат; графическая ин­формация о конфигурации, цвете, размерах условных знаков.

Для обработки этих видов информации разработан специ­альный лингвистический аппарат трансформации картографи­ческой информации в форму данных, обеспечивающий хране­ние, поиск и многоаспектную обработку данных на естествен­ном языке (Кобрин, 1989). Информационно-технологическое обеспечение банка картографических данных представляет набор средств для идентификации, описания, структурирова­ния и кодирования единиц информации, представленных в виде понятийно-терминологической системы предметной об­ласти и системы условных знаков, и ориентированных на ав­томатизацию процедур ввода, хранения и обработки карто­графической информации. В основу такого информационно-терминологического обеспечения положен принцип логико-лингвистического концептуального моделирования, обеспе­чивающий формализованное представление всех информаци­онных единиц и отношений между ними в подсистемах, а именно: в базовой структуре, являющейся структурной мо­делью предметной области, представленной в виде графов и таблиц; в классификаторе картографической информации,


представляющем множество информационных единиц в вы­бранной системе кодирования.

В процессе конструирования информационно-терминоло­гического обеспечения была создана терминологическая ос­нова, в которой конкретизированы объекты предметной об­ласти в отношениях между ними в виде базового терминоло­гического словника. Для отбора терминов использовался се­мантический критерий. Так, при разработке области ЛЕС соз­дан словник, включающий 1500 терминов по лесоустроитель­ной тематике и лесному картографированию. Анализ продук­тивности терминов и их соответствия перечню базовых моде­лей, заранее определенных, позволил выделить класс базовых моделей терминов лесоустройства в виде, например таких:

П — С — «земельные угодья»,

С — С — «крутизна склона»,

С — П — С — «лес орехопромысловой зоны» и т. п.

Термины, образованные по этим моделям, включались в базовую структуру и в классификатор картографической ин­формации и использовались в диалоге с ЭВМ. В словниках фиксировались основные парадигматические отношения.

Для формализации системы условных знаков были приня­ты особые модели и сформулированы определения основных информационных единиц, принятых в системе картографиче­ского объекта и картографической характеристики. Эти объек­ты выражаются не словами, а определенным набором поли­графических средств.

На картографических документах выделялись следующие ти­пы смысловых отношений между информационными единицами: семантические, метрические, графические. Для их передачи был разработан специальный грамматический аппарат, заданный в ба­зовой структуре, формализованный в классификаторе и предна­значенный для передачи следующих видов отношений:

1) родвид. Этот тип передает иерархические отношения;

2) целоечасть. Здесь передаются отношения включения /
конкретизации, моделирующие структуры сложных объек­
тов. Например объект «река» находится в отношении «це­
лое — часть» к объектам «береговая линия»,«акватория»;



Компьютерная лингвистика


Глава 4. Терминология, терминоведение, терминография



 


3) объектпризнак/свойство, характеристика. Это наибо­
лее распространенный тип отношения;

4) действиеобъект. Отношение системное и реализуется
программно. Возможны любые изменения объектов и ха­
рактеристик в базе данных;

5) объекторудие действия. Отношение системное и реа­
лизуется программно: возможно изменение характеристик
при изменении объекта, изменение связанных объектов
при изменении главного объекта и т. д.

Введены следующие грамматические средства: а) аппарат пре­рываний, б) аппарат связанных объектов, в) аппарат заполнений.

Аппарат прерываний — грамматическое средство, позво­ляющее структурировать сложный объект, т. е. представить все синтаксические связи объектов на стадии предмашинной подготовки и индексирования документов, а также формально реализовать эти связи на стадии ввода метрической информа­ции. Например, у объекта «река» возможны прерывания объ­ектами «береговая линия», «пристань», «маяк» и пр., что по­зволяет структурировать сложный объект «бассейн реки». Прерывание интерпретируется как реализация парадигматиче­ских отношений «целое — часть» и «объект — признак».

Аппарат связанных объектов — грамматическое средство, реализующее парадигматические отношения «целое — часть» и «объект — признак» в среде объектов, имеющих площадь (вы­ражающихся в масштабе карты). Связанные объекты логически входят в структуру главного объекта, связаны с ним семантиче­ски, расположены на территории ведущего объекта. Например, у объекта «озеро» в качестве связанных могут выступать объек­ты «изобата», «остров», «паромная переправа» и т. д.

Аппарат заполнений реализует эти же типы отношений между «площадными» и дискретными (не имеющими площа­ди, выражающейся в масштабе карты) объектами. Объекты и характеристики заполнения обязательно расположены в гра­ницах главного объекта и связаны с ним логически. Для объек­та «озеро» заполнениями являются дискретные объекты «ха­рактеристика грунта», «отметка глубины» и пр.

Грамматические средства реализованы программно и за­креплены в структурах интегрального файла, имеющего спе-


циальные поля прерывания, связности и заполнений. В форма­тах базовой структуры перечислены информационные едини­цы, находящиеся в фиксированных в концептуальной модели парадигматических отношениях. Эти единицы сгруппированы в списки классификатора и предъявляются пользователю в процессе индексирования. Синтагматические отношения могут устанавливаться между произвольно выбранными из класси­фикатора информационными единицами в процессе индекси­рования и не задаются в базовой структуре.

Базовая структура позволяет строить фреймы, описыва­ющие конкретные достаточно сложные ситуации. При этом возможно получение контекстуальных знаний, не содержащих­ся непосредственно в знаках исходного документа. Например, при обработке раздела карты «Гидрография и гидротехниче­ские сооружения» возможно структурировать фреймы «бассейн реки», «берега, удобные для строительства», «фарватеры боль­шегрузных рек» и т. д., непосредственно в знаках картографии не выраженные. Созданные на базе данной концепции системы ориентированы на любые виды картографических документов.






Не нашли, что искали? Воспользуйтесь поиском:

vikidalka.ru - 2015-2024 год. Все права принадлежат их авторам! Нарушение авторских прав | Нарушение персональных данных