ТОР 5 статей: Методические подходы к анализу финансового состояния предприятия Проблема периодизации русской литературы ХХ века. Краткая характеристика второй половины ХХ века Характеристика шлифовальных кругов и ее маркировка Служебные части речи. Предлог. Союз. Частицы КАТЕГОРИИ:
|
Лингвистический анализ терминологииВ отличие от такого подхода Р. Ю. Кобрин предлагает исходить при построении системы информационного типа из лингвистического анализа терминологии, от которого можно перейти к основам структуры предметного поля. Так, при создании банков картографических данных вне зависимости от конкретного содержания карты на ней присутствуют три вида информации: смысловая (семантическая) информация об объектах и характеристиках, выражаемая терминами естественного языка и системой условных знаков карты; метрическая информация, передающая пространственное положение объектов при помощи принятой системы координат; графическая информация о конфигурации, цвете, размерах условных знаков. Для обработки этих видов информации разработан специальный лингвистический аппарат трансформации картографической информации в форму данных, обеспечивающий хранение, поиск и многоаспектную обработку данных на естественном языке (Кобрин, 1989). Информационно-технологическое обеспечение банка картографических данных представляет набор средств для идентификации, описания, структурирования и кодирования единиц информации, представленных в виде понятийно-терминологической системы предметной области и системы условных знаков, и ориентированных на автоматизацию процедур ввода, хранения и обработки картографической информации. В основу такого информационно-терминологического обеспечения положен принцип логико-лингвистического концептуального моделирования, обеспечивающий формализованное представление всех информационных единиц и отношений между ними в подсистемах, а именно: в базовой структуре, являющейся структурной моделью предметной области, представленной в виде графов и таблиц; в классификаторе картографической информации, представляющем множество информационных единиц в выбранной системе кодирования. В процессе конструирования информационно-терминологического обеспечения была создана терминологическая основа, в которой конкретизированы объекты предметной области в отношениях между ними в виде базового терминологического словника. Для отбора терминов использовался семантический критерий. Так, при разработке области ЛЕС создан словник, включающий 1500 терминов по лесоустроительной тематике и лесному картографированию. Анализ продуктивности терминов и их соответствия перечню базовых моделей, заранее определенных, позволил выделить класс базовых моделей терминов лесоустройства в виде, например таких: П — С — «земельные угодья», С — С — «крутизна склона», С — П — С — «лес орехопромысловой зоны» и т. п. Термины, образованные по этим моделям, включались в базовую структуру и в классификатор картографической информации и использовались в диалоге с ЭВМ. В словниках фиксировались основные парадигматические отношения. Для формализации системы условных знаков были приняты особые модели и сформулированы определения основных информационных единиц, принятых в системе картографического объекта и картографической характеристики. Эти объекты выражаются не словами, а определенным набором полиграфических средств. На картографических документах выделялись следующие типы смысловых отношений между информационными единицами: семантические, метрические, графические. Для их передачи был разработан специальный грамматический аппарат, заданный в базовой структуре, формализованный в классификаторе и предназначенный для передачи следующих видов отношений: 1) род — вид. Этот тип передает иерархические отношения; 2) целое — часть. Здесь передаются отношения включения / Компьютерная лингвистика Глава 4. Терминология, терминоведение, терминография
3) объект — признак/свойство, характеристика. Это наибо 4) действие — объект. Отношение системное и реализуется 5) объект — орудие действия. Отношение системное и реа Введены следующие грамматические средства: а) аппарат прерываний, б) аппарат связанных объектов, в) аппарат заполнений. Аппарат прерываний — грамматическое средство, позволяющее структурировать сложный объект, т. е. представить все синтаксические связи объектов на стадии предмашинной подготовки и индексирования документов, а также формально реализовать эти связи на стадии ввода метрической информации. Например, у объекта «река» возможны прерывания объектами «береговая линия», «пристань», «маяк» и пр., что позволяет структурировать сложный объект «бассейн реки». Прерывание интерпретируется как реализация парадигматических отношений «целое — часть» и «объект — признак». Аппарат связанных объектов — грамматическое средство, реализующее парадигматические отношения «целое — часть» и «объект — признак» в среде объектов, имеющих площадь (выражающихся в масштабе карты). Связанные объекты логически входят в структуру главного объекта, связаны с ним семантически, расположены на территории ведущего объекта. Например, у объекта «озеро» в качестве связанных могут выступать объекты «изобата», «остров», «паромная переправа» и т. д. Аппарат заполнений реализует эти же типы отношений между «площадными» и дискретными (не имеющими площади, выражающейся в масштабе карты) объектами. Объекты и характеристики заполнения обязательно расположены в границах главного объекта и связаны с ним логически. Для объекта «озеро» заполнениями являются дискретные объекты «характеристика грунта», «отметка глубины» и пр. Грамматические средства реализованы программно и закреплены в структурах интегрального файла, имеющего спе- циальные поля прерывания, связности и заполнений. В форматах базовой структуры перечислены информационные единицы, находящиеся в фиксированных в концептуальной модели парадигматических отношениях. Эти единицы сгруппированы в списки классификатора и предъявляются пользователю в процессе индексирования. Синтагматические отношения могут устанавливаться между произвольно выбранными из классификатора информационными единицами в процессе индексирования и не задаются в базовой структуре. Базовая структура позволяет строить фреймы, описывающие конкретные достаточно сложные ситуации. При этом возможно получение контекстуальных знаний, не содержащихся непосредственно в знаках исходного документа. Например, при обработке раздела карты «Гидрография и гидротехнические сооружения» возможно структурировать фреймы «бассейн реки», «берега, удобные для строительства», «фарватеры большегрузных рек» и т. д., непосредственно в знаках картографии не выраженные. Созданные на базе данной концепции системы ориентированы на любые виды картографических документов. Не нашли, что искали? Воспользуйтесь поиском:
|