Главная

Популярная публикация

Научная публикация

Случайная публикация

Обратная связь

ТОР 5 статей:

Методические подходы к анализу финансового состояния предприятия

Проблема периодизации русской литературы ХХ века. Краткая характеристика второй половины ХХ века

Ценовые и неценовые факторы

Характеристика шлифовальных кругов и ее маркировка

Служебные части речи. Предлог. Союз. Частицы

КАТЕГОРИИ:






Морфологический анализ




Морфологический анализ русской фразы, как первый этап МП с рус на эстон яз, состоит из 4 частей:

1) лексич обработка фразы - сюда входит исп-е сло­варя основ путем выделения исходных слов, распр-ие их на статьи (лексемы) по морфологич и семантич прин­ципам (например, сущ на -ние входят в одну ста­тью с формами соотв глагола), выделение основ лексем, мн-во кот и образ-т словарь;

2) идентификация окончания. Морфологич инфа к основе вкл-т тип основы (частицы, сущ, прилаг, глаг), номер табл окончаний, морфологич «сеть» - пе­речисление форм, имеющихся у дан основы, морфологич признаки - дается перечень признаков у разн типов основ. Вво­дится понятие «шкалы слова» - перечня возм-х грам интерпретаций для каждой переводимой словоформы. В рез-те предварит анализа стр-ры фразы пос­ледняя делится на части. Дается классификация предл-й на 6 типов в завис-ти от их места во фразе и встречаемости в них опр типов слов. Особым этапом производится обработка эквивалентных форм, а именно преобразование неоднозначных шкал слов в однозначные = разрешение дизъюнкций инфы, т.е. снятие грам омонимии.

Из этого видно, что на самом деле в этап морфологич анализа входит большое количество операций, с пом кот получается инфа, не всегда относящаяся к собственно морфологич-й. Вследствие этого целесообразно утверждать, что в комп лингвистике понятие морфологич анализа явл-ся понятием операционным. В вычис­лит (прикладной) лингвистике важно не «что», а «как» полу­чается та или иная инфа, т.е. из формы слова в тексте.

В первые годы работ по МП было предложе­но большое кол-во разнообразного рода алгоритмов автома­тич морфологич анализа для яз самого разнообразного строения, отлич-ся друг от друга «морфоло­гией». На сегодняшний день задача морфологич анализа - наиб сложная процедура на уровне слов - может считаться прак­тически решенной, поскольку есть достаточное кол-во удовлет­ворительно работающих алгоритмов. Авторы монографии «Лингвистич?? алгоритмической обработки сообще­ний» (Лингвистические вопросы 1983) считают, что за два десятилетия создано по крайней мере несколько десятков алгоритмов мор­фологич анализа для разн яз, в том числе 10-12 для рус.

В разработке морфологич анализа выделилось неск нап­р-й. Одно из них моделир-т классич схему анализа путем разделения словоформы на основу и предположит-е окончание с послед проверкой на совместимость окончания с остающейся основой. Другое направление исп-т инфу, содержащуюся в конечных буквосочетаниях. Эта инфа получ-ся в рез-те предварит статистич обработки словаря. Третье напр-ние развив-ся в последние годы. На этом напр-нии создаются уни­версальные математич модели морфологии в форме открытых сис-м уравнений, позв-щих путем вычисления осущ-ть нор­мализацию словоформ, получение грам инфы и син­тез словоформ.

В основу построения алгоритмов морфологич анализа поло­жено разбиение всех слов на классы, опр-щие хар-р изм-я буквенного состава форм слова. Эти классы м б назв-ы морфологическими. Изм-я форм слов м носить различн хар-р. Они м б связаны как с изм-ем основы слова, так и с изм-ями его окончания. Изм-ие букв состава основ имеет место, напр, в след парах: сижу - сидишь, шел — шли, тренировка - тренировок, нес - несли, кто — кого, судно - суда, человек-люди. Изм-е окончаний явл-ся ос­н способом образ-я различн форм слов. В рус яз, напр, оно исп-ся как самостоятельно, так и в сочетании с изм-ем основ слов.

Морфологич классы слов делятся на два вида:

1) основоизменительные классы, характеризующие систему измене­ния основ,

2) флективные классы слов. Они выделялись для рус яз в сис-ме МП АМПАР, напр, на основе анализа их синтаксич f-ций и сис-м падежных, личных и родовых окончаний. Классы неизменяемых слов выделялись только по синтаксич принципу. По своей синтаксич f-ции из­меняемые слова объединены в следующие группы: 1) сущ, 2) прилаг, 3) глаг в личн форме, 4) глаг пр вр, кр прилаг и прич, 5) количе­ственные числит. Флективный класс м б охаракт-н либо нек сис-мой признаков, либо словом-представителем, кот явл-ся носителем этих признаков. Признаками, по кот изменяемое слово м б отнесено к опр классу, явл-ся: 1) принадлежность к одной из синтакси­ч групп (или подгрупп), 2) сис-ма окончаний (тип словоизменения).






Не нашли, что искали? Воспользуйтесь поиском:

vikidalka.ru - 2015-2024 год. Все права принадлежат их авторам! Нарушение авторских прав | Нарушение персональных данных