ТОР 5 статей: Методические подходы к анализу финансового состояния предприятия Проблема периодизации русской литературы ХХ века. Краткая характеристика второй половины ХХ века Характеристика шлифовальных кругов и ее маркировка Служебные части речи. Предлог. Союз. Частицы КАТЕГОРИИ:
|
Морфологический анализМорфологический анализ русской фразы, как первый этап МП с рус на эстон яз, состоит из 4 частей: 1) лексич обработка фразы - сюда входит исп-е словаря основ путем выделения исходных слов, распр-ие их на статьи (лексемы) по морфологич и семантич принципам (например, сущ на -ние входят в одну статью с формами соотв глагола), выделение основ лексем, мн-во кот и образ-т словарь; 2) идентификация окончания. Морфологич инфа к основе вкл-т тип основы (частицы, сущ, прилаг, глаг), номер табл окончаний, морфологич «сеть» - перечисление форм, имеющихся у дан основы, морфологич признаки - дается перечень признаков у разн типов основ. Вводится понятие «шкалы слова» - перечня возм-х грам интерпретаций для каждой переводимой словоформы. В рез-те предварит анализа стр-ры фразы последняя делится на части. Дается классификация предл-й на 6 типов в завис-ти от их места во фразе и встречаемости в них опр типов слов. Особым этапом производится обработка эквивалентных форм, а именно преобразование неоднозначных шкал слов в однозначные = разрешение дизъюнкций инфы, т.е. снятие грам омонимии. Из этого видно, что на самом деле в этап морфологич анализа входит большое количество операций, с пом кот получается инфа, не всегда относящаяся к собственно морфологич-й. Вследствие этого целесообразно утверждать, что в комп лингвистике понятие морфологич анализа явл-ся понятием операционным. В вычислит (прикладной) лингвистике важно не «что», а «как» получается та или иная инфа, т.е. из формы слова в тексте. В первые годы работ по МП было предложено большое кол-во разнообразного рода алгоритмов автоматич морфологич анализа для яз самого разнообразного строения, отлич-ся друг от друга «морфологией». На сегодняшний день задача морфологич анализа - наиб сложная процедура на уровне слов - может считаться практически решенной, поскольку есть достаточное кол-во удовлетворительно работающих алгоритмов. Авторы монографии «Лингвистич?? алгоритмической обработки сообщений» (Лингвистические вопросы 1983) считают, что за два десятилетия создано по крайней мере несколько десятков алгоритмов морфологич анализа для разн яз, в том числе 10-12 для рус. В разработке морфологич анализа выделилось неск напр-й. Одно из них моделир-т классич схему анализа путем разделения словоформы на основу и предположит-е окончание с послед проверкой на совместимость окончания с остающейся основой. Другое направление исп-т инфу, содержащуюся в конечных буквосочетаниях. Эта инфа получ-ся в рез-те предварит статистич обработки словаря. Третье напр-ние развив-ся в последние годы. На этом напр-нии создаются универсальные математич модели морфологии в форме открытых сис-м уравнений, позв-щих путем вычисления осущ-ть нормализацию словоформ, получение грам инфы и синтез словоформ. В основу построения алгоритмов морфологич анализа положено разбиение всех слов на классы, опр-щие хар-р изм-я буквенного состава форм слова. Эти классы м б назв-ы морфологическими. Изм-я форм слов м носить различн хар-р. Они м б связаны как с изм-ем основы слова, так и с изм-ями его окончания. Изм-ие букв состава основ имеет место, напр, в след парах: сижу - сидишь, шел — шли, тренировка - тренировок, нес - несли, кто — кого, судно - суда, человек-люди. Изм-е окончаний явл-ся осн способом образ-я различн форм слов. В рус яз, напр, оно исп-ся как самостоятельно, так и в сочетании с изм-ем основ слов. Морфологич классы слов делятся на два вида: 1) основоизменительные классы, характеризующие систему изменения основ, 2) флективные классы слов. Они выделялись для рус яз в сис-ме МП АМПАР, напр, на основе анализа их синтаксич f-ций и сис-м падежных, личных и родовых окончаний. Классы неизменяемых слов выделялись только по синтаксич принципу. По своей синтаксич f-ции изменяемые слова объединены в следующие группы: 1) сущ, 2) прилаг, 3) глаг в личн форме, 4) глаг пр вр, кр прилаг и прич, 5) количественные числит. Флективный класс м б охаракт-н либо нек сис-мой признаков, либо словом-представителем, кот явл-ся носителем этих признаков. Признаками, по кот изменяемое слово м б отнесено к опр классу, явл-ся: 1) принадлежность к одной из синтаксич групп (или подгрупп), 2) сис-ма окончаний (тип словоизменения). Не нашли, что искали? Воспользуйтесь поиском:
|