Главная

Популярная публикация

Научная публикация

Случайная публикация

Обратная связь

ТОР 5 статей:

Методические подходы к анализу финансового состояния предприятия

Проблема периодизации русской литературы ХХ века. Краткая характеристика второй половины ХХ века

Ценовые и неценовые факторы

Характеристика шлифовальных кругов и ее маркировка

Служебные части речи. Предлог. Союз. Частицы

КАТЕГОРИИ:






Проблемы машинного анализа текста




• машинный перевод (синтез текста на другом языке)

• автореферирование (синтез реферата текста на другом языке)

• системы записи под диктовку (синтез письменного/устного текста)

Реферирование производится при помощи синтаксической компрессии – выбора более краткой и более простой синт. конструкции по сравнению с заданной в оригинале.

Приёмы:

• разбивка сложного предложения с неск. придаточными на два или большее число предложений более простой структуры;

• замена придаточного предложения прич. оборотом или предложным оборотом;

• замена причастн. оборота, весьма частого для ораторских выступлений, предложн. оборотом (или сущ. в кос. п. для РЯ);

• замена словосочетания одним словом, а также аббревиатуры.

Толковый переводоведческий словарь. Нелюбин.

Стали у них отбирать книги, которые они привезли из родительских домов. Стали у них отбирать книги, привезенные из родительских домов. Стали у них отбирать книги из родительских домов.

Или при помощи информационной компрессии – это сжатие плана означающего при сохранении плана означаемого (Валгина, «Теория текста»)

• сжатие данного означающего;

• создание нового означающего.

Для компрессии текста: Убрать глагольно-именные перифразы: обеспечивать гарантию – гарантировать, ведущее подготовку – готовящее и т.д. Можно убирать предикаты опр. семантики. Лишние слова со значением наличия или появления: иметься, имеющийся, иметь место, существующий, наблюдающийся, появляющийся и др. Можно убрать слово, сема которого содержится в другой единице (деятельность по осуществлению мероприятий по реорганизации=осуществить реорганизацию). Неполнознаменательные существительные – долой! (обеспечение стратегии подготовки=обеспечить подготовку).

Машинный анализ.

1. убрать ошибки;

2. снять неоднозначность;

3. сократить.

Поиск ошибок. Перечень услуг над компьютерными играми может быть разной локализацией = Услуги по локализации компьютерных игр могут включать… + вин.падеж.

Снятие синтаксической неоднозначности – важнейшая задача машинного синтаксического анализа.

• Маша знает, что она красивая. Может быть как моносубъектным, так и полисубъектным.(= Маша знает, что уж она-то, Маша, красивая, либо Маша знает, что кто-то еще красивый)

• Она знает, что Маша красивая. Предложение однозначно полисубъектно.

• Во время грозы старушка спрятала голову под подушку и не вынимала её из-под неё, пока она не кончилась. 

Сокращение. Заир – это та страна, где корпорации вытесняют небольшие частные компании. Непонятно, кто кого вытесняет, → лучше использовать конструкцию со словом «вытесняются».

Синтаксические операции при переводе текста. Нужно учитывать:

- разницу в управлении слов

- разницу в передаче фазисных значений (develop resistance=стать устойчивым к)

- разницу в передаче одних и тех же значений причастием или существительным (increased malaria = рост малярии), словом или словосочетанием (malaria = заболеваемость малярией), глагольно-именной перифразой и придаточным предложением (attribute increased malaria to mosquitoes having developed resistance to insecticides= приписывать тому, что москиты стали более устойчивы к инсектицидам).

 






Не нашли, что искали? Воспользуйтесь поиском:

vikidalka.ru - 2015-2024 год. Все права принадлежат их авторам! Нарушение авторских прав | Нарушение персональных данных