ТОР 5 статей: Методические подходы к анализу финансового состояния предприятия Проблема периодизации русской литературы ХХ века. Краткая характеристика второй половины ХХ века Характеристика шлифовальных кругов и ее маркировка Служебные части речи. Предлог. Союз. Частицы КАТЕГОРИИ:
|
Проблемы машинного анализа текста• машинный перевод (синтез текста на другом языке) • автореферирование (синтез реферата текста на другом языке) • системы записи под диктовку (синтез письменного/устного текста) Реферирование производится при помощи синтаксической компрессии – выбора более краткой и более простой синт. конструкции по сравнению с заданной в оригинале. Приёмы: • разбивка сложного предложения с неск. придаточными на два или большее число предложений более простой структуры; • замена придаточного предложения прич. оборотом или предложным оборотом; • замена причастн. оборота, весьма частого для ораторских выступлений, предложн. оборотом (или сущ. в кос. п. для РЯ); • замена словосочетания одним словом, а также аббревиатуры. Толковый переводоведческий словарь. Нелюбин. Стали у них отбирать книги, которые они привезли из родительских домов. Стали у них отбирать книги, привезенные из родительских домов. Стали у них отбирать книги из родительских домов. Или при помощи информационной компрессии – это сжатие плана означающего при сохранении плана означаемого (Валгина, «Теория текста») • сжатие данного означающего; • создание нового означающего. Для компрессии текста: Убрать глагольно-именные перифразы: обеспечивать гарантию – гарантировать, ведущее подготовку – готовящее и т.д. Можно убирать предикаты опр. семантики. Лишние слова со значением наличия или появления: иметься, имеющийся, иметь место, существующий, наблюдающийся, появляющийся и др. Можно убрать слово, сема которого содержится в другой единице (деятельность по осуществлению мероприятий по реорганизации=осуществить реорганизацию). Неполнознаменательные существительные – долой! (обеспечение стратегии подготовки=обеспечить подготовку). Машинный анализ. 1. убрать ошибки; 2. снять неоднозначность; 3. сократить. Поиск ошибок. Перечень услуг над компьютерными играми может быть разной локализацией = Услуги по локализации компьютерных игр могут включать… + вин.падеж. Снятие синтаксической неоднозначности – важнейшая задача машинного синтаксического анализа. • Маша знает, что она красивая. Может быть как моносубъектным, так и полисубъектным.(= Маша знает, что уж она-то, Маша, красивая, либо Маша знает, что кто-то еще красивый) • Она знает, что Маша красивая. Предложение однозначно полисубъектно. • Во время грозы старушка спрятала голову под подушку и не вынимала её из-под неё, пока она не кончилась. Сокращение. Заир – это та страна, где корпорации вытесняют небольшие частные компании. Непонятно, кто кого вытесняет, → лучше использовать конструкцию со словом «вытесняются». Синтаксические операции при переводе текста. Нужно учитывать: - разницу в управлении слов - разницу в передаче фазисных значений (develop resistance=стать устойчивым к) - разницу в передаче одних и тех же значений причастием или существительным (increased malaria = рост малярии), словом или словосочетанием (malaria = заболеваемость малярией), глагольно-именной перифразой и придаточным предложением (attribute increased malaria to mosquitoes having developed resistance to insecticides= приписывать тому, что москиты стали более устойчивы к инсектицидам).
Не нашли, что искали? Воспользуйтесь поиском:
|