Главная

Популярная публикация

Научная публикация

Случайная публикация

Обратная связь

ТОР 5 статей:

Методические подходы к анализу финансового состояния предприятия

Проблема периодизации русской литературы ХХ века. Краткая характеристика второй половины ХХ века

Ценовые и неценовые факторы

Характеристика шлифовальных кругов и ее маркировка

Служебные части речи. Предлог. Союз. Частицы

КАТЕГОРИИ:






Осн задача лингвист описания во многих областях лингвистики - сбор новых языковых фактов.

Лингвография

1. морфемография

2. фразеография

3. лексикография

4. паремиография

5. графия

Лингв и энциклопед словари:

1. лингв(языков) словарь

2. энциклопед словарь «Вещарь»Л.В.Успенский:общие или отраслевые

Лингв словарь - сод сведения о значении слов, их употреблении, строении, происхождении и т.д. Справочник, предоставляющий пользователю упрядочен совокупность языков, речевых единиц(слов, морфем, словосочет) и их характеристики или иноязыч соответствия.

 

 

Виды ЛС (лингвистических словарей):

1. по предназначению: общие/учебные: актив, продуктив(для речепроизводсва)/пассив, рецептив(для речевосприятия)

2. по объему: бол/сред/малые

3. по единицам(объему)описания: словари букв/слогов/морфем/слов/словосочет/предлож

4. по расположению описыв-го материала:алфавитные(прямые и обратные)/гнездовые(словообразоват)/частотные/тематические

5. по полноте охвата единиц: тезаурусы,полные(весь состав ед)/атезаурусы,выборочные,селектив,дифференц(часть ед)

6. по отбору единиц: общие/частотные

отбор по сфере употребления - разгов, термин, диалект

происхождению (СИС)

источнику (авторские словари)

словари неологизмов, архаизмов, сокращений, инояз слов, омонимов

7. по представленным характеристикам:

ü аспектные - хар преимущественно 1 сторона описываемой единицы(орфограф,орфоэп,акцентолог,частот,словоизмен,словообраз,ассоциатив,сочетаемости, этимолог,контекст-конкордансы)

ü полиаспектные/комплексные - различ стороны, обычно-толковые словари

8. по характеру описания единиц: объяснит-е - инф как разъяснение, толкование; демонстрир-е - инф сообщается простым представлением описываемых единиц

9. по способу, форме сущ-я: автономные(изд-ся отдел книгой); включ-е(часть к-л издания

10. по временным хар-м: диахронические(развитые);синхронические(опред момент времени)

11. по кол-ву языков: 1яз/2яз/многояз

2яз словари:

ü по направленности: однонаправ-е - моноскапальные/двунаправ - биоскопальные (рус-нем нем-рус сл)

ü по ориентации на адресатов: монодирекционные - 1 адресат(рус-англ для русскояз-х)/бидирекционные - для 2 адресатов

12. по носителю инф-ции: бумажные/комп-е

Метаязык словаря - система понятий и назыв их терминов, разл условных знаков, с помощью кот описыв словарь, его структура и сод-е.

Элементы метаязыка словаря - послед эл-ты.

Макроструктура словаря - состав, компоненты, принципы расположения словар статей.

Микроструктура - словар статья, ее строение.

Словарная статья - основ структ единица словаря, сост из заголов единиц.

Заголов-я единица(заголовок словар статьи) - языков единица, возглав словар статью и явл объектом словар описания.

Словник - совокупность описыв-х или подлежащих описанию единиц в словаре: заголовочные ед/заголов и внутристатейные ед.

Лингвографич-е/словар пометы - элемент словар описания (сокращ слово или словосочет), с помощью кот сообщается, что соответств-я яз единица или яз явление отн-ся к опред совокупности однород-х в к-л соотношении единиц.

Виды помет:

1. грамматич

2. лексич(о чел, транспорте)

3. семантич

4. функцион, в том числе терминологич

5. стилистич

6. эмоцион-экпрессив

7. хронологич(устар,ист,нов)

8. статистич

9. запретительные

10. ограничит-е

обычно эксплицируются в вводной части словаря.

Принцип лингвографирования:

1. максимум инф на минимуме места - без ущерба для интересов читателя/пользователя

2. подобное всегда описывается в словаре одинаково

3. из 2 возмож-х интерпретаций яз материала выбир более информатив-я

Лингвограф компетенция вкл:

1. осознание потребности обращения к словарю для решения познават-х и коммуникатив задач

2. умение выбрать нужное лингвограф-е произведение с учетом его типа и жанра

3. умение воспроизводить текст словаря и извлекать из него необходим инф о языков единицах

4. умение сопоставить различ словари

 

Информационный поиск.

Много публикации→рост инф→развитие теории инф поиска, нашедшая практич применение в создании ИПС.

ИПС:

1. ручные (картотеки, каталоги)

2. механизиров-е - с перфокартами

3. автоматизиров-е - на основе ЭВМ

Инф запрос - инф потребность, выраж в виде текста.

Инф обычно представлена в виде текстов-документов.

При инф поиске происходит сравнение сод-я 2 текстов - запроса и документа - опред степень их смыслов близости.

Релевантностный документ - соответств, подход-й.

Релевантность - степень соответствия одного текста другому.

Сод-е документа должно соотв инф потребности.

Запрос не всегда точно выражает потребность, трудности формулировки могут возникнуть из-за: недостат знания предмета, неоднозначности языка.

На понятии релев-ти основ глав показатели эффектив-ти инф поиска:

1. точность - отн-е кол-ва выданных релев документов к общему числу док-в в выдаче

2. полнота - отн-е кол-ва выданных релев док-в к общему числу рел док-в, содерж-ся в инф массиве.

2 вида ИП в зависимости от объекта и цели поиска: документальный/фактографический.

Библиограф поиск - разновидность документ-го - осуществ-ся по элем-м библ описания документов(год, место, вид издания, автор..)

Инф-поисковые языки:

1. классификатив типа - в основе-систематич классификация понятий - УДК- универс-десятерич классиф-я/ ББК -библиотеч-библиограф класс-я

2. дескрипторного типа - в основе перечень лексич единиц в виде слов или словосочет-й

3. объектно-признакового типа - объект и его значение

Идеальный ИПЯ:

1. достаточ семантич сила - описыв тему с необход точностью и полнотой

2. однозначность - запись на ИПЯ имеет только 1 смысл

3. открытость - возможность пополнения и корректировки лексич ср-в языка

 

Лексич контроль.

Цель - однозначное представление понятий в док-те и запросе в независимости от способа их выражения в текстах.

Суть:

1. контроль синонимии

2. разрешение омонимии

3. сведение воедино всех вариантов 1 и того же слова

В число синонимов:

1. полные синонимы(языкознание=лингвистика)

2. фонетич/графич варианты слов (диереза-диэреза)

3. аббревиатуры

4. совпадение по смыслу слова(в 1 из значений)

 

Тезаурусное описание - 1 из оптимал и перспектив форм представления предметной области.

Тезаурус - понятийно-терминолог справочник, в кот отражены разл рода связи между элементами, важен не только для ИП, но и для наглядного представления предметной области:

1. заглавное слово

2. синоним/вариант

3. коррелят/антоним

4. гипероним/родовое понятие

5. гипоним/видовое понятие

6. целое

7. компонент

8. инвариант/репрезентируемое

9. вариант/репрезент-е

10. параметр

11. носитель параметра

12. осн функция

13. способ выражения ф-ции

14. объект

15. способ представления объекта

16. осн/типич операция/процедура

17. объекты операции

18. инструмент, метод

19. уровень

20. единицы уровня

21. языковое отношение

22. члены отношения

23. импликация

24. контраст

25. аспект

26. предмет науки

27. «относится к…»

28. ассоциации

29. происхождение, история

 

Квантитативная/вычислит лингвистика - направление в лингвист исследовании; осн метод исследов - количеств/статистич метод анализа.

Использ-е количеств методов в яз-нии:

1. для точности данных, достоверности выводов

2. возможность подвести более достоверную основу

Квантитатив метод - важный фактор, влияющ на лингвист теорию; универсальный - совокупность, сбор, систематич обработка и интерпретация количеств данных для получения науч результатов.

Частота:

1. абсолютная - кол-во описываемых признаков

2. относительная (боле широкая, информатив) - по отн-ю ко всему объему описываемого материала

Ранг - номер позиции описыв-й единицы в частотном перечне единиц; ранг1 эквивалент самой употребит единице.

Количеств методы - при анализе любых языков и речевых единиц, создание международ объединений, периодич издания, научные конференции.

Квантитатив хар-ки позволяют судить:

1. о типичности распр-я изучаемого термина, явления (частотные слова)

2. о наличии/отсутствии корреляции этого явления/признака с др явлением/признаком (многозначность/общеупотребит слова)

Квантитатив хар-ки представляют ценные сведения для сопоставит изучения данных в отношениях: включения, пересечения(частично), исключения(несовпадения)→общие и отличит признаки этих подмножеств.

Подвижное ударение наблюдается у частотных слов.

Структурно-вероятностная модель - имеет значительно-объяснительный материал.

Область применения:

1. лингвист мониторинг функциониров-я языка (политич лингвистика) - предметы лингв мониторинга, типы яз ошибок, инояз заимствования, новые слова и значения

2. комп моделирование языка и речи - исп-е алгоритмов, основ на данных о частоте употребления морфем, фонем

3. дешифровка кодиров текста - данные о частоте употребления фон, морф, а также об их взаимном расположении

4. авторизация/атрибуция текста - авторская экспертиза текста на основе синоним и квазисиноним слов.

Суть - выявление автор предпочтений.

При атрибуции - анализ границы синонимов типа:

1. наречия (едва/немного)

2. частицы (тоже/также)

3. ввод слова

4. фразеологич выражения

5. союзы и союз слова

 

Психолингвистика.- наука, изучающая ненормативные виды коммуникаций.

1. резкое расширение фактографич базы

2. изучение не только «норматив» проявлений в речевой деятельности

3. широкое исп-е разнообраз методик эксперимент исследования

«Ненорматив» виды коммуникаций:

1. детская речь - процесс овладения языком, помогает понять яз, речевую деят-ть взрослого чел

2. при патологии - афазия-расстройство речи при поражениях мозга

3. речь в затруд условиях - шум

4. речь на иностран языке (при плохом знании)

5. речь в состоянии эмоц возбуждения, даже стресса

6. коммуникация при помехах в канале связи в исп-х чел комп системах

Методы психолингв исследования:

1) Ведущий метод - эксперимент ( др - наблюдение)

ü на детекцию

ü на различение

Новые эксперименты:

1. ассоциативные/базисные - для исследования ТД слова/группы слов

2. по шкалированию

3. по вероятности/прогнозированию

4. по классификации

+ выделение ключевых слов

Направл-й ассоциатив эксперимент вводит ограничения.

2) Методика семантического дифференциала Ч.Осгуда - возникла как оценка стимула в к-л признаках: ассоциации/шкалирование - для каждого признака/шкалы задается степень силы от этого признака.

Методика шкальной оценки применяется и для оценки целых текстов/радиорепортажей, науч-попул и даже художеств текстов.

3) Вероятностное прогнозирование - чел исп-т накоплен материал опыт для прогнозирования ситуаций и наиболее эффектив действий.

Обработка→усреднение:

ü бытовая лексика - завышенная оценка

ü терминология

4) Индексирование - выделение ключевых слов, появл «ядро» - общее понимание текста:

ü малые - 1-4 самых частых слов

ü средние - первые 7-10 слов

ü большие - около 15-20 слов

Применение экспериментальной психолингвистики:

ü в инженерной психологии (улучшить работу диспетчеров)

ü в теории сивязи

ü в методике преподавания языков

ü в пропаганде (исп-ть механизмы и особенности речевого воздействия)

 


Терминология - особая часть языковой системы, изучается в терминоведении. В широком понимании соотносится с областью всех терминов естеств языка, в узком - связывается с терминами конкретной научной дисциплины или спец области практич деятельности.

Терминография - разрабатывает принципы построения спец терминологических словарей.

Терминосистема - образуется терминами в рамках одной теории. Большая часть терминов входит в лексику языка через соответств терминосистемы.

Термины - слова(словосочетания) метаязыка науки и приложений науч дисциплин; слова, обознач-е специфические реалии областей конкретной практич деятельности человека(номенклатура). Терминами не явл: формулы, матем и символьные выражения разл рода(впрочем, символы могут входить в термины). Термину сопоставляется 1 значение, соответственно желательно, чтобы в терминосистеме отсутствовала омонимия терминов. Хотя многозначность термина характеризует его и в рамках 1 терминосистемы.

Особенность терминологии - отсутствие экспрессивного компонента значения и стилистических характеристик, отличных от нейтрального или научного стилей.

Детерминологизация - потеря термином своего терминологического статуса, он становится частью системы литерат языка, что приводит к возникновению языков выражений с сильной экспрессией(черная дыра).

Ретерминологизация - переход термина из одной науки в другую(понятие переменной).

Важнейшие направления деятельности в т-ведении и т-графии: разработка ТБД, унификация терминов и терминосистем, перевод научно-технич терминологии, создание словарей спец терминов, разработка принципов формирования спец словарей.

Препятствия для науч-технич прогресса: многозначность терминов 1 терминосистемы, омонимия, отсутствие согласования между близкими терминосистемами.

ТБД - терминологические банки данных по разл областям знания и сферам практич деятельности, автоматич обработка больших массивов терминологич инф-ции.

 

Полевая лингвистика - (предполагает «выезд в поле»)лингв дисциплина, разрабатыв-я и практик-я методы получения инф о неизвестном исследователю языке на основании работы с его носителями. Доступ к языку возможен лишь при обращении к языковой компетенции носителя языка.

Противопоставлена «кабинетной» л-ке, для кот источником данных явл или яз интуиция исследователя, явл носителем изучаемого языка или хорошо им владеющего, или обширный корпус текстов на изучаемом языке, о кот известно достаточно много.

Техника описания «освоенных» языков опирается на: наличие неогранич кол-ва письменных текстов, возможность привлечения метода «интроспекции»(исп-е исследователем себя как эксперта по построению и интерпретации яз выражений данного языка).

Полевая л-ка - часть описательного языкознания, отлич от нее рядом специфич методов:

1. как эксперимент область знания, исп специал методы извлечения лингв инф-ции

2. неразрывно связана с носителем языка(информант/переводчик), кот явл посредником между исследователем и языком

3. преобладает активный метод целенаправленного интервьюирования по определ программе

Требования к информантам:

1. способность к порождению повествовательных текстов

2. умение организовать диалог и вовлечь в него др информанта

3. иметь языков интуицию и способность актуализировать внеязыковой контекст, естеств для данного языков выражения

Наиболее ценная способность информанта:

1. его научаемость,

2. терпение

3. отсутствие чувства «языкового престижа»

Эффективная полевая работа предполагает:

1. фиксацию языков данных

2. извлечение из них лежащей в их основе языков структуры → что требует исп-я

Методы обнаружения грамматич фактов (наиболее продуктив технологии):

1. перевод с языка-посредника на язык-объект

2. парадигматический метод опроса (выявление парадигм отн-ий м/у яз выражениями яз-объекта)

3. метод подстановок (замена в исходном высказывании 1 элементарного смысла)

4. перекрестный метод (вопросы задаются в разброс с целью подавить нежелат связи м/у вопросами)

5. ассоциативный метод (новые высказывания строятся по ассоц с текущим)

6. перефразирование, наводящие вопросы (чтобы избежать прямых вопросов)

7. извлечение примеров

8. стимул с исправлениями (намеренное искажение яз выражения)

Результаты полев исследов-й максим востребованы в типологии, кот необходимы факты как можно большего числа языков мира.

 

 

Социолингвистика - отрасль языкознания, изуч-я язык в связи с соц условиями его существования, язык в его соц контексте.

Соц условия - комплекс внешних обстоятельств, в кот реально функцион и развивается язык: общество людей, исп данный язык, со структура этого общества, различия м/у носителями языка в возрасте, соц статусе, уровне культуры и образования, месте проживания, различия в их речевом поведении в зависимости от ситуации общения.

Объект социо-ки - то, как пользуются языком люди, состав то или иное общество(не собственно язык, его внутреннее устройство).

Факторы, влияющие на исп-е языка: различ характеристики самих говорящих, особенности конкретного речевого акта и т.д.

Осн понятия: яз сообщество, яз ситуация, соц-коммуникатив система, яз социализация, коммуникатив компетенция, яз код, переключение кодов, билингвизм, диглоссия, яз политика и др.+ яз норма, речевое общение, реч поведение, реч акт, яз контакт, смешение языков, яз-посредник, соц статус, соц структура общества, соц роль, соц фактор и др.

Главные цели (соответств 2 кардинальным проблемам):

1. изучение того, как исп-т язык люди, состав то или иное общество

2. как влияют на развитие языка изменения в обществе, в кот сущ-т данный язык

Проблемы с-ки:

1. проблема соц дифференциации языка

2. проблема соц обусловленности развития языка

Социолингв-я инф важна при разработке проблем и практич мер, состав яз политику гос-ва.

Яз политика требует особой гибкости и учета множества факторов в условиях полиэтнич и многоязычных стран.

1 из инструментов яз политики - законы о языках, чья разработка - компетенция юристов.

Сферы приложения социолингв теории и с-х исследований зависят от характера яз ситуации в той или иной стране: в многояз странах - выбор 1 яз-макропосредника; в монояз-х - проблемы кодификации и нормирования литерат языка, его отношения с др подсистемами национ языка.

Корпусная лингвистика.

Любое лингвист исследование опирается на анализ яз материала, яз данных.

Осн задача лингвист описания во многих областях лингвистики - сбор новых языковых фактов.

Новые информац технологии (комп системы, системы связи, системы мультимедиа) значительно облегчили сбор данных. Встает задача разработки общих принципов построения лингв корпусов данных с исп-м современн комп технологий.

Осн понятия:

1. Проблемная область - область реализации яз системы, содерж феномены, подлежащие лингвист описанию, м.б. сколь угодно велика или мала - опред-ся выбранным объектом анализа.

2. Корпус данных - сформиров по опред правилам выборка данных из проблемной области, результат отображения проблемной области.

3. Единица хранения корпуса данных - некоторая совокупность естественно-языковых выражений проблемной области - отд слова, короткие фразы, словосочетания (синтагмы), предложения, если корпус предполаг для синтаксич анализа - целые тексты или их большие фрагменты; зависит от того, по каким правилам осуществляется выборка.

4. Корпус текстов - вид корпуса данных, единицами кот явл тексты или их достат значит- фрагменты.

 

Типы корпусов данных:

1. исследовательские - предназначены преимущественно для изучения различ аспектов функционирования яз системы, строятся до его проведения. Ориентиров на широкий класс линвист задач, что требует исп-ть пропорциональное суждение.

2. иллюстративные - созд после проведения науч исследования, их цель-подтвердить и обосновать уже полученные факты, не явл слепком, правильным отображением пробл области, включ лишь то, что достаточно для иллюстрации описываемого феномена.

3. динамические/мониторные (отражение процессуального аспекта пробл области, не предполагают раз и навсегда заданного набора текстов) и статические (отражающ определ временное состояние яз системы - авторские корпусы-коллекции текстов писателей).

4. корпусы параллельных текстов - подмножество текстов на яз-источнике и одно или несколько подмножеств текстов, явл переводами текстов яз-источника на яз-цели, формир-ся для науч и практич целей(преподавание иностран языков).

 

Автоматизированные обучающие системы (АОС).

Компьют-я обучения - 1 из сильных тенденций в соврем педагогике, 1 из сложнейших задач, стоящих перед системой образования.

Цель - коренным образом повысить эффективность обучающих воздействий благодаря повыш мотивации, одновременно сокращая затраты человеч труда. Особую актуальность АОС принимает в связи с распространением ПК.

Процесс автоматизации состоит в разработке и применении АОС.

Компоненты АОС:

1. комплекс технич средств обучения

2. пакет обучающих программ

3. база знаний о предметной области

4. база данных, регистрир-я результаты обучающих воздействий

Функции (опред-ся обуч-ми воздействиями, кот оказывают на обучаемых вход в систему программы):

1. собственно обучение

2. тренировка

3. контроль

4. оценка

Дополнит ф-ции АОС (реализуются факультативно):

1. регистрация результатов учебной деятельности

2. информирование обучаемого

3. ведение диалога

4. выбор стратегии и тактики обучения(настройка системы на обучаемого)

Осн задачи АОС:

1. отбор материала и его классификация

2. разработка сценария диалога

3. внешнее оформление, программы

4. организация взаимодействия в системе(реализация комплексного подхода к обучению)

5. разработка языка представления данных

6. организация баз данных по предметной области и интерфейса для их ведения

 

Перевод - деятельность, заключающаяся в передаче содержания текста на одном языке средствами другого языка, а также результат такой деятельности. Перевод междисциплинарен - связан не только с наукой о языке, но и с литературоведением, когнитивными науками, культ антропологией, страноведением.

Переводоведение - наука о переводе, занимается теоретическим осмыслением и оптимизацией машинного перевода. Включ в себя несколько направлений:

1. теория перевода

2. анализ перевода

3. методика обучения переводу

Особое место занимает машинный перевод (МП)/автоматический перевод(АП) - научная и технологическая дисциплина, связанная с наукой о переводе и комп лингвистикой.

Начало работ по МП вызвано:

1. инф-м взрывом в 50е гг. 20 века - существенно возрастают объемы научно-технич инф-ции, перевод всей периодики оказывается некозможен

2. «холодной войной» - противостоящ полит системы следили за развитием науч-технич потенциала друг друга

Периодизация стратегий МП:

1. стратегия «прямого перевода» - исходный текст на «входном языке» постепенно преобразуется в текст «выходного языка», замена на словарный эквивалент. Прямой перевод всегда привязан к конкретной паре языков.

2. стратегия перевода через язык-посредник или стратегия языка-посредника - м/у структурами входного и выходного языков нах-ся 1 или несколько промежуточных языков, на кот по соответств-м правилам постепенно переписываются выражения языка L1. Анализ ведется в категориях входного яз, синтез - в категориях выходного.

Системы МП, возник в 80х гг., рассматриваются как часть систем искусств интеллекта.

Эта стратегия достат условно соответствует второму поколению систем МП - эти системы исп-т синтаксич и семантико-синтаксич языки-посредники.

3. стратегия «универсального семантич языка» - не зависит от конкретного вход и выход языка.

Остается весьма отдаленной перспективой.

Элементы типологии систем МП (комп средства перевода):

1. системы МП - не исключают участие человека на этапе предредактирования и постредактирования.

2. системы человеко-машинного перевода(ЧМП):

ü системы МП с участием человека

ü системы человеч-го перевода с участием машины (автоматизированное рабочее место переводчика - комп системы, помогающие чел в осуществлении перевода текста)

3. терминологические базы/банки данных(ТБД) - легко модифицируются и позволяют фиксировать самую послед словарную инф-цию по выбранной проблемной области; исп-ся для создания 2яз и многояз словарей, для разработки автоматизиров-х словарных систем МП; состав важную часть рабочего места переводчика.

Основные области исп-я МП:

1. службы научной инф-ци различных ведомств и организаций - низкие требования к качеству перевода→исп-е систем МП 1го поколения

2. крупные м/ународные организации, исп-е документы на многих языках (ООН, офиц структуры ЕС) - требования довольно высоки, этап постредактирования необходим даже ждя систем МП с хорошими характеристиками.

3. техническая документация

Системы МП успешно функционируют в тех областях, где не требуется абсолют точность перевода или есть существ ограничения на исп-е структур естественного языка, где вход яз упрощен и нормирован. Проблемные области - подъязык метеосводок.

Цель создания промышленных МП - получение МП потоков документов, организованное как регулярный процесс.

Требования к системам МП:

1. устойчивость работы системы - система МП должна давать результат, кот специалист может исп-ть даже в случае «грубых переводов» - дефект исход перерабат материала, неполнота словарного обеспечения.

2. тиражируемость системы - достат простые программные и линвист средсва для расширения областей применения + выделение универсальн моделей, исп-е кот облегчает переход к новым предметным областям и языкам.

3. адаптируемость системы - система МП должна иметь средства настройки на потребности конкрет пользователей и особенности обрабат материалов.

4. оптимальность временных параметров - скорость перевода должна соответствовать объему поступающей в единицу времени инф-ции, или нормам работы редакторов, переводчиков или специалистов, явл-ся пользователями системы

5. комфорт пользователя - сервис ср-ва системы должны обеспечивать удобство работы пользователя как в пакетном, так и в диалоговом режиме.

 


 

<== предыдущая лекция | следующая лекция ==>
Почеркознавча експертиза | 


Не нашли, что искали? Воспользуйтесь поиском:

vikidalka.ru - 2015-2024 год. Все права принадлежат их авторам! Нарушение авторских прав | Нарушение персональных данных