По их общему словаря в Большом газетном корпусе
Тип. жанры
| Инф.
| Инф.-публ.
| Ост.
| Офиц.-дел.
| Разг.-пис.
| Реклам.
| Собст.-публ.
| Худож.
| Худож.-публ.
| Обий итог
| Число текстов
|
|
|
|
|
|
|
|
|
|
| Число словоупотр.(без цифр и лат.)
|
|
|
|
|
|
|
|
|
|
| Оббьем словаря
|
|
|
|
|
|
|
|
|
|
| Ср. длина текста
| 157,325
| 482,291
|
| 327,243
| 38,2624
| 220,576
| 846,376
| 242,575
| 810,434
| 368,73374
|
демонстрирующих специфику поведения различных языковых единиц в текстах различных жанровых типов.
Общий объем лексемного словаря по всему корпусу — 159 004 лексемы.
Лексемный словарь текстов информационных жанров — 56 303 лексемы.
Лексемный словарь текстов публицистических жанров — 75 721 лексема.
Лексемный словарь текстов информационно-публицистических жанров — 126 259 лексем.
Лексемный словарь текстов художественных жанров — 15 200 лексем.
Лексемный словарь текстов художественно-публицистических жанров — 126 236 лексем.
Лексемный словарь текстов официально-деловых жанров — 17 525 лексем.
Лексемный словарь текстов рекламных жанров — 19 224 лексемы.
Лексемный словарь текстов разговорно-бытовых жанров — ИЗО лексем.
Лексемный словарь текстов остальных жанров — 49 394 лексемы.
На основе анализа текстов Большого корпуса получен полный распределительно-частотный (по текстам разных жанровых типов) словарь лексем. Небольшой фрагмент его приводится ниже (см. табл. 4).
Кроме того, подготовлены к печати полученные на том же материале:
1) Распределительно-частотный (по текстам разных жанровых типов) словарь словоформ;
2) Распределительно-частотный (по текстам разных жанровых типов) словарь корней;
3) Распределительно-частотный (по текстам разных жанровых типов) словарь аффиксальных моделей слов;
4) Распределительно-частотный (по текстам разных жанровых типов) словарь новых слов (не зафиксированных в ранее изданных толковых словарях и не использовавшихся в русских текстах до 90-х гг. прошлого столетия).
Не нашли, что искали? Воспользуйтесь поиском:
|