ТАТ РУС ENG LAT
Халык Тукайны олылый, бөекли, инде әллә ничә буын аңа иман китереп, күңелен түгә. Ни өчен? Хикмәт нәрсәдә? Һәр милләт, һәр халык — кавеменең исәбе-санына, җиренең зурлыгы-киңлегенә...

Булат ХАКИМОВ Квантитативная характеристика языка поэзии Г.Тукая

 

Описание особенностей тех или иных языковых явлений в литературных произведениях с использованием их количественных характеристик дает интересные результаты, получение которых зачастую невозможно с помощью лишь традиционных методов лингвистического исследования. Несмотря на то, что статистический метод уже давно прочно вошел в арсенал средств языкознания, в татарском языкознании он является относительно новым. Поэтому выполненная нами квантитативная характеристика языка поэзии Г.Тукая является, по нашему мнению, актуальной для татарской филологии.
Объектом нашего исследования явились поэтические тексты, созданные в различные периоды творчества поэта общим объемом в 26323 словоупотребления. С целью исследования изменений в языке Г.Тукая тексты были разделены на две большие группы – Уральского (11276 СУ) и Казанского (15047 СУ) периодов творчества поэта.
Введенные в компьютер тексты были подвергнуты статистической обработке с помощью специализированной лингвистической программы АРМ лингвиста, созданной в Совместной научно-исследовательской лаборатории проблем искусственного интеллекта при АН Татарстана и КГУ. Для обоих текстовых массивов были созданы частотные словари, которые и послужили материалом для следующего этапа исследования.
На этапе непосредственного квантитативного анализа исследуемых текстов мы оперировали такими статистическими характеристиками, как объем текста и словаря, средняя частота словоформы, относительное разнообразие языка, средняя длина словоформы, доля высоко- и низкочастотных словоформ в текстах и словарях. Объем частотных словарей уральского и казанского периодов составил соответственно 5745 и 6219 словоформ, для сводного текста – 10467 СФ. Средняя частота словоформы, т.е. соотношение объема словаря и объема текста, для уральского периода составила 1,96, для казанского периода 2,42, для сводного текста 2,52 раза.
Согласно результатам последних исследований, средняя частота словоформы в современно татарском литературном языке, в том числе и в языке поэзии, равна четырем. Это свидетельствует о большем разнообразии лексического состава поэтических произведений Г.Тукая по сравнению с современной поэзией. Данный факт объясняется, по нашему мнению, активным использованием заимствованных – арабских и турецко-огузских слов, грамматических элементов, а также параллельное применение литературных и архаичных грамматических форм.
Анализ покрываемости текста высоко- и низкочастотными словоформами показал, что покрываемость текста в поэзии Тукая достигается, в основном, за счет низкочастотных и среднечастотных словоформ. Так, доля низкочастотных, т.е. повторяющихся лишь 1 или 2 раза словоформ в исследованных поэтических текстах составила 33,49%. Первые 10 самых высокочастотных словоформ в свою очередь покрывают лишь 9,22% текста. Данные результаты показывают то, что поэзия Тукая характеризуется богатством лексических и грамматических средств и форм. Это характерно и для татарского языка в целом [Ризванова 2000: 44].
Высокий процент низкочастотных словоформ (84,22% сводного словаря) объясняется и индивидуальными особенностями авторского стиля. Г.Тукай активно использовал неологизмы, которые часто придумывал сам. Кроме того, эффективным художественным средством у поэта служит нестандартное словосложение, изменение фонетической и грамматической структуры слов, что приводит к появлению новых лексических единиц, которые встречаются в тексте обычно лишь один раз.
Г.Тукай приложил много усилий для внедрения в современный ему татарский литературный язык разговорной лексики. Слова из разговорной речи, будучи новым элементом для поэтического языка, тоже встречаются в текстах считанное число раз.
Средняя длина словоформы в проанализированных нами текстах составила 5,26 букв. Эта цифра вписывается в общую картину татарского языка, в котором основную массу словоформ составляют пятибуквенные конструкции. Средняя длина словоформы для современного татарского литературного языка равна 5,91 буквам [Ризванова 2000: 53]. Преобладание несколько более коротких словоформ в исследуемых текстах, по нашему предположению, может быть объяснено более широким употреблением аналитических конструкций в языке Г.Тукая, т.к., согласно лингвостатистическим ислледованиям, средняя длина словоформы возрастает по мере перехода от аналитизма к синтетизму.
Измерение длины словоформы в слогах показало, что основную массу в стихотворениях Г.Тукая составляют двухсложные словоформы.
Квантитативный анализ языка не только поэзии, но и прозы и публицистики Г.Тукая, а также других авторов, имеет несомненный научный интерес и требует продолжения исследований в данной области. 

 

(Источник: Бодуэновские чтения: Бодуэн де Куртенэ и современная
лингвистика: Междунар. науч. конф. (Казань, 11-13 дек. 2001 г.): Труды и
материалы: В 2 т. / Под общ. ред. К.Р.Галиуллина, Г.А.Николаева.-
Казань: Изд-во Казан. ун-та, 2001.– Т. 2.– C.94-95).


Оставить комментарий


*