ББК 83.3(2)64

УДК 82.02

М. П. Двойнишникова, А. А. Кондрашенок, Д. М. Филимонова

M. Dvoynishnikova, A. Kondrashenok, D. Filimonova

г. Челябинск, ЮУрГУ

Chelyabinsk, SUSU

ОПЫТ АВТОМАТИЧЕСКОГО АНАЛИЗА СТИХОТВОРНОГО ТЕКСТА

AUTOMATIC ANALYSIS OF THE POETIC TEXT

Аннотация: Статья посвящена проблеме автоматического анализа метрики русского стиха в современном литературоведении. Приведен обзор одного из самых ранних исследований по теме, написанных в конце ХХ века, и одного из самых последних. Проанализированы существующие программы по автоматическому определению размера и прочих характеристик поэтического текста. Представлены результаты апробации двух программ Rifmoved.ru и «Анализ поэтических текстов онлайн».

Ключевые слова: стиховедение; метр; автоматический анализ стихотворного текста.

Abstract: The article is devoted to the problem of automatic analysis of the metrics of Russian verse in modern literary. An overview of one of the earliest studies on the topic, written at the end of the twentieth century, and one of the most recent. The existing programs for automatic determination of the size and other characteristics of the poetic text are analyzed. The results of the approbation of two programs are presented Rifmoved.ru and «Analysis of poetic texts online».

Keywords: poetry, meter, automatic analysis of the poetic text.

Стиховедение требует выполнения огромного объема однообразных задач. С развитием технологий перед лингвистикой и стиховедением, в частности, открылись новые перспективы, связанные с расширением методологической базы исследований. Автоматический анализ метрики стихотворений изучался в работах В. Б. Барахнина, А. В. Забайкина, О. Ю. Кожемякиной, В. Н. Бойкова, М. С. Караяевой, И. А. Пильщикова, В. А. Соколова, Е. М. Брейдо, А. В. Козьмина, И. В. Кузнецовой, Б. В. Орехова, А. С. Старостина и др.

Автор одной из самых ранних работ по этой теме Е. М. Брейдо («Автоматический анализ метрики русского стиха») считал основной задачей создание систематического формального описания русской метрики, пригодного для компьютерного анализа как стихотворного, так и прозаического текста. Брейдо построил формальную модель и вывел алгоритмы анализа текста. Интересна сама интервальная модель, являющаяся универсальной для всех метрических форм. Понятие интервала рассматривается только по двум параметрам: 1) тип интервала и 2) количество разных интервальных типов в тексте [2]. Первое служит для определения метрической формы в целом, второе для уточнения этого определения. В интервальной модели метр — это набор условий, которым удовлетворяет определенное количество текстов. В ходе экспериментов с редукцией слабых мест R(È) и их наращением A(È) автор выводит следующую формулу: , где i — объём интервала в слогах, f — величина стопы (2 или 3 слога), n — число пропущенных ударений, с — объём метрического интервала (1 или 2 слога). Для реального русского силлабо-тонического стиха подходят формулы (для двусложного) и (для трехсложного), но коэффициенты произвольны (см. табл. 1.).

Таким образом, основные стихотворные формы полностью определяются количеством типов интервалов в тексте и самим набором интервалов. Любой метрической форме можно сопоставить набор интервальных формул, которым она полностью описывается (что удобно для анализа больших объемов текста). С помощью интервального метода можно определять ритмическую структуру прозы, которая неотличима от многоинтервального акцентного стиха.

Таблица 1

Интервальная модель определения размера стихотворения, предложенная Е. М. Брейдо

Размер

Формула объёма интервала

Ямб / Хорей

2n+1

Дактиль / Амфибрахий / Анапест

3n+2

О. Ю. Кожемякина в диссертации «Программная система комплексного анализа русских поэтических текстов: модели и алгоритмы» рассматривает автоматизацию анализа стихотворений с самых ранних исследований по этой теме и до наших дней [3]. Интересно, что первые разработки были сделаны вовсе не филологами, а математиками (Андрей Андреевич Марков и Андрей Николаевич Колмогоров). А. А. Марков стал создателем цепей Маркова, внес существенный вклад в становление количественных методов анализа русской поэзии, исследуя частотность повторения звуковых единиц (гласных и согласных) в тексте романа А. С. Пушкина («Опыт статистического исследования над текстом „Евгения Онегина“, иллюстрирующий связь испытаний в цепь»). Работы А. Н. Колмогорова посвящены анализу статистики речи и стиховедению. Им был сформулирован основной принцип ударности стиха («Замечания об основах русского стихосложения»), выявлены метрические законы, дана классификация и статистика ритмических вариаций метра, проведен анализ и оценка «остаточной энтропии».

Часть работы посвящена теоретическому обоснованию понятия фактуры и разработке математической модели фактуры. Именно О. Ю. Кожемякиной была разработана и реализована в виде web-приложения программа по определению метроритмических характеристик, которую мы рассмотрим далее.

В настоящее время существует более десяти программ, созданных для автоматического анализа метрики стихотворений. Сайт Rifmoved.ru (https://rifmoved.ru/analiz_stihov.htm) основывался на труде В. Онуфриева «Большой словарь рифм русского языка», в котором автор открыл и объяснил новые виды русских созвучий, никем не открытые и не описанные ранее [5]. В. Онуфриев занимался комплексной систематизацией всех рифм русского языка в компьютерной лаборатории.

Rifmoved.ru предоставляет экспресс-анализ стихов в следующих аспектах: подсчет количества стихотворных строф и входящих в них строк; определение типа стихов и строф; вычисление размера стихотворения; выяснение типа рифмовки; распознавание формы стихотворения (сонет, рондо, триолет, рубаи и пр.); вычленение рифмы и рифменных цепей, задействованных в стихотворении.

Кроме этого, сайт содержит теоретический материал по стиховедческим вопросам, например «Словарь разновидностей рифмы», «Справочник по стихосложению», «Псевдонимы в поэзии»; может подобрать рифму к слову, содержит различные опросы, а также поэтический календарь с ближайшими днями рождения поэтов и писателей.

Второй сайт — «Анализ поэтических текстов онлайн» (http://poem.ict.nsc.ru/) — был создан в 2022 году коллективом исследователей, куда входили О. Ю. Кожемякина, В. Б. Барахнин, Н. А. Шашок, И. В. Кузнецова [1]. Данная программная система комплексного анализа русских поэтических текстов предназначена для автоматизированного извлечения из поэтических текстов их характеристик, относящихся к различным структурным уровням (ритмика, фонетика, лексика, грамматика, литературный стиль, тематика, литературный жанр), и исследования их взаимозависимости.

Нами была сделана выборка из десяти стихотворений, написанных разными авторами (А. Блок, С. Маршак, В. Боков, В. Брюсов, Н. А. Некрасов, О. Мандельштам, Е. Евтушенко, А. Дельвиг, М. Исаковский) силлабо-тоническими размерами.

Эти стихотворения были сначала исследованы нами с точки зрения их метрической характеристики (см. табл. 2), а затем они же были проанализированы автоматически с помощью двух вышеуказанных программ (см. рис. 1 и 2).

Таблица 2

Пример анализа стихотворения

Стихотворение

Схема (размер)

Ветер хрипит на мосту меж столбами,

Черная нить под снегами гудёт.

Чудо ползет под моими санями,

Чудо мне сверху поет и поет...

Всё мне, певучее, тяжко и трудно,

Песни твои, и снега, и костры...

Чудо, я сплю, я устал непробудно.

Чудо, ложись в снеговые бугры! [4]

А. Блок

/UU/UU/UU/U

/UU/UU/UU/

/UU/UU/UU/U

/UU/UU/UU/

/UU/UU/UU/U

/UU/UU/UU/

/UU/UU/UU/U

/UU/UU/UU/ 4-стопный дактиль с усеченной стопой в четных строках

Программа Rifmoved.ru будет предлагает анализ по чуть меньшему количеству критериев, чем «Анализ онлайн». Полезной здесь является функция определения типа рифмовки и рифмы, которая работает достаточно последовательно и корректно, тем самым значительно сокращает количество времени, потраченного на анализ этого аспекта при исследовании стихотворения. Из значительных минусов программы можно выделить то, что не во всех текстах вообще определяется размер (например, алгоритм не сработал в стихотворении «Сердце Шопена» В. Бокова или в тексте «Зашумит ли клеверное поле...» Е. Евтушенко). Таким образом, при более сложных случаях метрической организации вероятнее всего программа даст сбой и не произведет анализ стихотворения по одному из ключевых параметров.

Пример анализа стихотворения в программе Rifmoved.ru

Рис. 1. Пример анализа стихотворения в программе Rifmoved.ru

«Анализ поэтических текстов онлайн» помогает более точно определить рифмовку, количество мужских, женских и дактилических окончаний, метрику и стопность стихотворения. Однако в предложенной нами выборке из десяти стихотворений дважды была допущена ошибка при определении размера (например, программа неверно определила стопность дактиля в стихотворении «Ветер хрипит на мосту меж столбами...» А. А. Блока), а в одном из примеров анализ вообще не был произведен. Ни один из сайтов не предлагает схемы размера.

Пример анализа стихотворения в программе «Анализ поэтических текстов онлайн»

Рис. 2. Пример анализа стихотворения в программе «Анализ поэтических текстов онлайн»

Проблема автоматического анализа метрики русского стиха актуальна в наше время, так как технологии активно развиваются. За всё время исследования этой темы с конца прошлого века и до наших дней ученые достигли определенных успехов. Но опыт практического применения различных программ по автоматическому анализу метрики стиха показывает, что они нуждаются в значительной доработке.

Библиографический список

1. Анализ поэтических текстов онлайн. — URL: http://poem.ict.nsc.ru/ (дата обращения: 18.11.2023).

2. Брейдо, Е. М. Автоматический анализ метрики русского стиха : автореф. дис. ... канд. филол. наук / Е. М. Брейдо. — М., 1996. — 26 с.

3. Кожемякина, О. Ю. Программная система комплексного анализа русских поэтических текстов: модели и алгоритмы : дис. ... д-ра. техн. наук / О. Ю. Кожемякина. — Новосибирск, 2022. — 288 с.

4. Русская поэзия. — URL: https://rupoem.ru/blok/veter-xripit-na.aspx (дата обращения: 18.11.2023).

5. Rifmoved.ru. — URL: https://rifmoved.ru/analiz_stihov.htm (дата обращения: 18.11.2023).