ББК 83.3(2)64
УДК 82.02
Н. А. Чубыкин, М. П. Двойнишникова
N. Chubykin, M. Dvoinishnikova
г. Челябинск, ЮУрГУ
Chelyabinsk, SUSU
РЕЗУЛЬТАТИВНОСТЬ АВТОМАТИЧЕСКОГО ОПРЕДЕЛЕНИЯ АМФИБРАХИЯ В ПРОГРАММЕ «NEOGRANKA.RU»
THE EFFECTIVENESS OF THE AUTOMATIC DETECTION OF AMPHIBRACHIUM IN THE PROGRAM «NEOGRANKA.RU»
Аннотация: Предметом статьи является исследование эффективности автоматического определения амфибрахия в программе «Neogranka.ru». Исследована целесообразность функционала программы. Полученные результаты и выводы, составленные на основе апробации программы, позволяют отнести область автоматического определения метра стихотворного текста к актуальной и востребованной сфере цифровой филологии.
Ключевые слова: стиховедение; метр; амфибрахий; автоматический анализ стихотворения; цифровая филология; стихотворный текст.
Abstract: The subject of the article is a study of the effectiveness of automatic detection of amphibrachium in the program «Neogranka.ru». The expediency of the program’s functionality is investigated. The results obtained and the conclusions drawn based on the approbation of the program make it possible to attribute the area of automatic meter detection of a poetic text to the actual and demanded field of digital philology.
Keywords: poetry; meter; amphibrachy; automatic analysis of a poem; digital philology; poetic text.
Важная задача стиховедения — интеллектуальный анализ текстов большого объема, динамическая обработка корпуса текстовых данных с привлечением математической статистики. Именно объемность выстроившихся перед наукой художественных текстов обуславливает применение современных способов работы с ними. Совершенствование методов цифровой филологии открывает пути для поиска новых закономерностей теории художественного текста. Кроме того, становится возможным принципиальное ускорение ведения научных исследований и механических подсчетов. Потенциально все это вносит существенный вклад в расширение научной базы гуманитарного направления.
Постепенно решаются различные ключевые стиховедческие вопросы. Например, ряд проблем относительно «переводимости» стихотворного метра с других языков и соотношения метра и смысла в стихотворении приобретает более современные точки зрения на их решение. Главным образом, нас интересует эффективное и точное определение стихотворного размера, делающее доступным быстрое изучение текстов. Автоматическое определение метра является тем аспектом области Digital Humanity, который требует особого исследовательского внимания.
Изучением автоматического определения стихотворного размера занимались В. Б. Барахнин [1], А. В. Забайкин, О. Ю. Кожемякина [3], В. Н. Бойков [2], М. С. Караяева, В. А. Соколов, И. А. Пильщиков, А. С. Старостин, Е. М. Брейдо, А. В. Козьмин [4], Е. В. Казарцев и др.
С целью автоматического метрического анализа стиха и выявления качества определения метра мы обратились к программе Neogranka [5]. Российская компания Neogranka разработала одноименную программу по автоматическому метрическому анализу текста и разместила её на сайте Neogranka.ru. Амфибрахий как достаточно частотный трехсложный метр выступает у нас в роли средства для проверки особенностей работы программы.
Программа Neogranka устроена доступно и удобно (см. рис. 1). В специальное окно необходимо ввести строки стихотворения, сохраняя их разбивку, вручную проставить ударения в словах и получить в результате определение размера стиха. Neogranka.ru проводит экспресс-анализ стихов по конкретным параметрам:
1) определение размера стихотворения не более 12 строк;
2) вычисление процента достоверности метра;
3) составление схемы стиха с указанием сильной и слабой позиций.
Рис. 1. Интерфейс программы Neogranka.ru
При проведении через программу пятидесяти стихотворений, написанных амфибрахием, были получены следующие результаты: программа корректно и быстро выявляет метр, автоматически редактирует имеющиеся в словах ошибки, однако не способна распознать правильный размер (стопы и усеченность стоп), а также наличие цезуры. Полученные результаты (см. рис. 2) показательны с точки зрения направленности использования Neogranka.ru, функции которой не могут быть рассчитаны на исследовательскую деятельность профессиональных стиховедов и литературоведов, интересующихся более частными случаями метрической системы стихотворения.
Рис. 2. Вероятность определения метра
Важно отметить, из 30 стихотворных отрывков в 16 случаях амфибрахий был определен на 100 %, в 14 случаях — от 89 % до 99 % (рис. 2). В чем заключается причина ошибки? Почему из 30 стихотворений 100 % амфибрахий был определен только в 16?
Исследования дают информацию, что самая распространенная ошибка в функционировании программы проявляется в постановке сильных позиций во всех словах, даже из одного слога. Программа же не учитывает метрическую композицию сильных позиций, а учитывает только лексическую, с чем и связан сбой. Однако данная ошибка не нарушает точность определения программой метра, а лишь указывает на снижение 100% вероятности.
Второй обнаруженной ошибкой является неправильность расстановки ударений в некоторых словах — притом в тех словах, которые программа не предлагает пользователю на проверку правильности ударений. Например, в слове глазки (в значении: орган зрения человека) робот ставит ударение на второй слог. Это говорит о неполном учете разработчиками всех омографов в словаре программы. Таким образом, омография требует проникновения в смысл текста, поэтому является препятствием для автоматического распознания метра. Так, при создании и использовании программ по автоматическому определению метра должны учитываться специфика и явления русского языка. Такой учет — уникальный источник для дальнейшего технического совершенствования.
Автоматическое определение метра должно подкрепляться семантикой содержания, составляющей проблемную зону для программирования в данной области. Сегодня крайне сложно уделять внимание смысловым отношениям в тексте при программировании и компьютеризации стиховедческих методов. Примечательно, что данная ошибка также не влияет на распознание программой метра, а лишь уменьшает процент вероятности.
Относительно работоспособности Neogranka.ru можно сделать следующий вывод: в программе есть свои положительные и отрицательные аспекты. Плюсы: быстрота работы, понятный интерфейс, высокая достоверность определения метра, автоматическое исправление ошибок; минусы: ограниченность анализируемых строк до двенадцати, некорректная автоматическая расстановка ударений, отсутствие учета омографов в тексте, невозможность распознания размера.
Вышеперечисленные положительные стороны программы и ограничения позволяют произвести однозначную объективную оценку ее работоспособности. Neogranka.ru успешно выполняет свои ключевые функции, обладая широким потенциалом для совершенствования.
Автоматический анализ метрической системы представляет значительный интерес для современного литературоведения, решает востребованные проблемы стиховедения и раскрывает потенциал развития его методологической базы. Несомненно, дальнейшее развитие в этом направлении, усовершенствование программного обеспечения может открыть переход на новый уровень исследований с более детальным и углубленным изучением структуры художественного текста. Пример исследуемой нами программы служит ярким доказательством острой актуальности автоматического определения метрики стиха.
На текущем этапе использование программ по автоматическому определению метра целесообразно и практикуется в научной среде.
Библиографический список
1. Барахнин, В. Б. Алгоритмы комплексного анализа русских поэтических текстов с целью автоматизации процесса создания метрических справочников и конкордансов / В. Б. Барахнин, О. Ю. Кожемякина, А. В. Забайкин // CEUR Workshop Proceedings. — 2015. — Т. 1536. — С.
2. Бойков, В. Н. Об автоматической спецификации стиха в информационно-аналитической системе / В. Н. Бойков, М. С. Караява, В. А. Соколов // CEUR Workshop Proceedings. — 2015. — Т. 1536. — С.
3. Кожемякина, О. Ю. Программная система комплексного анализа русских поэтических текстов: модели и алгоритмы : дис. ... д-ра. техн. наук / О. Ю. Кожемякина. — Новосибирск, 2022. — 288 с.
4. Козьмин, А. В. Автоматический анализ стиха в системе Starling / А. В. Козьмин // Компьютерная лингвистика и интеллектуальные технологии : труды Международной конференции. — М., 2006. — С.
5. Neogranka.ru. — http://neogranka.ru/razmer_stiha.html (дата обращения: 04.05.2024).