Аспектно-ориентированный анализ тональности политического дискурса

Brunova, E. G.; Bidulya, Yu. V.; Gorbunov, A. A; Брунова, Е. Г.; Бидуля, Ю. В.; Горбунов, А. А.

Please use this identifier to cite or link to this item: https://elib.utmn.ru/jspui/handle/ru-tsu/7450

Title:	Аспектно-ориентированный анализ тональности политического дискурса
Other Titles:	Aspect-based sentiment analysis of political discourse
Authors:	Brunova, E. G. Bidulya, Yu. V. Gorbunov, A. A Брунова, Е. Г. Бидуля, Ю. В. Горбунов, А. А.
Keywords:	applied linguistics natural language processing sentiment analysis aspect sentiment lexicon rule-based classifier political discourse прикладная лингвистика обработка естественного языка анализ тональности текста аспект оценочный лексикон классификатор на основе правил политический дискурс
Issue Date:	2021
Publisher:	Издательство Тюменского государственного университета
Citation:	Брунова Е. Г. Аспектно-ориентированный анализ тональности политического дискурса / Е. Г. Брунова, Ю. В. Бидуля, А. А. Горбунов. – Текст : электронный // Вестник Тюменского государственного университета. Серия: Гуманитарные исследования. Humanitates / главный редактор Н. Н. Белозёрова. – Тюмень : Издательство Тюменского государственного университета, 2021. – Т. 7, № 3(27). – С. 6-22.
Abstract:	The existing systems for accurate sentiment analysis are mainly based on statistical and mathematical principles. However, more promising are the works that are devoted to the study of the linguistic features of the evaluation expression. The results of this formalization can be applied both in the field of affective computing for further improvement of automatic systems and for linguistics and related sciences. The novelty of this study lies mainly in the development of an algorithm based on the identified linguistic rules. In addition, the research material is political discourse, which has not yet been studied enough by specialists of affective computing. The relevance of this work is justified by the growing need for categorization of information published on the Internet. The purpose of the study is to develop a system for machine sentiment analysis of Englishlanguage political texts, as well as to identify aspects and their distribution for subsequent use in enhancement. The article discusses the linguistic features of sentiment analysis and suggests a classification of linguistic units with sentiment potential in relation to levels of language structure. The results of an experiment on testing the operation of the sentiment analysis system, conducted on 300 news articles and user comments taken from reddit.com/r/ politics, are also presented. The accuracy of the system is 92%. In addition, the selected 40 comments were manually marked up and tagged; during this process the expert identified 25 aspects. Furthermore, 3 formal patterns were identified in the distribution of aspect terms, which is necessary for creating an automatic system. The first peculiarity is that the aspect terms are repeated in two consecutive sentences. The second is that aspect terms are often the themes of sentences. Finally, the third – a high frequency of distribution of aspect terms at the beginning and end of the text (document) was revealed. Существующие системы по успешному и точному определению тональности текста основаны на статистических и математических принципах. Однако ничуть не менее интересными и перспективными являются работы, которые посвящены изучению лингвистических особенностей выражения оценки. Результаты данной формализации возможно применить как в области аффективных вычислений для дальнейшего совершенствования автоматических систем, так и для лингвистики и смежных с ней наук. Новизна данного исследования заключается, прежде всего, в составлении алгоритма, основанного на выявленных лингвистических правилах. Кроме того, материалом исследования стал политический дискурс, который еще недостаточно изучен специалистами аффективных вычислений. Актуальность работы обоснована растущей необходимостью категоризации публикуемой в сети Интернет информации. Цель исследования заключается в создании системы машинного определения тональности англоязычного политического дискурса, а также в выявлении аспектов сообщаемой информации для последующего применения в разработке. В статье рассматриваются лингвистические особенности анализа тональности и предлагается классификация лингвистических единиц с оценочным потенциалом применительно к структурным уровням языка. Также приводятся результаты эксперимента по тестированию работы системы автоматического определения тональности, проведенного на 300 документах новостей и комментариев, взятых с сайта reddit.com, раздел r/politics. Точность работы системы составила 92%. Кроме того, в ходе исследования была выполнена ручная разметка отобранных 40 комментариев, в ходе которой эксперт выявил 25 аспектов. Помимо этого, были выявлены 3 формальные закономерности в распределении аспектных терминов, что является необходимым для создания автоматической системы. Первая закономерность заключается в том, что аспектные термины повторяются в двух последовательно идущих предложениях. Вторая – аспектные термины часто являются темой предложения. Наконец, третья – выявлена высокая частота распределения аспектных терминов в начале и конце текста (документа).
URI:	https://elib.utmn.ru/jspui/handle/ru-tsu/7450
ISSN:	2500-0896 2411-197Х
Source:	Вестник Тюменского государственного университета. Серия: Гуманитарные исследования. Humanitates. – 2021. – Т. 7, № 3(27)
Appears in Collections:	Вестник ТюмГУ: Гуманитарные исследования. Humanitates

Files in This Item:

File	Description	Size	Format
humanitates_2021_3_6_22.pdf		694.23 kB	Adobe PDF	View/Open

Show full item record