Title: | Клиент всегда прав: анализ тональности текста в отзывах о качестве банковского обслуживания |
Other Titles: | The Customer is Always Right: Sentiment Analysis for Bank Service Quality |
Authors: | Brunova, E. G. Bidulya, Yu. V. Брунова, Е. Г. Бидуля, Ю. В. |
Keywords: | lexicon user-generated content rule-based classifier content analysis natural language processing sentiment analysis algorithm лексикон пользовательский контент алгоритм классификатор на основе правил контент-анализ обработка естественного языка анализ тональности текста |
Issue Date: | 2017 |
Publisher: | Издательство Тюменского государственного университета |
Citation: | Брунова, Е. Г. Клиент всегда прав: анализ тональности текста в отзывах о качестве банковского обслуживания / Е. Г. Брунова, Ю. В. Бидуля // Вестник Тюменского государственного университета. Серия: Гуманитарные исследования. Humanitates / главный редактор Н. Н. Белозёрова. – Тюмень : Издательство Тюменского государственного университета, 2017. – Т. 3, № 1. – С. 72-89. |
Abstract: | The purpose of this research is to develop a rule-based algorithm for sentiment analysis. The dataset comprises the reviews in Russian on the bank service quality from clients’ bank rating, www.banki.ru. Sentiment analysis is considered as the classification task, i.e. matching a text with one of the two classes: with positive or negative polarity. The algorithm is based on the use of certain lexical and syntactic structures, along with the sentiment lexicon consisting of positive and negative lexicons, as well as three service classes. The efficiency of the proposed algorithm is estimated with Precision, Recall and F-measure in comparison with the results of another algorithm widely used for sentiment analysis – the Naive Bayes Classifier. To estimate the efficiency, the dataset of 200 reviews on the bank service quality is used. The values of Precision, Recall and F-measure for the proposed algorithm are 5-8% higher than for the Nave Bayes Classifier. Целью исследования является разработка алгоритма на основе правил для анализа тональности текста. Материалом послужили отзывы на русском языке о качестве банковского обслуживания из народного рейтинга банков (сайт www.banki.ru). Анализ тональности текста рассматривается как задача классификации, т. е. отнесение текста к одному из двух классов – с положительной и отрицательной оценкой. В основу алгоритма положено использование определенных лексико-грамматических конструкций наряду с оценочным лексиконом, содержащим классы слов с положительной и отрицательной оценкой, а также три служебных класса. Эффективность предложенного алгоритма оценивается с помощью показателей точности (Precision), полноты (Recall) и меры F Ван Ризбергена в сравнении с результатами работы другого алгоритма, широко применяемого для анализа тональности – Наивного Байесовского классификатора. Для оценки эффективности использован корпус из 200 отзывов о качестве банковского обслуживания. Значения точности, полноты и F-меры у предложенного алгоритма оказались на 5-8% выше, чем у Наивного Байесовского классификатора. |
URI: | https://elib.utmn.ru/jspui/handle/ru-tsu/15145 |
ISSN: | 2500-0896 2411-197Х |
Source: | Вестник Тюменского государственного университета. Серия: Гуманитарные исследования. Humanitates. – 2017. – Т. 3, № 1 |
Appears in Collections: | Вестник ТюмГУ: Гуманитарные исследования. Humanitates
|
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.