Клиент всегда прав: анализ тональности текста в отзывах о качестве банковского обслуживания

Brunova, E. G.; Bidulya, Yu. V.; Брунова, Е. Г.; Бидуля, Ю. В.

Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: https://elib.utmn.ru/jspui/handle/ru-tsu/15145

Название:	Клиент всегда прав: анализ тональности текста в отзывах о качестве банковского обслуживания
Другие названия:	The Customer is Always Right: Sentiment Analysis for Bank Service Quality
Авторы:	Brunova, E. G. Bidulya, Yu. V. Брунова, Е. Г. Бидуля, Ю. В.
Ключевые слова:	lexicon user-generated content rule-based classifier content analysis natural language processing sentiment analysis algorithm лексикон пользовательский контент алгоритм классификатор на основе правил контент-анализ обработка естественного языка анализ тональности текста
Дата публикации:	2017
Издатель:	Издательство Тюменского государственного университета
Библиографическое описание:	Брунова, Е. Г. Клиент всегда прав: анализ тональности текста в отзывах о качестве банковского обслуживания / Е. Г. Брунова, Ю. В. Бидуля // Вестник Тюменского государственного университета. Серия: Гуманитарные исследования. Humanitates / главный редактор Н. Н. Белозёрова. – Тюмень : Издательство Тюменского государственного университета, 2017. – Т. 3, № 1. – С. 72-89.
Аннотация (реферат):	The purpose of this research is to develop a rule-based algorithm for sentiment analysis. The dataset comprises the reviews in Russian on the bank service quality from clients’ bank rating, www.banki.ru. Sentiment analysis is considered as the classification task, i.e. matching a text with one of the two classes: with positive or negative polarity. The algorithm is based on the use of certain lexical and syntactic structures, along with the sentiment lexicon consisting of positive and negative lexicons, as well as three service classes. The efficiency of the proposed algorithm is estimated with Precision, Recall and F-measure in comparison with the results of another algorithm widely used for sentiment analysis – the Naive Bayes Classifier. To estimate the efficiency, the dataset of 200 reviews on the bank service quality is used. The values of Precision, Recall and F-measure for the proposed algorithm are 5-8% higher than for the Nave Bayes Classifier. Целью исследования является разработка алгоритма на основе правил для анализа тональности текста. Материалом послужили отзывы на русском языке о качестве банковского обслуживания из народного рейтинга банков (сайт www.banki.ru). Анализ тональности текста рассматривается как задача классификации, т. е. отнесение текста к одному из двух классов – с положительной и отрицательной оценкой. В основу алгоритма положено использование определенных лексико-грамматических конструкций наряду с оценочным лексиконом, содержащим классы слов с положительной и отрицательной оценкой, а также три служебных класса. Эффективность предложенного алгоритма оценивается с помощью показателей точности (Precision), полноты (Recall) и меры F Ван Ризбергена в сравнении с результатами работы другого алгоритма, широко применяемого для анализа тональности – Наивного Байесовского классификатора. Для оценки эффективности использован корпус из 200 отзывов о качестве банковского обслуживания. Значения точности, полноты и F-меры у предложенного алгоритма оказались на 5-8% выше, чем у Наивного Байесовского классификатора.
URI (Унифицированный идентификатор ресурса):	https://elib.utmn.ru/jspui/handle/ru-tsu/15145
ISSN:	2500-0896 2411-197Х
Источник:	Вестник Тюменского государственного университета. Серия: Гуманитарные исследования. Humanitates. – 2017. – Т. 3, № 1
Располагается в коллекциях:	Вестник ТюмГУ: Гуманитарные исследования. Humanitates

Файлы этого ресурса:

Файл	Описание	Размер	Формат
072_089.pdf		1,44 MB	Adobe PDF	Просмотреть/Открыть

Показать полное описание ресурса

Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.