Please use this identifier to cite or link to this item: https://elib.utmn.ru/jspui/handle/ru-tsu/14547
Full metadata record
DC FieldValueLanguage
dc.contributor.authorBrunova, E. G.en
dc.contributor.authorBidulya, Yu. V.en
dc.contributor.authorБрунова, Е. Г.ru
dc.contributor.authorБидуля, Ю. В.ru
dc.date.accessioned2018-12-12T09:13:02Z-
dc.date.available2018-12-12T09:13:02Z-
dc.date.issued2014
dc.identifier.citationБрунова, Е. Г. Алгоритм с элементами формальной грамматики для контент-анализа мнений / Е. Г. Брунова, Ю. В. Бидуля // Вестник Тюменского государственного университета. Серия: Физико-математические науки. Информатика / главный редактор Г. Ф. Шафранов-Куцев. – Тюмень : Издательство Тюменского государственного университета, 2014. – № 7. – С. 242-250.ru
dc.identifier.issn1562-2983
dc.identifier.issn1994-8484
dc.identifier.urihttps://elib.utmn.ru/jspui/handle/ru-tsu/14547-
dc.identifier.urihttps://elib.utmn.ru/jspui/handle/ru-tsu/14547
dc.description.abstractThis study carried out within computational linguistics presents the analysis of the subjective information from user-generated content. The sentiment lexicon (583 items) which is domain-specific (banking) and language-specific (Russian) is built. The sentiment lexicon includes the following classes: positive vocabulary, negative vocabulary, polarity modifiers, anti-modifiers, and increments. The REGEX algorithm with formal grammar elements is proposed. 11 formal grammar rules and the corresponding syntactic models are introduced; they are similar to regular expressions which detect certain text elements, simplify each sentence, and present the text as a formal model. The SENTIMENTO system for evaluating bank service quality is implemented as an Internet application with an interface for the model testing and its adjustment. The efficiency of the proposed algorithm is evaluated in comparison with the efficiency of the Nave Bayes Classifier, F1 measure is used as the criterion. The system is tested on the reviews published in the clients’ bank rating (www.banki.ru) and the advantage of the proposed algorithm is demonstrated. For the same set of reviews, the F1 value is 0.920 when the proposed method is applied, while it is 0.872 for the Nave Bayes Classifier.en
dc.description.abstractИсследование, выполненное в области математической лингвистики, посвящено анализу субъективной информации, содержащейся в пользовательском контенте. Cоставлен оценочный лексикон (583 единицы), специализированный по предметной области (банковское дело) и языку (русский). В оценочный лексикон включены следующие классы слов: положительная лексика, отрицательная лексика, модификаторы, антимодификаторы и инкременты полярности. Представлен алгоритм REGEX с элементами формальной грамматики для контентанализа мнений. Введены 11 правил формальной грамматики и соответствующие синтаксические модели, которые являются своего рода регулярными выражениями, позволяющими обнаружить определенные элементы текста, упростить каждое предложение и представить текст в целом как формальную модель. На основе предлагаемого алгоритма разработана система SENTIMENTO для оценки качества банковского обслуживания, реализованная в виде интернет-приложения c интерфейсом для апробации модели и ее корректировки. Эффективность предлагаемого алгоритма сопоставлена с эффективностью наивного Байесовского классификатора, в качестве критерия применена мера Ван Ризбергена. Апробация системы на материалах отзывов, опубликованных в народном рейтинге банков на сайте www.banki.ru, показала преимущество разработанного алгоритма. Для одного и того же набора отзывов при использовании предложенного в работе метода величина показателя F1 составила 0.920, в то время как для наивного Байесовского классификатора величина F1 оказалась равна 0.872.ru
dc.format.mimetypeapplication/pdfen
dc.language.isoruen
dc.publisherИздательство Тюменского государственного университетаru
dc.relation.ispartofВестник Тюменского государственного университета. Серия: Физико-математические науки. Информатика. – 2014. – № 7ru
dc.subjectnatural language processingen
dc.subjectuser-generated contenten
dc.subjectNaive Bayes Classifieren
dc.subjectformal grammaren
dc.subjectsentiment analysisen
dc.subjectalgorithmen
dc.subjectконтентанализ мненийru
dc.subjectалгоритмru
dc.subjectобработка естественного языкаru
dc.subjectпользовательский контентru
dc.subjectнаивный Байесовский классификаторru
dc.subjectформальная грамматикаru
dc.titleАлгоритм с элементами формальной грамматики для контент-анализа мненийru
dc.title.alternativeAlgorithm with formal grammar elements for sentiment analysisen
dc.typeArticleen
dc.typeinfo:eu-repo/semantics/publishedVersionen
dc.typeinfo:eu-repo/semantics/articleen
local.description.firstpage242
local.description.lastpage250
local.issue7
local.identifier.uuid6c265b24-d2a4-47f8-8e5f-c1388d418d4d-
local.identifier.handleru-tsu/14547-
Appears in Collections:Вестник ТюмГУ: Физико-математическое моделирование. Нефть, газ, энергетика

Files in This Item:
File Description SizeFormat 
14_Е.Г. Брунова, Ю.В. Бидуля.pdf585.51 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.