Подход к моделированию задачи автоматической классификации текстов (на примере их отнесения к определенной возрастной аудитории)

Glazkova, A. V.; Zakharova, I. G.; Глазкова, А. В.; Захарова, И. Г.

Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: https://elib.utmn.ru/jspui/handle/ru-tsu/14542

Название:	Подход к моделированию задачи автоматической классификации текстов (на примере их отнесения к определенной возрастной аудитории)
Другие названия:	Approach to modeling of automatic text classification problem (case study of the audience age prediction)
Авторы:	Glazkova, A. V. Zakharova, I. G. Глазкова, А. В. Захарова, И. Г.
Ключевые слова:	mathematical modeling document classification information extraction классификация документов математическое моделирование извлечение информации
Дата публикации:	2014
Издатель:	Издательство Тюменского государственного университета
Библиографическое описание:	Глазкова, А. В. Подход к моделированию задачи автоматической классификации тестов (на примере их отнесения к определенной возрастной аудитории) / А. В. Глазкова, И. Г. Захарова // Вестник Тюменского государственного университета. Серия: Физико-математические науки. Информатика / главный редактор Г. Ф. Шафранов-Куцев. – Тюмень : Издательство Тюменского государственного университета, 2014. – № 7. – С. 205-211.
Аннотация (реферат):	The article considers the problem of automatic text classification as a case study of the audience age prediction from the text. The paper describes some possible ways to formalize the problem and discusses their advantages and disadvantages. It is proposed an approach to mathematical modeling of the domain, which implies the representation of a category as a set of classification features and their critical values and a text as a set of text features and their values. In such a case, the classification by a feature can be represented as a mapping of the set of texts in the set of permissible values for this feature. In the final part of the paper the possibility of using neural network technology as a tool for computer implementation of classification algorithms is proved and a brief review of the literature on the application of neural networks for automatic text classification is provided. The approach suggested by the authors is implemented using neural network technology in the form of a prototype software system. В статье рассматривается задача автоматической классификации текстов на примере их отнесения к определенной возрастной аудитории. В работе приводятся несколько возможных путей формализации данной задачи, обсуждаются их преимущества и недостатки. Предлагается подход к математическому моделированию предметной области, подразумевающий представление категории как множества классификационных признаков и их критических значений, а текста соответственно – как множества признаков и значений признаков. В таком случае классификация множества текстов по некоторому признаку может быть представлена как отображение множества текстов во множество допустимых значений этого признака. В заключительной части работы обосновывается возможность использования нейросетевых технологий в качестве средства компьютерной реализации алгоритмов классификации и приводится краткий обзор работ, посвященных вопросам применения нейронных сетей для автоматической классификации текстов. Подход, предложенный авторами, реализован с использованием нейросетевых технологий в виде прототипа программного комплекса.
URI (Унифицированный идентификатор ресурса):	https://elib.utmn.ru/jspui/handle/ru-tsu/14542
ISSN:	1562-2983 1994-8484
Источник:	Вестник Тюменского государственного университета. Серия: Физико-математические науки. Информатика. – 2014. – № 7
Располагается в коллекциях:	Вестник ТюмГУ: Физико-математическое моделирование. Нефть, газ, энергетика

Файлы этого ресурса:

Файл	Описание	Размер	Формат
9_А.В. Глазкова, И.Г. Захарова.pdf		474,95 kB	Adobe PDF	Просмотреть/Открыть

Показать полное описание ресурса

Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.