Please use this identifier to cite or link to this item:
https://elib.utmn.ru/jspui/handle/ru-tsu/14514
Title: | Алгоритм кластеризации потока данных с изменяющимися параметрами распределения |
Other Titles: | Clustering algorithm for data streams with changing distribution parameters |
Authors: | Nissenbaum, O. V. Ниссенбаум, О. В. |
Keywords: | normal distribution real-time system dynamic data data streams clustering algorithm алгоритм кластеризации системы реального времени нормальное распределение динамические данные поток данных |
Issue Date: | 2013 |
Publisher: | Издательство Тюменского государственного университета |
Citation: | Ниссенбаум, О. В. Алгоритм кластеризации потока данных с изменяющимися параметрами распределения / О. В. Ниссенбаум // Вестник Тюменского государственного университета. Серия: Физико-математические науки. Информатика / главный редактор Г. Ф. Шафранов-Куцев. – Тюмень : Издательство Тюменского государственного университета, 2013. – № 7. – С. 180-186. |
Abstract: | The article contains a clustering algorithm for time-weighted data streams based on the dynamic EM-algorithm. This algorithm can be used for clustering data with the normal distribution in, the parameters of the distribution undergoing changes over time, which is the case in real dymaniv systems such as computer systems or communication nets. The author offers the results of the computational experiment (based on the imitation model with the normal density of cluster distribution), which prove better quality of the proposed algorithm as to the percent of the erroneously recognized points and precision in cluster parameters description in contrast with the algorithm which does not use the time-weighed factors. На основании динамического ЕМ-алгоритма построен алгоритм кластеризации для потока данных, взвешенных по времени поступления. Алгоритм предназначен для кластеризации данных с нормальным распределением в Rn, параметры которого изменяются во времени, что соответствует ситуации в реальных динамических системах, таких как компьютерные системы, сети связи и т.п. Хранения обработанных данных не требуется, алгоритм эффективно вычислим, может применяться в системах реального времени. Приведены данные вычислительного эксперимента (на имитационной модели потока c нормальной плотностью распределения кластеров), показавшие более высокое качество работы по сравнению с алгоритмом, в котором не используются весовые коэффициенты от времени, с точки зрения доли неверно распознанных точек и точности определения параметров рассчитываемых кластеров. |
URI: | https://elib.utmn.ru/jspui/handle/ru-tsu/14514 |
ISSN: | 1562-2983 1994-8484 |
Source: | Вестник Тюменского государственного университета. Серия: Физико-математические науки. Информатика. – 2013. – № 7 |
Appears in Collections: | Вестник ТюмГУ: Физико-математическое моделирование. Нефть, газ, энергетика
|
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.