Please use this identifier to cite or link to this item: https://elib.utmn.ru/jspui/handle/ru-tsu/35455
Title: Clustering algorithm for data streams with changing distribution parameters
Other Titles: Алгоритм кластеризации потока данных с изменяющимися параметрами распределения
Authors: Nissenbaum, O. V.
Ниссенбаум, О. В.
Keywords: normal distribution
real-time system
dynamic data
data streams
clustering algorithm
алгоритм кластеризации
системы реального времени
нормальное распределение
динамические данные
поток данных
Issue Date: 2013
Publisher: Tyumen State University
Citation: Nissenbaum, O. V. Clustering algorithm for data streams with changing distribution parameters / O. V. Nissenbaum // Tyumen State University Herald. — 2013. — № 7 : Physics and Mathematics. — P. 160–165.
Abstract: The article contains a clustering algorithm for time-weighted data streams based on the dynamic EM-algorithm. This algorithm can be used for clustering data with the normal distribution in, the parameters of the distribution undergoing changes over time, which is the case in real dymaniv systems such as computer systems or communication nets. The author offers the results of the computational experiment (based on the imitation model with the normal density of cluster distribution), which prove better quality of the proposed algorithm as to the percent of the erroneously recognized points and precision in cluster parameters description in contrast with the algorithm which does not use the time-weighed factors.
На основании динамического ЕМ-алгоритма построен алгоритм кластеризации для потока данных, взвешенных по времени поступления. Алгоритм предназначен для кластеризации данных с нормальным распределением в Rn, параметры которого изменяются во времени, что соответствует ситуации в реальных динамических системах, таких как компьютерные системы, сети связи и т.п. Хранения обработанных данных не требуется, алгоритм эффективно вычислим, может применяться в системах реального времени. Приведены данные вычислительного эксперимента (на имитационной модели потока c нормальной плотностью распределения кластеров), показавшие более высокое качество работы по сравнению с алгоритмом, в котором не используются весовые коэффициенты от времени, с точки зрения доли неверно распознанных точек и точности определения параметров рассчитываемых кластеров.
URI: https://elib.utmn.ru/jspui/handle/ru-tsu/35455
ISSN: 2307-6445
Source: Tyumen State University Herald. — 2013. — № 7 : Physics and Mathematics
Appears in Collections:Tyumen State University Herald

Files in This Item:
File SizeFormat 
TSUHerald_2013_7_160_165.pdf1.8 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.